Опубликовано в журнале Урал, номер 8, 2016
Человек говорит (или, например, пишет «ученому соседу»): «Я видел это своими глазами». И как бы подразумевает, что раз уж он нечто видел своими глазами, значит, так и было на самом деле.
Но разница между тем, что «человек видит своими глазами», то есть воспринимает, осознает и может анализировать, и той картинкой, которая в виде потока электромагнитного излучения попадает в глаза, — очень велика. Фактически эта картинка разбивается на элементы, а потом мозг ее заново собирает. И собирает с ошибками, допусками и поправками.
То, что видит и осознает человек, определяется не только излучением, попадающим в глаза (входными данными), но еще и заложенными в мозг алгоритмами обработки изображений. Эти алгоритмы достаточно сложны и непостоянны: человек живет, получает новый опыт, забывает старый — и алгоритмы обработки картинки меняются. Но замена алгоритма, его перестройка — это медленный процесс. Нельзя мгновенно взять и перезаписать «программу» в мозг, провести upgrate или что-то подобное. Мозг — это, конечно, своего рода «компьютер», но это компьютер аналоговый, то есть, чтобы «записать» новый алгоритм, мозг нужно физически перестроить, или, точнее, — он сам, анализируя накопленную информацию, должен решить, что ему надо перестраиваться. И мнением человека в таких делах мозг интересуется далеко не всегда.
До сих пор, несмотря на серьезные успехи, ученые продолжают открывать все новые и новые возможности мозга, которые обеспечивают человеку более-менее адекватную реальности визуальную картинку. Причем не «точную», не «достоверную», а вероятную. Вообще, всё, что мы получаем от мира и способны распознать, имеет именно вероятностную природу. И ошибки неизбежны.
Если человек видел нечто своими глазами, это еще не повод утверждать, что так и было на самом деле, это повод предположить, что примерно так могло быть.
О некоторых моментах работы мозга, связанных с преобразованием визуальной информации, я в этой статье и поговорю.
У человека обычно два глаза, то есть два приемника электромагнитных волн, зафиксированных на голове. С некоторой натяжкой можно сказать, что это две такие видеокамеры. И надо сказать, камеры эти весьма несовершенны.
Во-первых, они работают в довольно узком (оптическом) диапазоне, во-вторых, информация, которую они получают, довольно-таки ненадежная.
Ну, с тем, что мы не видим ультрафиолетовое и инфракрасное излучение (а вот у некоторых видов змей, например гадюк и удавов, есть термолокаторы, которые позволяют им расширить диапазон восприятия), ничего не поделаешь. Но и в оптическом диапазоне все выглядит, мягко говоря, не блестяще.
Свет через «объектив» (зрачок и хрусталик) падает на «полупроводниковую матрицу» (сетчатку). Количество светочувствительных клеток довольно велико — около 120 миллионов палочек и 7 миллионов колбочек (способных воспринимать цвет). Но если мы сравним глаз с профессиональной фотокамерой — это сравнение будет не в пользу глаза. Дело в том, что разрешение картинки, которую видит глаз, четкое только в центре зрительного поля, по краям резкость значительно падает — фактически периферическое зрение способно различать только крупные объекты, отличать белое от черного, и все, пожалуй.
«Большинство современных цифровых камер имеют 5–20 мегапикселей, что зачастую преподносится как полный провал по сравнению с нашим собственным зрением. Это основано на том факте, что при идеальном зрении человеческий глаз по разрешающей способности эквивалентен 52-мегапиксельной камере (принимая за угол зрения 60°). Однако эти подсчеты вводят в заблуждение. Лишь наше центральное зрение может быть идеальным, так что в действительности мы никогда не достигаем такой детальности за один взгляд. По мере удаления от центра наши зрительные способности драматически падают — настолько, что всего на 20° от центра наши глаза различают уже всего одну десятую от исходной детальности. На периферии мы обнаруживаем только крупномасштабный контраст и минимум цветов. Принимая это во внимание, можно утверждать, что один взгляд наших глаз способен различать детали, всего лишь сравнимые с 5–15 мегапикселями камеры (в зависимости от индивидуального зрения)»1.
Ну и стоит заметить, что нет никаких причин, чтобы камеры не стали в ближайшем будущем, например, 100-мегапиксельными, а наш глаз вряд ли сильно изменится. Никаких шансов в этом соревновании у глаза нет.
Кроме того, нужно иметь в виду следующие моменты:
картинка, получаемая глазом, приходит перевернутой (точно так же, как и в любой фотокамере);
на сетчатке находится «слепое пятно», оно не содержит фоточувствительных клеток, и во входном изображении образуется разрыв.
картинка, которая попадает на сетчатку, двухмерная, хотя и не плоская;
изображений не одно, а два, а воспринимает человек именно одну картинку, но эта картинка уже трехмерная, у нее есть не только верх-низ или право-лево, но и глубина;
человек практически никогда не воспринимает неподвижные объекты, даже если сам объект, например страница книги, неподвижен, то глаза (объектив) неподвижными быть не могут, голова чуть покачивается, глаза моргают и т.д., а ведь при движении картинка смазывается, так что ее еще нужно постоянно немного поправлять.
Получив такие, прямо скажем, не самые лучшие входные данные, к работе приступает мозг. То есть на самом деле видим мы не столько глазами, сколько головой (здравствуй, капитан очевидность).
Что нужно сделать с полученной визуальной информацией:
картинку нужно перевернуть, чтобы небо было вверху, а земля внизу;
необходимо восстановить изображение в «слепом пятне», чтобы у нас не было разрыва в самом центре изображения;
необходимо «сложить» одно трехмерное изображение из двух двумерных;
необходимо «стабилизировать камеру», чтобы движущиеся объекты были четкими.
И это еще далеко не все, что мозг должен проделать, причем проделать очень быстро — буквально в режиме реального времени.
И все это ему удается. Пусть не всегда идеально, но удается.
Мне бы хотелось начать с самого простого: с ответа на вопрос: как мозг переворачивает картинку? Но я не нашел точного ответа. Возможно, все совсем просто: при считывании информации с сетчатки и в процессе передачи картинки в первичную зрительную кору сначала по зрительному нерву, потом по зрительному тракту — просто происходит переворачивание, так сказать, физически: источник с верхней части сетчатки передается в приёмник зрительной системы, ответственный за обработку нижней части картинки, и наоборот. То есть буквально переключаются «провода». Ведь при передаче зрительной информации через зрительный перекресток (хиазм) происходит обмен информации между картинками, полученными двумя глазами, так, что изображение правого зрительного поля от обоих глаз уходит в левое полушарие, а изображение левого зрительного поля опять-таки от обоих глаз — в правое. Это более сложная операция, чем переключение верх—низ, а этот «переключатель» встроен прямо в анатомию мозга.
Вот если бы мы точно знали, что младенец видит мир перевернутым, мы могли бы попробовать найти тот момент формирования зрительной системы, когда мозг уже способен переворачивать картинку, когда начинает работать алгоритм переворота. Но мы не знаем, видит ли младенец мир перевернутым. Мы знаем только, что в первые месяцы жизни сетчатка еще не до конца сформирована и зрение совсем слабое. До трех месяцев «острота зрения у детей слабая… новорожденный видит только крупные и близкие предметы — маму и ее грудь»2. При таком слабом зрении нет никакой возможности (и необходимости) разбираться, где верх, а где низ. А когда младенец начинает играть в игрушки и реагировать на мир — с картинкой у него уже все нормально.
Со «слепым пятном» ситуация исследована лучше. Когда речь заходит о том, почему мы обычно не видим разрыва в изображении, отвечают просто: слепое пятно правого глаза не совпадает со слепым пятном левого — это разные фрагменты картинки. И изображение, полученное правым глазом, компенсирует недостаток левого, и наоборот. И это вполне разумно.
Вот как можно найти свое слепое
пятно и даже измерить его размер. «Для определения границ “слепого” пятна
правого глаза необходимо взять в левую руку школьную линейку длиной 25–30 см,
установить ее на уровне глаз на расстоянии
Всё, в общем, ясно. Остается
только один вопрос: хорошо, кончик пальца исчезает, а линейка, по которой
двигается палец, линейка остается? Но разве этот отрезок линейки от 18 до
Эксперимент, описанный выше, все-таки достаточно сложный. Отыскать свое слепое пятно можно и по-другому. Например, в Википедии, в статье «Слепое пятно», есть пример картинки, состоящей из двух объектов — крест и крест внутри круга. Если закрыть правый глаз и сосредоточить внимание левого глаза на кресте внутри круга, и при этом контролировать крест без круга периферическим зрением и начать приближать голову к дисплею — в какой-то момент крест без круга пропадает. Остается белый фон. (А если поставить аналогичный эксперимент на странице английской Wikipedia4 — фон будет серый). Но ведь если мы «видим» слепое пятно, оно обязано быть черным, это ведь буквально отсутствие любой визуальной информации. Но фон-то сохраняет свой цвет, и в этом легко убедиться.
Все эксперименты с определением слепого пятна связаны с движением: или двигается голова (глаз), или изображение. Изображение в какой-то момент исчезает, но при этом фон на месте слепого пятна остается видимым. Как это возможно?
Несмотря на то, что слепое пятно было открыто еще в 1668 году Эдмом Мариоттом, внятное объяснение тому факту, почему мы продолжаем видеть фрагмент фона, который должен исчезнуть, если мы смотрим на него одним глазом, было получено совсем недавно.
Даниэл Дилкс с коллегами из Массачусетского технологического института поставил любопытный эксперимент5. У 48 добровольцев было определено положение слепого пятна. А затем рядом со слепым пятном была расположена квадратная картинка. В течение нескольких секунд все испытуемые заметили неожиданный эффект: квадратная картинка вдруг стала растягиваться и превратилась в прямоугольник, накрывший слепое пятно. То есть мозг пересчитал картинку и заполнил разрыв с минимальными искажениями, заполнил тем изображением, которое было самым близким.
Поскольку мы обнаруживаем слепое пятно «боковым», то есть периферическим зрением, которое и без того не слишком острое, достаточно «замазать» картинку фоном, и разрыва не будет. И мозг это делает. И нас не спрашивает, хотим ли мы этого.
То, что мы можем найти свое слепое пятно только с определенными усилиями, означает, что мозг его научился очень хорошо от нас маскировать. И это не всегда полезно. Размер слепого пятна у разных людей несколько отличается. Размер разный даже у одного и того же человека: если глаз устает при длительной нагрузке (например, при чтении книги или от пятичасового сидения в «Фейсбуке»), слепое пятно несколько увеличивается — на 1–3 градуса. Поскольку при этом снижается объем входных данных, изображение несколько размывается. И человек устает еще больше, поскольку работа с нечеткой картинкой дает большую нагрузку на мозг. Но, даже уставая, мы не «видим» слепое пятно. При некоторых заболеваниях слепое пятно увеличивается драматически, и все равно больной его не может заметить — просто у него падает резкость зрения, а это может произойти по многим причинам. Мозг «прячет» слепое пятно до последней возможности и этим в некоторых случаях затрудняет диагностику заболевания.
Наше зрение является бинокулярным, то есть мы видим двумя глазами сразу. Это очень полезное качество. Благодаря ему мы можем определять глубину картинки и скорость движущихся объектов.
Расстояние до объекта мозг вычисляет, используя эффект параллакса. Мы видим объект двумя глазами, и каждый глаз видит объект под своим углом. Мозг замеряет углы, и поскольку он знает расстояние между глазами и уравнение параллакса — он быстро вычисляет расстояние.
Зная расстояние между точками наблюдения L (база параллакса — или расстояние между глазами) и угол смещения α (то есть угол треугольника при вершине, которая и есть наблюдаемый объект, а две другие вершины — глаза), D — расстояние до объекта можно определить так: D = L/2sin(α/2). И мозг с решением этого уравнения очень быстро справляется.
Но мозг может вычислить расстояние до объекта, даже если глаз один: мозг это делает, сравнивая угловую скорость объектов, например, при повороте головы — близкие объекты поворачиваются медленнее, а удаленные — быстрее, и по разнице угловых скоростей мозг может рассчитать, какой объект дальше, а какой ближе.
Чтобы вычислить скорость движения объекта, нужно:
1) вычислить D(t1) — расстояние до объекта в момент времени t1;
2) вычислить D(t2) — расстояние до объекта в момент времени t2;
3) поделить (D(t1) – D(t2)) на время (t2 – t1).
Вычисление расстояния крайне чувствительно к точности, с которой определена база параллакса — L, то есть расстояние между глазами. Если мозг ошибается при определении L, — ошибка может быть критической.
Пока ребенок растет, эта важнейшая для оценки расстояния величина постоянно меняется, потому что растет сама голова. И мозг делает ошибки. Серьезные изменения размера головы и, соответственно, базы параллакса в основном прекращаются в 12–13 лет. И хотя голова продолжает расти, она растет уже медленно, и изменение базы не слишком искажает картинку, создаваемую теми областями мозга, которые отвечают за восприятие зрительной информации.
Поэтому: переходя улицу, держите ребенка за руку. Его мозг может критически ошибаться при оценке расстояния до объекта и, соответственно, в вычислении скорости движущегося транспорта. Мозг ребенка еще не отладил необходимые алгоритмы расчета.
Сложение двухмерных картинок в трехмерное изображение и вычисление расстояний происходит в первичной зрительной коре (зона V1). Ну, там вообще много всего происходит6. Кроме V1 за восприятие визуальной информации отвечают и другие зоны мозга — зоны зрительной коры. В частности, зона V5 или MT (средняя височная зрительная область), которая отвечает за восприятие движения.
Многие исследователи полагают, что как раз МТ отвечает за стабилизацию «видеокамеры»: эта зона мозга управляет движением глаз таким образом, чтобы объект внимания стабильно оставался в фокусе. Эта тонкая подстройка не контролируется нашим сознанием, МТ сама вычисляет необходимую ориентацию глаз и корректирует их направление. И мы получаем четкую картинку.
Но самое, наверное, любопытное, чем занимается МТ, — она нас «обманывает», но так, что ее «обман» оказывается не просто дороже «тьмы низких истин», этот «обман» в некоторых случаях буквально жизненно важен.
В профессиональном теннисе при
подаче скорость мяча может превышать
Геррит Мос с коллегами из университета Беркли серьезно занялись этой проблемой. И их внимание привлекла именно зона МТ7.
Мос так объяснил эту парадоксальную ситуацию: «Мозг как бы толкает движущийся объект вдоль траектории туда, где глаз еще не может этот объект увидеть»8. То есть человек «видит» мяч, но не «своими глазами», а своим мозгом.
Нейробиологи поставили следующий эксперимент. Шести волонтерам показывали видеоролики, на которых быстро или медленно двигался фон, а объекты на движущемся фоне то возникали, то исчезали. Например, вращается круг, в верхней и нижней точках вертикального диаметра возникают небольшие кружки. Мозг по умолчанию делит любое изображение на фон и объект и считает, что фон — неподвижен, а вот объект может двигаться. Если движется именно фон, а объекты не меняют своего положения, — мозг начинает предсказывать положение объекта9. Если круг-фон вращается медленно, то кружки появляются точно в верхней и нижней точках. Но если круг-фон вращается быстро, то отчетливо видно, что кружки появляются не в верхней и нижней точках, а со сдвигом в направлении вращения. Мозг их не видит, он прогнозирует их появление. Точно так же, как при приеме теннисной подачи: мозг дает команду, когда картинка от глаз еще не получена. Этот прогноз может быть ошибочным, и это случается, если, например, подача выполнена с сильным вращением. Мозг не всегда может вычислить траекторию верно.
Используя метод функционального магнитного резонанса (fMRT), нейробиологи локализовали зону, которая активизируется при такой предсказательной работе мозга. Ожидаемо, это оказалась МТ. Чтобы убедиться в том, что именно эта зона отвечает за обработку движения, был использован метод транскранциальной магнитной стимуляции (transcranial magnetic stimulation) — неинвазивное воздействие на мозг сильным магнитным полем. Магнитное поле «сбило настройки» зоны МТ, и сдвиг небольших кружков при быстром вращении фона перестал появляться. То есть именно МТ предсказывает будущее.
Способность мозга предсказывать быстро протекающие события могла оказаться крайне важной для выживания человека: в драке или на охоте медленная обработка картинки может оказаться жизненно опасной. Но мозг умеет компенсировать физически медленный процесс быстрым вычислением.
Мос так прокомментировал результаты эксперимента: «Понимание того, как мозг обрабатывает визуальную информацию, в данном случае — изображение движущегося объекта, крайне важно. Ясное понимание этих процессов поможет при лечении нарушений в работе мозга, ведь люди, у которых вот такие «предсказательные» функции мозга нарушены, сталкиваются с проблемами просто в быту — они не всегда могут налить кофе в чашку». И добавил специально для тех, кто слишком доверяет своим глазам: «Изображение, которое получает глаз и затем обрабатывает мозг, не синхронизировано с реальным миром, но наш мозг достаточно мудр, чтобы компенсировать это несовпадение. То, что мы воспринимаем, не обязательно имеет так уж много общего с окружающей действительностью, но мы, в конечном счете, воспринимаем именно то, что нам необходимо для того, чтобы взаимодействовать с реальным миром».
1 Камера и человеческий глаз. На сайте: Cambridge in Colour.
A Learning Community For Photographers.
http://www.cambridgeincolour.com/ru/tutorials-ru/cameras-vs-human-eye.htm.
2 Мякшина Т. Особенности развития зрения у детей. Портал «Вита». http://vitaportal.ru/semya-i-deti/detskoe-zdorove/osobennosti-razvitiya-zreniya-u-detej.html.
3 Apнayтoв A.Г. Как определить границы слепого пятна. Сайт «Эффективная медицина». http://www.glazmed.ru/lib/public09/what010.shtml.
5 «Referred Visual Sensations»: Rapid Perceptual
Elongation after Visual Cortical Deprivation Daniel D. Dilks1, Chris I. Baker2,
Yicong Liu1, and Nancy Kanwisher1. The Journal of
Neuroscience, 15 July 2009, 29(28): 8960-8964. Популярное изложение эксперимента можно найти здесь: Blindspot shows brain rewiring in an instant. By Andy Coghlan. New Scientist 14 July 2009.
https://www.newscientist.com/article/dn17464-blindspot-shows-brain-rewiring-in-an-instant.
6 О некоторых моментах работы зоны V1 и
всей зрительной системы при распознавании букв и слов при чтении см.: Владимир Губайловский. Письма к ученому соседу. Письмо 11. О грамотности. «Урал», 2016, № 2.
7 Motion-Dependent Representation of Space in Area MT+. Gerrit W. Maus, Jason Fischer, David Whitney. Neuron 78, 554–562, May 8, 2013. Полный текст работы находится в открытом доступе: http://www.cell.com/neuron/fulltext/S0896-6273(13)00257-2.
8 Hit a
9 Видеоролики выложены на Youtube, и можно увидеть, как работает предсказательная функция мозга. Вращающийся круг: https://youtu.be/xA_0Dr3r-Q4. Бегущие полосы: https://youtu.be/JduYDsg6dLE.