Глава 9. В лабораториях дизайнера антрополога, патологоанатома
Опознается образ
Способность живых существ распознавать под разнородностью внешних проявлений единую сущность получила название "опознавание образов". Удивительно зрительное опознавание, даже при некотором изменении внешнего вида, в частности, формы окружающих предметов. Трудно даже представить себе широту диапазона задач, связанных с изменениями формы, которые человек вынужден решать чаще всего бессознательно, буквально на каждом шагу. Мы мгновенно и без затруднений узнаем знакомое лицо, хотя его мимика и выражение (не говоря уже о ракурсе, "степени небритости" и пр.) могут отличаться от привычных. Мы узнаем знакомое место, хотя в принципе не можем дважды увидеть его точно из одной и той же точки, и следовательно, проекции составляющих его. предметов (домов, деревьев и т. д), на сетчатке глаза имеют всякий раз иную форму.
В самых разнообразных областях человеческой деятельности разработка форм предметов и их варьирование являются конечной или промежуточной целью работы. Специалисты авиационной медицины, разрабатывающие и совершенствующие систему приборной индикации, дизайнер, ищущий наиболее удобный и эстетичный вид предметов, биолог-антрополог, реконструирующий по черепу поверхность лица, художник, пишущий этюд за этюдом в поисках наилучших поз и мимики персонажей будущей картины, скульптор, работающий над портретом и пытающийся придать ему характерное выражение лица,- все эти специалисты так или иначе осуществляют сознательное и целенаправленное варьирование форм объектов их труда.
Если не ограничиваться изменчивостью форм, то можно подметить более общий факт: к изучению или использованию изменчивости так или иначе сводится едва ли не любая область человеческой деятельности.
Действительно, работа врача при постановке диагноза также связана с выяснением изменчивости [20], [13]. В данном случае речь идет об изменчивости симптомов заболевания, создаваемой индивидуальными особенностями больного. Если врачу удается правильно оценить изменения симптомов, вносимые этими особенностями, правильным оказывается и диагноз. Математическое моделирование этой деятельности лежит в сфере опознавания образов, однако ситуация в данном случае обладает важной спецификой: для целого ряда заболеваний индивидуальные особенности больных настолько преобладают над типичными проявлениями болезни, что не может быть и речи о накоплении какой-то выразительной статистики, и поэтому надежды на решение задачи часто связывают с совершенно неисследованной областью моделирования интуиции врача.
Изменчивость индивидуальных свойств внутри популяции животных и растений является тем источником, из которого селекционеры с помощью искусственного отбора (как и природа с помощью естественного) черпают возможности для совершенствования пород и сортов. В общественных отношениях также возникает проблема отбора. Так, в задаче подбора кандидата на данную должность изменчивость индивидуальных свойств претендентов позволяет поставить вопрос об оптимизации выбора по ряду критериев. Этот вопрос (разумеется, в сложных случаях) решается на основе теории аддитивных полезностей; возможны и другие модели.
Приведенные примеры позволяют предположить, что преодоление, использование или изучение изменчивости пронизывают буквально все области деятельности человека. С этой точки зрения изменчивость представляется одним из самых общих явлений и как таковая заслуживает стать самостоятельным объектом изучения.
Опыт исследования изменчивости в ряде конкретных областей опознавания образов показывает, что, несмотря на отмеченную многоликость, абстрактное описание, отвлеченное от специфических атрибутов породившей ее прикладной задачи, укладывается в какой-либо из известных математических аппаратов или в некоторую комбинацию из таких аппаратов.
Это наводит на мысль о правомерности попытки создания общей теории изменчивости, которая содержала бы классификацию известных ее видов, методы описания, взаимосвязи различных видов изменчивости, а также предсказала бы возможные направления поиска и описания новых ее видов. Такая теория позволила бы найти решение многих задач, направленных на подавление изменчивости, как это требуется при опознавании образов, и многих задач, в которых, напротив, требуется генерирование последовательностей меняющихся объектов, как например, при промышленном или эстетическом конструировании. Разработка такой теории в настоящее время только начинается. (Подробно об этом рассказано в [13].)
Во многих биологических исследованиях в технике, в исследованиях метеорологических явлений возникает необходимость в построении тех или иных физических полей и прослеживании их динамики. Таковы, например, задачи, связанные с изучением распределений температуры или напряжения по поверхности тела и их динамики, распределений атмосферного давления и температуры по территории того или иного района земной поверхности и т. д. Общий способ рассмотрения таких скалярных полей состоит в отображении поверхности на координатную плоскость. Поскольку полностью изобразить такую функцию графически невозможно, прибегают к представлению ее семействами изолиний или привлекают художника для изготовления рисунков в перспективе подобно тому, как это часто делается для представления двумерных распределений плотностей вероятности.
Вместе с тем возможность наглядного восприятия вида таких полей очень важна. Человеческий глаз обнаруживает великолепную способность выявлять закономерности разных масштабов - от глобальных (игнорируя детальную структуру поля) до самых частных, относящихся к мелкой структуре функции на любой малой площадке в области ее определения.
Известным примером этого является немедленное (хотя у неподготовленных людей и бессознательное) схватывание формантной структуры речевого потока при ознакомлении с "видимой речью". Примером получения на такой основе важного научного результата может служить обнаружение тенденции к образованию спиралевидных скоплений или моделировании на ЭВМ межзвездных взаимодействий больших количеств звезд. Явление было обнаружено благодаря выводу получающихся расчетных картин на дисплей: наличие столь тонкого эффекта в распределении расстояний в россыпи точек-звезд практически невозможно было бы выявить расчетным путем, но с этой задачей без труда справился глаз человека. Многостадийная съемка позволила наблюдать процесс развития или угасания спиралевидной туманности в динамике. Таким образом, в основе этого результата лежат две важные предпосылки - визуализация расчетных картин и изменение временного масштаба развития явления в заданное число раз.
Голографический метод позволяет воссоздать обе эти предпосылки. С точки зрения голографической ЭВМ совершенно безразлично, представляет ли введенная в ее память функция поверхность кузова автомобиля или описание некоторого скалярного поля над плоскостью. С помощью разработанных алгоритмов машина может осуществить требуемые деформации этого поля и каждую стадию деформаций визуализировать на основе описанной выше модели освещения. Представленная таким способом функция имеет вид холмистой равнины, освещенной одним или несколькими "солнцами" и рассеянным светом. Этот рельеф можно рассматривать с разных сторон и под разными углами, а также в объемном виде. Для наблюдения динамики изменений поля многостадийную съемку следует использовать как непрерывно демонстрируемый фильм, причем с помощью описанного ранее приема временной масштаб этих изменений можно сделать отличающимся от натурального в любое число раз, руководствуясь лишь удобством наблюдения.
Примером задачи обсуждаемого типа является медицинская задача описания динамики деформаций электрокардиограмм с их визуализацией. Сравнение такой динамики для здорового и больного сердца имеет существенное диагностическое значение. Это позволяет интерполировать промежуточные, реально не наблюдавшиеся стадии процесса и, что особенно важно, экстраполировать его будущие, еще не возникшие стадии. Этот эффект может быть использован для автоматического прогноза развития процесса, например, для прогноза перемещения зон давления или температур в метеорологических исследованиях, или развития поражений в сердечной мышце.
Какова была внешность Ивана Грозного?
Одной из основных задач медицинской криминалистики, антропологии, истории является задача воссоздания внешнего вида лица человека по его черепу [13].
Реконструкция лица по черепу представляет собой весьма сложную проблему, требующую сочетания в одном человеке знаний и навыков как медика, ученого-антрополога, так и художника, скульптора. Схематически реконструкция происходит в следующем порядке. На череп наносится сначала сетка из гребней меняющейся высоты, соответствующей средней толщине мягких тканей в данной точке лица. Сначала накладываются основные, определяющие гребни, затем следующие по значимости и т. д. По мере увеличения количества гребней эта сетка становится все гуще и в конце концов покрывает практически весь череп, образуя макет мягких тканей головы. Образовавшаяся поверхность является, однако, еще только заготовкой, своего рода "болванкой", для будущего скульптурного портрета, хотя ее основные габаритные размеры автоматически оказываются согласованными с соответствующими размерами черепа, толщины тканей в разных местах головы и, в частности, лица, пока еще не индивидуальны, они соответствуют табличным, усредненным данным. Поэтому на описанном этапе процесса работа специалиста, несмотря на ее огромную трудоемкость (измеряемую месяцами), носит рутинный, в значительной степени механический характер и является подготовительной.
Иначе обстоит дело на втором этапе, когда приступают к индивидуализации лица, приданию ему надлежащего характера, выражения, возрастных или иных особенностей. При этом на первый план выходит творческое начало человека, его неформализуемая интуиция, сознательный и бессознательный учет косвенных, например литературных или свидетельских, данных о реконструируемом персонаже, его возрасте, характере, 'состоянии здоровья, выражении лица, привычках и т. д. Блестящие примеры подобного воплощения характера дают известные работы М. М. Герасимова по реконструкции внешности царя Ивана Грозного, князя Ярослава Мудрого и др. Весь описанный процесс сопровождается выполнением многочисленных рисунков, эскизов, пробных макетов и требует в ответственных случаях затраты чрезвычайно большого количества времени.
В связи с этим особенно эффективным представляется использование в процессе решения рассматриваемой задачи голографической ЭВМ с программами шаговой взвешенно-групповой аппроксимации преобразований и "освещения" получающихся поверхностей.
В соответствии с приведенным описанием процесса реконструкции использование ЭВМ происходит в два этапа.
Первый этап состоит в формировании заготовки, "болванки" поверхности головы, согласованной по размерам с предъявленным для реконструкции черепом. Этот этап выполняется машиной полностью автоматически. Для подготовки машины к его выполнению в ее память предварительно вводятся краниометрические данные замеров черепа (координаты) для некоторого среднего, типичного для данной этнической группы человека, а также данные подробного обмера (во всех точках) поверхности головы этого же человека. Эти данные образуют в памяти машины описание эталонной пары "череп - поверхность".
При предъявлении нового черепа производятся измерения его геометрии в тех же точках, что и на эталонном черепе. Эти замеры вводятся в память ЭВМ и являются исходными данными для ее работы на описываемом этапе.
Голографирование состоит из следующих операций. Сначала вводится в действие программа вычисления параметров требуемого преобразования. Программа сопоставляет координаты соответственных краниометрических точек эталонного и нового черепов и описанным выше образом вычисляет численные значения параметров для взвешенно-групповых формул, введенных в память ЭВМ заранее. После подстановки в формулы значений параметров вступает в действие программа собственно преобразования. Однако преобразованию подвергается не череп, а эталонная поверхность. В результате преобразования эта поверхность оказывается деформированной таким образом, что все ее основные размеры согласуются с размерами предъявленного черепа. Тем самым полученная поверхность образует требуемую "заготовку". С помощью программы "освещения" эта "заготовка" визуализируется, что позволяет скульптору оценить результат первого этапа.
Второй этап не преследует цели полной автоматизации процесса. Как было сказано, на этом этапе преобладает неформализуемое начало - интуиция, косвенные соображения о характере человека и т. д. Задача ЭВМ в данном случае состоит лишь в машинизации и ускорении процесса работы скульптора, в избавлении его от необходимости работы в материале, т. е. в достижении тех же удобств, что и при эстетическом конструировании. В связи с этим второй этап является полуавтоматическим. Взаимодействие специалиста с ЭВМ на этом этапе базируется на использовании описанного выше специализированного "переводчика" - транслятора, ориентированного в данном случае на комбинированную скульптурно-геометрическую терминологию.
Для удобства подачи команд на лицо автоматически наносится сеть псевдохарактерных точек (или дисплей снабжается световым карандашом). В связи с этим в фразеологическом наборе могут содержаться команды двух видов - качественные и координированные. Возможность использования более удобных для специалиста качественных команд связана с существованием большого набора общепринятых наименований для разнообразных, часто достаточно мелких частей лица, например, центр щеки, внутренний угол левого глаза, правый выступ подбородка, правый угол рта и т. д. Для обеспечения возможности пользоваться такими командами в машине еще на уровне эталонной поверхности производится разметка необходимых точек или областей лица. При этом соответствующие символы, а с ними и сопоставляемые транслятором наименования следуют за своими точками и областями при любых деформациях поверхности, что освобождает специалиста от необходимости задания координат интересующих его участков лица. Скульптор может и не задавать количественных значений требуемых перемещений. В этом случае программа производит заданную деформацию малыми приращениями до команды "стоп".
Координированные команды предназначены в основном для наиболее тонких, отделочных операций с малыми участками лица, не имеющими специальных наименований. При необходимости координированные команды могут подаваться и взамен качественных. Координированная команда составляется из номера псевдохарактерной точки, оказавшейся на интересующем скульптора участке (или из номера нескольких таких точек, если нужна не точка, а область прикрепления), и из сведений о том, в каком направлении и насколько должна перемещаться эта точка (или каждая из точек в случае прикрепления). В команду вводятся также номера тех из ближайших псевдохарактерных точек, которые должны остаться неподвижными. По этим данным машина через посредство транслятора автоматически определяет необходимую группу преобразований, выбирает из набора подходящую весовую функцию и вычисляет значение параметров, после чего производит и визуализирует заданную деформацию. Если оказывается, что эта деформация неточно отвечает замыслу специалиста, он тем же способом вносит необходимые, еще более мелкие исправления в виде второй итерации и т. д.
Для большего удобства оценки результатов используется голографический стереоэффект. Если в конце работы окажется, что некоторые особо мелкие и тонкие изменения скульптору удобнее все же внести вручную, по специальной команде машина с помощью фрезерно-копировального автомата изготавливает бюст в материале, после чего специалист может завершить отделку.
Для придания реконструированному лицу естественного вида часто оказывается желательным (в особенности в криминалистике) выполнение ряда специфических, не имеющих отношения к формообразованию операций, сводящихся к нанесению на лицо грима. Под этим в описываемых разработках понимались такие операции, как придание необходимой окраски (точнее, степени зачерненности) бровям, глазам, губам, родимым пятнам и т. д., а также надевание на выработанную поверхность головы волосяного массива (парика) заданной формы, усов, бороды, очков и других возможных атрибутов.
Конструируется фоторобот
Рассмотрим еще одну задачу, относящуюся главным образом к области медицинской криминалистики,- задачу моделирования пластико-мимических изменений или задачу с фотороботом [13]. Разработки этого направления связаны с часто возникающей необходимостью воссоздать лицо человека по показаниям свидетелей, т. е. визуализировать словесный портрет. Решение этой задачи основывается на использовании альбомов, содержащих огромное количество зарисованных художниками разнообразных типов встречающихся форм всех частей лица - носов, ушей, бровей, ртов, овалов лица, волос, усов, губ, глаз и т. д. Каждый из этих рисунков повторен на диапозитиве и с помощью специального проектора может быть показан на экране с тем или иным увеличением, например до натурального размера. Проектор позволяет легко сменять диапозитивы и изменять их взаимное положение.
Подбирая по указаниям свидетелей диапозитивы и регулируя их расположение, оператор добивается наибольшего сходства, после чего полученное изображение фотографируется.
Описанная система довольно громоздка. Кроме того, альбомы содержат дискретную совокупность вариантов носов, глаз и т. д., так что плавный непрерывный переход от варианта к варианту невозможен. Все элементы лица приведены в состоянии анфас, тогда как иногда требуется показать лицо и в другом ракурсе, например в профиль, три четверти. Наконец, результирующее изображение имеет вид штрихового рисунка, тогда как более естественной для свидетелей была бы фотография.
Применение для решения задачи ЭВМ с голографическим выходом позволяет преодолеть перечисленные трудности. Отличие этой задачи от предыдущей состоит в том, что нужно варьировать в довольно широких пределах мимику лица и имитировать болезненные изменения. Кроме того, в ее решении по понятным причинам нет автоматического этапа построения заготовки.
Схематически работа с машиной в этой задаче происходит так. В долговременную память машины вводятся типичные поверхности лиц для представителей различных национальностей и этнических групп. Если по данным свидетелей удается установить, к какой из подобных групп может относиться нужное лицо, то в качестве эталонной используется поверхность, относящаяся к этой группе. В противном случае используется поверхность, предполагаемая по тем или иным соображениям наиболее вероятной.
Затем оператор, следуя указаниям свидетелей, начинает вносить с помощью электроники изменения в форму поверхности и элементы грима, в случае надобности меняя ракурс головы и характер освещения. Получающееся лицо показывается свидетелям объемным. Окончательный вариант фотографируется и передается для использования. Материалом для ввода исходной поверхности послужила контактная маска, измерения которой производились с помощью несложного приспособления. Это приспособление содержало "гребенку" из тонких вертикальных металлических щупов, отстоящих один от другого на небольшом расстоянии, причем глубина опускания каждого из щупов отсчитывалась по положению его верхнего конца после того, как нижний конец касался маски. Вся линейка щупов могла перемещаться в перпендикулярном направлении по горизонтальным салазкам, между которыми лицом вверх была закреплена маска. Была предусмотрена и возможность перестановки всей системы вдоль линейки щупов, что позволяло после двукратного отсчета каждого сечения получить нужный шаг растра в этом направлении.
Одна из антропологических задач связана с выяснением влияния заданных изменений тех или иных элементов лица на зрительное восприятие сходства. Разумеется, отыскать, реальных людей, лица которых были бы совершенно одинаковы, за исключением, положим, носа, меняющегося по определенной шкале, невозможно. Поэтому голографирование с помощью ЭВМ является вообще единственным способом решения задачи, если, конечно, не считать изготовления серий портретов вручную скульптором или художником. В ЭВМ эта задача легко решается для произвольных изменений любых элементов лица, поодиночке или в заданных комбинациях. Для этого подготавливаются формулы нужной последовательности деформаций и задается шаг приращений значений параметров, после чего машина автоматически генерирует серию изображений с требуемыми изменениями. Эту серию затем можно подвергать психологическому шкалированию в отношении сходства с помощью субъективно-статистической экспертизы и тем самым решить задачу.
Любое изменение, количественно сравнительно небольшое, меняет выражение лица, впечатление о характере субъекта. В алгоритме "освещения" обычно используются один-два источника некогерентного и один - когерентного света. Во многих случаях достаточно естественные пластические и мимические изменения удается осуществить с помощью плоских преобразований на двумерных изображениях.
В [13] показано несколько последовательных стадий мимической деформации - процесса появления улыбки. По заданию историков и кинематографистов эта работа выполнялась на материале известного автопортрета Леонардо да Винчи. При быстрой смене этих стадий с помощью кинопроектора зритель видит появление улыбки в реальном масштабе времени.
Количество источников движения в этой работе четыре (в районе углов губ и под глазами).
Большое значение в криминалистике и исторических исследованиях имеет задача моделирования возрастных изменений человеческого лица. Физиологически эти изменения обусловлены понижением с возрастом тонуса мягких тканей, что приводит к нави-санию кожи, образованию складок и морщин. Одновременно в результате истирания зубов происходит подъем и выпячивание вперед подбородка.
Эксперименты с возрастными изменениями, выполненные в рамках описываемых исследований, опирались на представленные антропологами-анатомами данные двоякого рода: о районировании лица с выделением более или менее независимо меняющихся с возрастом частей и о количественных смещениях этих частей и содержащихся в них линий для заданной разницы возрастов.
Пример искусственного состаривания с учетом таких данных лица приведен в [13].
Складки и глубокие морщины формировались при старении как обычные деформации поверхности (рельефные морщины). Для создания же мелких морщин попользовались операции грима. В опытах грим наносился путем насильственного (не связанного с освещением) зачернения тех или иных групп элементов поверхности.
Возрастные изменения, как и мимические, можно моделировать и на материале плоских изображений. Показан процесс омоложения лица с еще одного, профильного портрета Леонардо да Винчи. Пластическая деформация сводилась здесь к опусканию и отведению назад подборка (два источника движения, группы поворотов и параллельных переносов; области прикрепления и влияния - круги и эллипсы). Грим состоял в постепенном ослаблении морщин, а также надевании парика. В кинематографическом оформлении эта серия стадий позволяет осуществить процесс омолаживания буквально на глазах.