Пограничники получили инструкцию по фотосъемке
Американские пограничники получили инструкцию по пользованию служебной фотоаппаратурой. Текст документа говорит об исключительной глупости как самих пограничников, так и пассажиров.
Программы распознавания лиц могут выполнять много полезных задач. В частности, в приграничных пунктах паспортного контроля эта система может отлавливать разыскиваемых преступников. Однако часто подобные системы не могут корректно выполнять поставленные перед ними задачи. А всё из-за того, что приходится иметь дело с изображениями плохого качества: ведь пограничники – не профессиональные фотографы.
Министерство национальной безопастности США (United States Department of Homeland Security) в рамках программы US-VISIT (United States Visitor and Immigrant Status Indicator Technology – Технологии идентификации гостей и иммигрантов США) активно внедряет биометрические технологии: это снятие отпечатков пальцев, фото лица, а в ближайшем будущем -- ещё и сканирование радужной оболочки глаза. И их совершенно не устраивает, что технология распознавания лиц не работает из-за человеческого фактора. Они обратились к сотрудникам Национального института стандартов и технологий (National Institute of Standarts and Technology -- NIST), чтобы те помогли усовершенствовать процесс фотографирования. Ученые понаблюдали за тем, как осуществляется процедура фотографирования при паспортном контроле, и дали несколько довольно тривиальных, но действенных советов, как же улучшить ситуацию.
Расследование на пограничном пункте
Ученые подошли к исследованию со всей серьезностью. Для начала они провели масштабные наблюдения «в поле». «Полем» стали пункты паспортного контроля вашингтонского международного аэропорта Даллес (Washington Dulles International Airport), где они наблюдали за реальным процессом пограничной фотосъемки и выявили ряд существенных недостатков. Причем, как выяснилось, проблемы существуют как со стороны пограничников, так и со стороны пассажиров.
Например, служащие паспортного контроля сидят за столом так, что когда они смотрят на собеседника, монитор находится у них сбоку. Это не очень удобно, ведь у веб-камеры, которой они делают снимки, нет видоискателя. Так что им приходится при наведении объектива на человека следить за изображением на мониторе. При этом они отвлекаются, наблюдая за пассажиром периферическим зрением: ведь это входит в их обязанности. Поведение и манеры человека – важная информация для принятия решения о том, стоит ли отправлять его на дополнительную проверку. В итоге обе работы делаются плохо.
Веб-камера закреплена на мониторе гибким держателем. Служащим каждый раз приходится передвигать ее, чтобы их собеседник попал в кадр. Ученые пишут, что в случаях, когда выровнять изображение было трудно, пограничники переставали настраивать положение камеры, делая снимок «как есть». Перевести камеру в режим «портрет» также догадываются не все – большинство фотографируют в режиме «пейзаж», который стоит по умолчанию.
У пересекающих границу свои трудности. Мало того, что они устали после многочасового перелета, многие еще и недостаточно хорошо говорят по-английски и не всегда понимают указания пограничника. Так, например, многие встают перед сканером пальца, а не напротив камеры. К тому же далеко не все понимают, что это фотокамера и в нее нужно смотреть. Зато нашлись даже несколько человек, которые приняли необычную сферическую веб-камеру за сканер радужной оболочки и почти вплотную приблизили к объективу глаз. Все это ухудшает качество снимков и увеличивает время прохождения паспортного контроля.
Ученые обработали сделанные пограничниками снимки и выяснили, что 14% совершенно не воспринимаются программой распознавания лиц. Помехи из-за движения были на 1% фото, на 5% изображений была обрезана часть головы. Всего лишь на 5% фотографий изображенный стоял прямо напротив камеры, 70% снимков сделаны под углом более 10 градусов, тогда как рекомендуется не больше пяти. Возможности камеры тоже не удовлетворили исследователей: на 95% фотографий межзрачковое расстояние составляло не более 74 пикселей. Так что на значительной части фотографий программа просто не могла найти глаза.
Рекомендации экспертов
Поразмыслив хорошенько, специалисты NIST предложили 5 простых шагов для совершенствования процесса фотосъемки и распознавания лиц, которые не требуют больших затрат и должны значительно улучшить работу уже существующих технологий и программ.
Шаг первый: камера должна иметь сходство с обычной камерой. Причина: пассажиру будет проще понять, куда смотреть.
Шаг второй: камера должна издавать щелчок, извещающий пассажира о том, что снимок готов. Причина: это ускорит процесс съемки.
Шаг третий: камера должна быть переведена в режим «портрет». Причина: это улучшит фокусировку.
Шаг четвертый: оператор должен одновременно видеть и клиента, и монитор. Или у камеры должен быть экран видоискателя, отображающий картинку в режиме реального времени. Причина: это улучшит наведение, пограничник будет постоянно наблюдать за пассажиром.
Шаг пятый: необходимо нанести на пол специальный маркер, например традиционные «следы», который будет указывать пассажиру место, куда следует встать. Причина: это облегчит оператору наведение камеры.
Лабораторный эксперимент
Чтобы не быть голословными и доказать эффективность предложенных решений, ученые провели эксперимент. Они выбрали 300 добровольцев, которые «работали» как пограничниками, так и пассажирами. Выборку исследователи постарались сделать как можно более репрезентативной: 151 женщина и 149 мужчин от 18 до 65 и более лет. Рост испытуемых варьировался от 142 до 201 см, при этом средний мужской рост составлял 178,3 см, а женский – 163,6, что неплохо коррелирует как с американскими, так и с мировыми показателями.
Участников минимально проинструктировали и запустили в комнату, в которой был реконструирован пункт паспортного контроля со всеми подробностями, включая размер стола и расстояние до стены. Однако фотокамеру оператору выдали традиционную, цифровую, и поставили его ровно напротив кресла клиента (ученые допустили вольность, поставив кресло, но считают, что метка на полу его вполне заменит). Камера была закреплена на треноге так, что двигать ее можно было только «вверх-вниз». Снимок сопровождался характерным щелчком, имитирующим звук закрытия затвора фотоаппарата.
Результаты, как и ожидали исследователи, оказались хорошими. Все участники на фото смотрели в камеру, на всех фотографиях программа могла найти лицо. Ученые рассмотрели снимки более подробно и выяснили, что по сравнению с реальными снимками, сделанными таможенниками, все показатели, такие как выравнивание головы и плеч, ширина и длина лица, а также положение его в кадре, улучшились.
Ученые также обнаружили, что использование рамки, помогающей правильно выставить объектив -- так, чтобы лицо находилось в центре, тоже может помочь. Сейчас они разрабатывают макет для такой рамки, который будет наиболее простым и понятным, и в то же время эффективным.