Google запатентовал распознавание объектов на видео

Текст: Георгий Орлов /Infox.ru

Google получил патент на функцию распознавания повседневных предметов на видеоряде. Данная функция будет полностью автоматизирована, идентификация объектов будет происходить без какого-либо участия человека.

Описанная в документе система проводит динамический анализ каждого кадра на видеоряде и идентифицирует изображенные на картинке объекты, для этого система постоянно обращается к так называемому «репозиторию визуальных объектов». Он представляет собой базу данных, в которой хранятся образцы изображений, с которыми сравниваются реальные объекты в кадре видеофайла. Ключевым моментом при идентификации объекта являются так называемые «функциональные векторы» — совокупность опорных свойств каждого объекта, таких как его цветовые признаки, форма, текстура или скорость движения на видеофайле. За исключением динамических показателей аналогичные алгоритмы Google предлагает применять и к статическим изображениям, то есть к фотографиям.

Как это всегда бывает с патентами, в документе нет подробностей о том, как данная технология будет использоваться. Наиболее очевидным ее применением является принадлежащий компании Google видеосервис YouTube, однако, указывают журналисты ресурса SlashGear, функция идентификации объектов на видеоряде оказалась бы полезной и в фирменных очках дополненной реальности Google Glasses, над которыми сейчас ведется активная работа. В частности, это позволило бы оптимизировать интерфейс устройства под работу с расширенными функциями дополненной реальности, выводя динамические пояснения к каждому объекту в реальном мире. Однако никаких конкретных данных относительно внедрения данной функции в реальные программные и аппаратные продукты пока нет.

Использование данной технологии на видеохостинге YouTube позволило бы существенно расширить объемы метаданных видеоконтента, полагают журналисты SlashGear. К каждому ролику автоматически добавилось бы большое число ключевых слов, и в результате увеличилась бы эффективность поиска на ресурсе в целом.