Москва
25 ноября ‘24
Понедельник

Google запатентовал распознавание объектов на видео

Google получил патент на функцию распознавания повседневных предметов на видеоряде. Данная функция будет полностью автоматизирована, идентификация объектов будет происходить без какого-либо участия человека.

Описанная в документе система проводит динамический анализ каждого кадра на видеоряде и идентифицирует изображенные на картинке объекты, для этого система постоянно обращается к так называемому «репозиторию визуальных объектов». Он представляет собой базу данных, в которой хранятся образцы изображений, с которыми сравниваются реальные объекты в кадре видеофайла. Ключевым моментом при идентификации объекта являются так называемые «функциональные векторы» — совокупность опорных свойств каждого объекта, таких как его цветовые признаки, форма, текстура или скорость движения на видеофайле. За исключением динамических показателей аналогичные алгоритмы Google предлагает применять и к статическим изображениям, то есть к фотографиям.

Как это всегда бывает с патентами, в документе нет подробностей о том, как данная технология будет использоваться. Наиболее очевидным ее применением является принадлежащий компании Google видеосервис YouTube, однако, указывают журналисты ресурса SlashGear, функция идентификации объектов на видеоряде оказалась бы полезной и в фирменных очках дополненной реальности Google Glasses, над которыми сейчас ведется активная работа. В частности, это позволило бы оптимизировать интерфейс устройства под работу с расширенными функциями дополненной реальности, выводя динамические пояснения к каждому объекту в реальном мире. Однако никаких конкретных данных относительно внедрения данной функции в реальные программные и аппаратные продукты пока нет.

Использование данной технологии на видеохостинге YouTube позволило бы существенно расширить объемы метаданных видеоконтента, полагают журналисты SlashGear. К каждому ролику автоматически добавилось бы большое число ключевых слов, и в результате увеличилась бы эффективность поиска на ресурсе в целом.

Полная версия