ФСБ отфильтрует голоса кавказской национальности за 24 млн рублей
Федеральная служба безопасности проводит конкурс на создание программного обеспечения, которое позволит идентифицировать кавказские языки при телефонных разговорах. В первую очередь заказчика интересует автоматическое распознавание «аварского, ингушского, кабардино-черкесского, карачаевского, балкарского и даргинского языков».
На сайте zakupki.gov.ru размещен лот на «Создание автоматизированного атласа национальных языков РФ». Речь идет о создании системы, способной при автоматическом анализе телефонных разговоров идентифицировать язык, на котором ведется общение.
Техническое задание
Анализ документов, опубликованных в описании лота, дает представление о том, на что готов потратить заказчик 24 миллиона рублей. Речь идет о создании программного обеспечения, способного анализировать аудиозапись речи носителя языка и идентифицировать этот язык.
Программа должна работать в операционной системе «Windows XP и выше», содержать базу данных звуковых примеров, толковый словарь, инструкцию пользователя, обеспечивать возможность импорта/экспорта и пополнения данных.
В задании перечислены языки, которые должны отрабатываться программным комплексом: «аварский, ингушский, кабардино-черкесский, карачаевский, балкарский и даргинский» (названия языков процитированы из опубликованного документа).
База данных и звуковые примеры собираются на основе спонтанной речи и прочитанных вслух текстов так называемыми информантами-носителями, которыми должны являться только мужчины от 20 до 60 лет, с образованием не ниже среднего.
Заказчик хочет получить 20 дисков с программным обеспечением с возможностью инсталляции софта на неограниченное количество компьютеров. Инсталляционные комплекты не должны иметь ограничений срока действия, при этом срок гарантийного обслуживания составит три года.
Заказчик и исполнители
В описании лота указан заказчик – войсковая часть 68240, а также имена, телефоны и электронные адреса контактных лиц. Несложный анализ этих данных с применением популярных поисковых сервисов позволяет идентифицировать заказчика как одно из подразделений ФСБ РФ.
Войсковая часть 68240 известна также заказами на разработку программы автоматического распознавания тревожных ситуаций по индивидуальным особенностям поведения и внешнего облика человека за 15 миллионов рублей; на разработку носителей данных для архивного хранения за 45 миллионов рублей; на монокуляр ночного видения за 2 миллиона.
Не останутся без внимания ФСБ и носители русского языка. Та же войсковая часть разместила заказ на «Создание автоматизированного атласа современного русского языка» стоимостью 24 миллиона рублей, а также на «Создание автоматизированного справочника дефектных особенностей в русской речи» за 12 миллионов рублей.
Заявки на участие в конкурсе представили Московский государственный лингвистический университет, ООО «Центр речевых технологий» из Санкт-Петербурга и ростовское НИИ «Спецвузавтоматика».