Американские ученые из лаборатории Artificial Intelligence Laboratory и института Institute of Medical Engineering and Science совместно со специалистами Массачусетского технологического института (MIT), разработали уникальный алгоритм оценки эмоционального окраса речи. Это позволит вывести возможности искусственного интеллекта на принципиально новый уровень.
Современные автоматизированные системы могут распознавать как отдельные слова в человеческой речи, так и целые предложения, сообщают представители MIT, а некоторые такие системы способны к обучению и развитию собственных навыков. Но для каждой из них определение эмоциональной окраски речи становится непосильной задачей, а эта задача зачастую ложится на людей.
Новый алгоритм от американских специалистов активно задействует механизмы глубинного машинного обучения для анализа информации как в формате аудио, так и в виде текстовых транскрипций. По состоянию на сегодняшний день точность определения общего тона речи уже достигла 83%.
Тестирование нового алгоритма проводилось в реальных условиях: был проведен эксперимент, участники которого носили на запястьях особое устройство, названное авторами Samsung Simband и очень напоминающее смарт-часы Samsung Gear S. С помощью данного гаджета устройство записывалось и затем переводилось в текстовую форму, а встроенные в сам браслет датчики работали в штатном режиме и получали дополнительную информацию о текущем состоянии здоровья своего владельца. Все эти данные затем передавались на компьютер с запущенным алгоритмом для анализа.
До коммерциализации новой технологии остается еще много времени – ей предстоит пройти ряд тестов и улучшить свои показатели с 83% почти до 100%. По словам ученых, их разработка очень пригодится в области медицины и пригодится людям, страдающим синдромом Аспергера и рядом других расстройств личности, мешающих правильно воспринимать эмоциональный окрас речи собеседника.