Ученые разработали алгоритм, позволяющий автоматически воссоздавать протоязыки, и опробовали его на австронезийской языковой семье. Как надеются разработчики, программа облегчит работу лингвистов.
Описание алгоритма, созданного канадскими исследователями из Университета Британской Колумбии, опубликовано в журнале Proceedings of the National Academy of Sciences.
В качестве исходных данных программа использует звучание слов, их значение и вероятные генеалогические схемы анализируемых языков. На выходе она выдает список однокоренных слов и реконструкцию слова-предшественника в исходном протоязыке.
Например, с помощью программы ученые вычислили, что слово «звезда», на языке аборигенов Тайваня звучащее как mintol, на Фиджи – как kalokalo и на Борнео – как bitén, в протоязыке этих народностей звучало как bituqen.
Попытки написания подобных программ предпринимались неоднократно, однако все они работали слишком прямолинейно и выдавали результат с большим процентом ошибок. Чтобы избежать этого, авторы исследования построили алгоритм на более гибких принципах, учитывающих вероятностный характер словообразования.
Обработав с помощью программы почти 140 тысяч слов из 637 языков, относящихся к австронезийской языковой семье (она охватывает около 300 миллионов человек, живущих в Юго-Восточной Азии и на Мадагаскаре), ученые сравнили полученные данные с результатами традиционного лингвистического анализа.
Оказалось, что реконструкции, построенные автоматически, на 85% совпали с теми, что были построены вручную. Из этого разработчики сделали вывод, что программа является эффективным инструментом лингвистического анализа, хотя и не сможет полностью заменить традиционные методики.