- BrainTools - https://www.braintools.ru -

5 самых классических статей по вычислительной лингвистике

Этот список год назад составил Николай Михайловский для нашего тг-канала ProAI [1]. Так как статьи самые классические, то год спустя список остается актуальным.

На мой взгляд, читать классические статьи по специальности полезнее, чем самые свежие. Часто идеи в них богаче, а примеры – неожиданнее, чем в массовой научной продукции последних лет. Ниже – 5 самых классических, на мой взгляд, статей по вычислительной лингвистике.

Авторегрессионные языковые модели

А.А. Марковъ, Примѣръ статистическаго изслѣдованія надъ текстомъ “Евгенія Онѣгина” иллюстрирующій связь испытаній въ цѣпь. 1913 [2]

В статье Марков строит то, что сейчас назвали бы char-level bigram language model. Естественно, такие модели эквивалентны марковским цепям, и явились едва ли не первым примером применения механизма условной вероятности, на котором держится вся вычислительная лингвистика, и марковских цепей.Таким образом, языковая модель, вводимая им – это авторегрессионная модель, и является прадедушкой GPT.

Lalit R. Bahl, Frederick Jelinek, and Robert L. Mercer. A Maximum Likelihood Approach to Continuous Speech Recognition [3], 1983

В статье Йелинек с соавторами описывает подход, используемый с тех пор во всех системах распознавания речи, и архитектуру с разделением на акустическую и языковую модели, которые используются до сих пор. Также статья вводит в современную вычислительную лингвистику марковский подход (см. выше) с марковскими цепями и условными вероятностями.

Формальные грамматики

Noam Chomsky. Three Models for the Description of Language [4], 1953

C практической победой статистического подхода Йелинека (см. выше) в вычислительной лингвистике в 90-х годах прошлого века генеративные грамматики очутились на окраине вычислительнолингвистических интересов. Однако, до этого эта работа 40 лет определяла развитие вычислительной лингвистики. Формальные грамматики по-прежнему лежат в основе всего, что мы программируем, ибо все языки программирования определяются формальными грамматиками.

Дистрибуционные семантики

Zellig S. Harris. Distributional Structure. [5] 1954

Видимо, впервые вводится идея о том, что слово определяется своим контекстом.

Информация

А. Н. Колмогоров, Три подхода к определению понятия “количество информации [6]. 1965

Обсуждая шенноновский подход к определению информации, Колмогоров вводит то, что теперь называется колмогоровской сложностью. Парадоксы [7], вытекающие из этой работы, до сих пор не разрешены удовлетворительно. Хотя значимость этой работы сильно выходит за рамки вычислительной лингвистики, бОльшая часть приводимых Колмогоровым примеров – именно лингвистические.

А на ProAI [1]тоже подписывайтесь) там мы с Николаем пишем обзоры на заинтересовавшие нас не классические, а свежие работы

Автор: derunat

Источник [8]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/16054

URLs in this post:

[1] ProAI: https://t.me/+TVceMZ0TIlY4MmMy

[2] А.А. Марковъ, Примѣръ статистическаго изслѣдованія надъ текстомъ “Евгенія Онѣгина” иллюстрирующій связь испытаній въ цѣпь. 1913 : https://www.mathnet.ru/php/archive.phtml?wshow=paper&jrnid=im&paperid=6612&option_lang=rus

[3] Lalit R. Bahl, Frederick Jelinek, and Robert L. Mercer. A Maximum Likelihood Approach to Continuous Speech Recognition: https://www.cse.iitb.ac.in/~pb/cs626-2013/word-alignment/jelineck-speech-1983.pdf

[4] Noam Chomsky. Three Models for the Description of Language: https://chomsky.info/wp-content/uploads/195609-.pdf

[5] Zellig S. Harris. Distributional Structure.: https://www.tandfonline.com/doi/pdf/10.1080/00437956.1954.11659520

[6] А. Н. Колмогоров, Три подхода к определению понятия “количество информации: https://www.mathnet.ru/php/archive.phtml?wshow=paper&jrnid=ppi&paperid=68&option_lang=rus

[7] Парадоксы: http://www.braintools.ru/article/8221

[8] Источник: https://habr.com/ru/articles/917192/?utm_campaign=917192&utm_source=habrahabr&utm_medium=rss

www.BrainTools.ru

Rambler's Top100