KILS-2021: Заседание секции «Компьютерная и корпусная лингвистика»

Заседание прошло 15 ноября с 11.00 до 13.30. На нем присутствовало в команде Microsoft Teams 20 авторов докладов и слушателей. Представлено 13 докладов. География авторов докладов: представлены 2 страны – Россия и Израиль, 8 городов (Санкт-Петербург – 5 человек, Москва – 4, Казань – 4, Ижевск – 2, Красноярск – 2, Саранск – 1, Екатеринбург – 1, Челябинск – 1). Среди авторов докладов 2 доктора наук, 8 кандидатов наук.

В докладах секции затронут широкий спектр актуальных тем. Можно особо выделить следующие доклады. В докладе Колмогоровой А.В. и Вдовиной Л.А. “Эмоциональный анализ текстов социальной сети ВКонтакте: опыт лингвистического проекта на основе машинного обучения” представлен подход к описанию нечетко представленных (не дискретных) эмоций методами машинного обучения, в том числе, с помощью современных нейронных сетей глубокого обучения. Доклад Белоглазовой Е.В. “О чем говорят заголовки: корпусное исследование библиографии ROSSICA” посвящен анализу корпуса зарубежных публикаций о России, позволяющему понять, как воспринимают Россию за рубежом. Доклад Лапошиной А.Н., Лебедевой М.Ю. “Смотря как считать: влияние типа корпуса на данные о частотности слова в контексте определения сложности учебных текстов для младшей школы” посвящен проблематике создания частотных словарей на материале школьных учебников. Создание таких словарей актуально, т.к. они могут быть использованы, в частности, для определения уровня сложности учебников. В докладе Евграфовой К.В. и Соколовой Н.С. “Акустический анализ качества голоса и речи преподавателей иностранного языка в высшей школе в период онлайн-обучения в условиях пандемии” показано увеличение нагрузки на голосовой аппарат преподавателя при использовании дистанционных технологий. В докладе Зельдина А.В. предложена инновативная параметрическая модель фонем, позволяющая проводить квантитативные исследования степени фонетической близости слов. В целом следует отметить высокий уровень всех представленных докладов, широкое использование различных корпусов и средств математического анализа лингвистических данных.