В интернете появился корпус коми языка

Центр инновационных языковых технологий Коми республиканской академии госслужбы и управления продолжает активно наращивать комиязычный контент в интернете. Сейчас в сети появился масштабный национальный корпус коми языка. Это информационно-справочная система, основанная на собрании текстов на коми языке в электронной форме. Над его созданием два года трудились ученые-лингвисты, студенты и волонтеры.

На сайте www.komicorpora.ru помещен корпус современного коми языка. Его общий объем включает более двадцати миллионов словоупотреблений. Собрание текстов будет постоянно дополняться, а сама система модернизироваться и улучшаться. Работать над корпусом будет команда из четырех человек.

Здесь можно легко найти любое коми слово, употребляемое в литературе. И примеры использования этих слов. Например, поиск по слову кань (кошка) выдает 6158 результатов, а по слову му (земля) найден 197 681 результат. Также поиск выдает использование этих языковых единиц в других словах. Например, кань является частью слов акань (кукла) и т.д.

От простых электронных библиотек национальный корпус отличает сбалансированный состав текстов. Здесь представлены все типы письменных и устных текстов на коми языке: публицистические, учебные, научные, деловые, разговорные, диалектные и т.п. Вторая особенность – корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию).

Национальный корпус предназначен для специалистов, занимающихся исследованием лексики, грамматики языка, а также изменений, происходящих в языке на протяжении сравнительно небольших периодов — от одного до двух столетий. Но круг пользователей корпуса вовсе не ограничивается профессиональными исследователями языка, а воспользоваться корпусом может любой желающий.

Большинство крупных языков мира уже имеет свои национальные корпуса. Общепризнанным образцом считается Британский национальный корпус (BNC): на него ориентированы многие другие современные корпуса.

Артур АРТЕЕВ

Оставьте первый комментарий для "В интернете появился корпус коми языка"

Оставить комментарий

Ваш электронный адрес не будет опубликован.



Privacy Overview

This website uses cookies so that we can provide you with the best user experience possible. Cookie information is stored in your browser and performs functions such as recognising you when you return to our website and helping our team to understand which sections of the website you find most interesting and useful.