Лингвист Евгений Игушев: «Корпус коми языка в интернете не имеет аналогов в стране»

В Сыктывкаре 16-17 марта состоится международная научная конференция «Электронная письменность народов Российской Федерации: опыт, проблемы и перспективы». На нее соберутся специалисты по информатизации национальных языков России. В рамках форума предполагается обсудить широкий спектр вопросов, затрагивающих компьютерную обработку национальных языков и развитие сегмента на национальных языках в сети интернет. О развитии в интернете современного коми языка в блиц-интервью «Республике» рассказал известный ученый-филолог Евгений Игушев.

– В открывшемся шесть лет назад в Сыктывкаре Центре инновационных языковых технологий создается виртуальный корпус коми языка. Проводится ли аналогичная работа в других финно-угорских регионах?

– Этот языковой корпус является уникальным в финно-угорском мире, ведь подобной работы не проводится ни в одном национальном образовании финно-угорских и самодийских народов страны. Разве что только в Удмуртии на основе пяти томов лингвогеографических карт намечено создание диалектологического атласа удмуртского языка. Удмуртской лабораторией лингвистического картографирования и исторической лексикологии уже создан электронный вариант словаря языка основоположника удмуртской литературы Кузебая Герда. В других российских финно-угорских регионах национальные языки не представлены даже в интернете.

– Что представляет собой корпус коми языка?

– Это информационно-справочная система, основанная на собрании коми текстов в электронной форме. На сайте сейчас размещен корпус современного коми языка общим объемом более тридцати миллионов словоупотреблений. В него входят старинные и современные коми тексты. Корпус содержит по возможности все типы письменных и устных текстов, представленных в данном языке: художественные, публицистические, учебные, научные, официально-деловые и другие по возможному максимуму. Корпус включает в себя все словоформы коми языка, которые были зафиксированы за историческое время существования письменности не только в произведениях художественной литературы, но и в текстах других жанров, учебниках для начальных и средних школ и вузов, в коми газетах и журналах, а также в интернете. В корпусе коми языка представлены как литературные словоформы, так и диалектные лексемы, их фонетические и грамматические варианты.

Национальный корпус коми языка состоит из девяти подкорпусов. Это основной – в нем представлены произведения художественной прозы: романы, повести, рассказы и другие. Поэтический объединяет стихотворения, поэмы, песни, драматический – драмы, комедии, трагедии, фольклорный – произведения коми устного поэтического творчества, опубликованные в орфографии литературного языка. Подкорпус документальной прозы объединяет произведения прозы небеллетристического характера, опубликованные в книгах и журналах: очерки, публицистические статьи и так далее. В газетном представлены тексты из комиязычных СМИ: газет «Коми му», «Йöлöга», «Парма гор», «Асъя кодзув», «Выль туйöд», Коми народного радио, телевизионных программ телеканала «Юрган». Официально-деловой подкорпус состоит из государственно-правовых актов Коми республики: законов, указов, постановлений, распоряжений в официальных переводах на коми язык. В научном подкорпусе собраны работы лингвистов, литературоведов, этнографов, историков, написанные на коми языке, раздел переводной литературы содержит переводы произведений русской и зарубежной литературы, а также другие тексты.

– Какова основная цель создания корпуса электронных текстов на коми языке?

– Он должен сохранить и систематизировать культурно-языко-вое наследие коми народа, а также способствовать дальнейшему использованию текстовой базы при подготовке словарей, учебников, учебно-методических пособий. Корпус коми языка представляет уникальную ценность не только для ученых, исследующих тайны коми языка, но и для их коллег из финно-угорских регионов, занимающихся проблемами происхождения и развития уральских языков.

Корпус коми языка также имеет большую практическую ценность как важнейший источник лексического запаса для творческой интеллигенции – писателей, журналистов и как потенциальный резерв для пополнения их словарного запаса, для активизации архаических и исторических словоформ при создании художественных произведений, для учителей, преподавателей, краеведов. Для всех тех, кто интересуется языком и историей коми народа.

Беседовал Артур АРТЕЕВ

Фото автора

 

«Язык – это основа идентичности. Отношение к родному языку, по сути, отношение к самому себе, к своим предкам и потомкам. Язык – это духовная и культурная летопись народа, ведь он несет в себе больше информации, чем многотомные энциклопедические издания. В то же время язык – живой организм, в котором запечатлены все исторические вехи, спаяны времена и эпохи.

Уверен, что наши совместные усилия должны быть направлены на повышение качественного уровня владения русским языком, родными языками, их сохранение, развитие и популяризацию среди молодежи. Очень важно при этом, какие средства коммуникации с молодежью мы выбираем. Конечно, для подрастающего поколения, идущего в ногу со временем, удобнее получать знания с использованием доступных информационных технологий, поэтому те вопросы, которые обсуждаются на конференции, чрезвычайно важны и востребованы сегодня».

Игорь Баринов, руководитель Федерального агентства по делам национальностей

1 ответ на Лингвист Евгений Игушев: «Корпус коми языка в интернете не имеет аналогов в стране»

  1. Владимир Уляшев:

    Видали мы уже всяких проектов!
    Этот «корпус» создают под международную научную конференцию «Электронная письменность народов Российской Федерации: опыт, проблемы и перспективы» или и после конференции этот объект будет еще работать?

    Думаю, будет так:
    1. «корпус» завалят плохо отсканированными страницами в jpg и pdf,
    2. отчитаются с высокой трибуны,
    3. забудут, затеряют за всяким интернет-хламом.
    Все.

Добавить комментарий