Лингвист Марина Федина: «Интернет помогает выживать малым языкам в эпоху глобализации»

В декабре свой пятилетний юбилей отметит Центр инновационных языковых технологий. Благодаря его деятельности Коми считается одним из лидеров в области информатизации российских финно-угорских языков. О работе центра «Республике» рассказала его руководитель Марина Федина.

izNRMLJh4n4

– В марте в Сыктывкаре пройдет международная конференция по электронной письменности малых народов России. Почему научный форум решили провести именно в Коми?

– Основной целью конференции является кооперация исследователей, занимающихся компьютерными подходами к работе с языками страны. Приедут специалисты из разных регионов России и наши зарубежные коллеги. Подобная конференция впервые прошла пять лет назад в Йошкар-Оле. А после столь крупных мероприятий по данному направлению не было, а время идет – все очень быстро меняется и развивается, особенно в нашей сфере. Поэтому мы выступили с инициативой, которая была поддержана не только профессиональным сообществом, но и Федеральным агентством по делам национальностей, республиканским правительством, Ассоциацией финно-угорских народов России. Непосредственными организаторами форума стали Министерство национальной политики Коми и республиканская академия госслужбы и управления.

На базе академии госслужбы функционирует наш Центр инновационных языковых технологий, включающий Бюро официального перевода и Межрегиональную лабораторию информационной поддержки функционирования финно-угорских языков. Лаборатория считается лидером в стране по созданию информационных продуктов, ресурсов, инструментария, которые способствуют расширению функционирования языков, сохранению и пропаганде этнокультурного наследия коми и других финно-угорских народов, развитию международных коммуникаций, электронных продуктов на коми языке для сферы общего образования, обеспечению доступа к информационным ресурсам этнокультурной направленности. Продукты лаборатории активно используются пользователями не только в республике, но и за ее пределами.

– Для чего нужно развивать в интернете письменность малочисленных народов?

– А для чего нужна письменность, которую создали наши предки? Электронная письменность — это просто вид письменности, только не на традиционных бумажных или других носителях, а в виртуальном пространстве. Сейчас уже никто не представляет себе жизни без интернета. Поэтому очень важно, чтобы любой человек мог найти информацию и писать на своем языке. С другой стороны, в более глобальном смысле – в эпоху интернета, мощного развития IT-технологий и создания единого информационного пространства проблема сохранения малых языков, в том числе и уральских, встает острейшим образом не только в сфере их традиционного использования, но и с точки зрения наличия их электронной письменности. Создание и развитие электронной письменности – важнейший фактор выживания миноритарных языков в условиях процесса глобализации, залог сохранения культурного и языкового разнообразия.

– Как проходит жизнь малочисленных народов в виртуальном пространстве?

– Я бы отошла от термина «малочисленные», потому что речь идет не только о них, а практически о большинстве национальных языков страны. Сейчас активно ведутся научные исследования и практические разработки по созданию базового инструментария для функционирования малых языков Российской Федерации в электронном информационном пространстве (раскладки клавиатуры, системы проверки орфографии, электронные словари, образовательные продукты, онлайн-библиотеки и т.д.), начинается развитие корпусной лингвистики, языкового документирования. Региональные исследования и разработки находятся на разных стадиях: некоторые уже на продвинутом уровне (создан весь инструментарий, активно функционирует в интернет-пространстве, создаются национальные корпусы языков, машинные переводчики и т.д.), но основная масса малых языков находится на базовом уровне (только еще разрабатывается базовый инструментарий). Поэтому одна из целей будущей конференции в том, чтобы избежать дублирования работы.

Помимо этого, ощущается серьезный недостаток оптимальных стандартов и показателей оценки для всех малых языков, в том числе языков с государственной поддержкой, поэтому любая работа по оптимизации в данной сфере всемерно приветствуется. Для этого на конференции нужно обсудить вопрос о создании ассоциации по языковой технологии и компьютерной лингвистике для уральских языков и о разработке программы развития электронной письменности уральских народов.

– Республика Коми считается одним из лидеров в развитии электронной письменности малых народов. Заслуга в этом принадлежит вашей лаборатории, которая существует не так уж много лет. Но за короткий период вы успели сделать очень много. Можете рассказать о своих достижениях?

– Пять лет – это все-таки небольшой срок для создания работающего предприятия и его раскрутки. Но за это время сделана колоссальная работа, за которую я благодарна своим сотрудникам, которые, не жалея ни сил, ни времени, во многом даже за счет энтузиазма создают день за днем новые продукты и сервисы. Со многими из них пользователи уже знакомы и активно пользуются. Это в основном раскладки, электронные онлайн– и офлайн-словари, системы проверки правописания, конвертеры, автоматическая система переноса слов коми языка со строчки на строчку, национальный корпус коми языка, коми онлайн-библиотека и многое другое. Все продукты можно увидеть на нашем сайте или выйти на них по ссылкам с сайта миннаца Коми, где есть подрубрика «Коми язык и современные технологии». Все наши разработки предоставляются пользователям бесплатно.

Получено три свидетельства о государственной регистрации «Коми раскладки клавиатуры для Виндоус», «Веб-сервиса проверки правописания» и «Национального корпуса коми языка».

Значимость и эффективность деятельности лаборатории, высокий профессиональный уровень ее сотрудников признаны на межрегиональном и международном уровнях. К нашим специалистам обращаются из других регионов России: Удмуртии, Марий Эл, Алтая, Башкортостана, Тывы. В сотрудничестве созданы электронные словари для марийского, удмуртского языков; орфосервисы для удмуртского, марийского, чувашского языков; раскладки клавиатуры для удмуртского, марийского, алтайского, тувинского языков; параллельно с коми языком создаются продукты для коми-пермяцкого языка. В последнее время к лаборатории обращаются регионы страны с просьбой о проведении тематических обучающих семинаров по созданию определенных электронных продуктов.

Сотрудники лаборатории активно участвуют в международных проектах и мероприятиях, ведется активное сотрудничество с зарубежными партнерами: Центром саамских языковых технологий университета из Тромсе (Норвегия), университетом города Фрайбург (Германия), университетом города Уппсала (Швеция) и т.д.

На прошедшем в этом году Всемирном конгрессе финно-угорских народов в Лахти основной доклад по направлению «Финно-угорское информационное пространство: перспективы развития» было поручено сделать именно Центру инновационных языковых технологий. В резолюции конгресса дано предложение о создании международной ассоциации по поддержке электронной письменности уральских языков. Нас активно включают в различные мероприятия международного, всероссийского уровней, в состав оргкомитетов международных конференций по компьютерной лингвистике уральских языков, по сохранению и развитию финно-угорских языков, по расширению международного сотрудничества в сфере науки.

– Над чем вы сейчас работаете в лаборатории и какие планы на будущее?

– Сейчас мы занимаемся пополнением текстовой базы национального корпуса коми языка. К концу 2016 года массив текстов должен достигать 30 миллионов словоупотреблений. Создается электронная библиотека на коми языке и коми-пермяцком языке. Презентация коми онлайн-библиотеки прошла в начале октября. Ведутся работы по созданию онлайн-медиатеки по коми языку, которая нашла поддержку нашего миннаца и Федерального агентства по делам национальностей. Это видео– и аудиотексты с расшифровкой на коми, русском и английском языках. Ее презентация запланирована на 14 декабря. Для работы нам не хватает только времени, ресурсов и консолидированности.

У нас очень много планов, мы знаем, что делать, однако теми небольшими человеческими и финансовыми ресурсами, которые мы имеем, нереально все сделать. И время является очень важным фактором – в сфере компьютерной лингвистики все очень быстро меняется, и что сегодня кажется далеким будущим, завтра может оказаться вчерашним днем. А согласованности не хватает среди структур, чья деятельность так или иначе связана с функционированием коми языка. Например, систему автоматической проверки правописания мы не можем закончить из-за того, что надо обновлять и облегчать правила орфографии коми языка. Или было бы очень хорошо, если бы мы смогли включить в коми онлайн-библиотеку художественные тексты из школьной программы или сделать электронные версии имеющихся словарей – при условии предоставления таких прав со стороны авторов и издательств и многое другое. Мы создаем эти продукты не для себя, а для всех, чтобы у всех была возможность знакомиться, пользоваться ими.

Артур АРТЕЕВ при содействии Министерства национальной политики РК

Добавить комментарий