«Он не станет волшебной пилюлей» — лингвист об ИИ в национальном словаре казахского языка
На прошлой неделе Мажилис принял поправки в закон «О культуре», предусматривающие создание национального цифрового фонда казахского языка. Эта мера позволит развивать государственный язык с помощью искусственного интеллекта. Об использовании ИИ в лингвистике, сложностях изучения казахского и переходе на латиницу корреспонденту Taspanews.kz рассказал писатель и автор методики «Ситуативный казахский» Канат Тасибеков.
Искусственный интеллект
Тасибеков считает, что создание национального фонда казахского языка с использованием искусственного интеллекта — безусловно правильное решение, поскольку использование ИИ, ChatGPT — это влияние времени.
«Я сам общаюсь с ChatGPT на казахском языке. Он отвечает грамотно, с хорошей дикцией, особых нареканий к нему нет. Есть также много сервисов, которые переводят голосовую запись. Я сам часто пользуюсь такими функциями, так как работаю, в основном, в социальных сетях. Для написания большого текста чаще всего форматирую голос в письмо. То есть, ИИ сейчас настолько грамотный и оптимальный, что порой достаточно внести в его ответ всего пару правок и на этом все. Следовательно, и с использованием ИИ для учреждения национального фонда казахского языка, думаю, никаких проблем не возникнет»,
Тасибеков отметил, что решение о создании такого фонда и словаря говорит об углубленной работе правительства над государственным языком,
«Это не может не радовать. Это нужно. Необходимо шагать в ногу со временем. Сейчас практически все используют ИИ. Шаг своевременный, который я, как и многие лингвисты, приветствую»,
Однако Тасибеков обратил внимание на то, что сервер будет лишь помогать в изучении языка.
«Он не станет волшебной пилюлей, которую все ждут. Взял, проглотил, выучил язык: такого не будет. Изучение языка — это большой интеллектуальный труд»,
Такое средство, считает Тасибеков, не заменит собственные усилия, но их можно будет совмещать. Общество в Казахстане разделено по языку: это видно в жизни, умалчивать об этом нельзя. Поэтому многие русскоязычные, которые изучают казахский, часто жалуются, что у них нет языковой среды для практики, потому что не с кем говорить. ИИ может с этим помочь — стать готовым собеседником.
«Иногда я сам в Zoom провожу занятия казахского языка и могу точно сказать, что ничто не заменит личного контакта. Но преимущество ИИ в том, что доступ к нему повсеместен в любое время суток»,
Создание задуманного фонда-словаря, по мнению лингвиста, направлено на то, чтобы увеличить общий массив знаний о казахском языке в глобальной сети.
«Почему интернет и онлайн-переводчик иногда допускает крайне грубые ошибки при переводе? Потому что недостаточно базы. ИИ ведь генерирует информацию на основе того, что уже есть в сети. Словарь поможет заполнить эти „дыры“»,
Сложность казахского
Эксперт уверен, что казахский язык действительно сложен для изучения. К примеру, в казахском нет родов. Язык плохо осваивается, хотя грамматика, в сравнении с русским, гораздо проще, меньше исключений.
«Но есть момент контекста. Например, слово может иметь несколько смыслов в зависимости от контекста разговора. Язык очень богат на синонимичный род. Я уже 52 слова собрал, которые могут обозначать человека невысокого роста. Я сам невысокий и однажды этим вопросом заинтересовался. Конечно, для человека из российской глубинки казахский будет очень тяжел, но если мы говорим о русскоязычном языке с нулевым уровнем, но из Казахстана, то это уже совсем другой разговор»,
Лингвист считает, что половина русскоязычных в Казахстане не говорит на казахском, но понимают, о чем говорят, потому что живут в этой среде и часто слышат этот язык; нет граждан с совсем нулевым уровнем, какая-то база есть у всех.
Концепция языка
Писатель добавил, что фонды, национальные словари и курсы — это прекрасно, но в Казахстане, помимо прочего, нет стройной концепции языковой политики, рассчитанной на годы вперед. Все в основном делается путем компонентов: например, появился на западе ИИ, значит нужно его применить.
«У нас так много слов синонимичных, которые имеют много схожестей в написании. Слово „журналист“ вызывает так много дискуссий в обществе, потому что очень много вариантов написания и перевода»,
Лингвист уверен, что данные сложности должен был упростить переход на латиницу. Были затрачены средства, проводились диктанты на национальном уровне, «а сейчас все почему-то застопорилось» — нет последовательности. Следовательно, учреждение национального словаря должно идти в ногу с модернизацией самого языка, а значит и с переходом на латиницу.
«Даже выдумывать ничего не нужно, это все уже было сделано до нас. Еще в Турции Ататюрк решил турецкий язык очистить от множества заимствованных арабских и персидских слов: он стандартизировал язык, перевел его с арабского письма на латиницу, сделал понятным для всех людей. Сейчас турецкий это также мировой язык, язык и культуры, и науки. Переход на латиницу совершенно абсолютно нужен. Не нужно метаний, нужна стратегия и последовательность»,