Недавно инженеры Сбера выпустили модель нейронной сети ruGPT-3.5, которая служит основой для сервиса GigaChat, который в настоящее время находится на стадии закрытого тестирования.
Существенным недостатком открытых моделей больших языков является их ограниченная поддержка русского языка. Как правило, они опираются на русскоязычный раздел Википедии и ограниченный пул общедоступных текстов, что негативно сказывается на понимании языка моделью и качестве ее ответов».
Интересно наблюдать за прогрессом в области обработки естественного языка с выпуском Сбером нейросетевой модели ruGPT-3.5. Тот факт, что он используется для службы GigaChat, показывает его потенциал в улучшении диалогового взаимодействия. Однако беспокойство по поводу ограниченной поддержки русского языка в таких моделях справедливо. Адекватные лингвистические ресурсы имеют решающее значение для владения языковой моделью, и расширение набора данных для русского языка может значительно улучшить ее понимание и качество ответов. Поскольку технологии продолжают развиваться, устранение таких языковых ограничений становится все более важным для создания более всеобъемлющих и точных языковых моделей.