Назад к обсуждениям

Сравнение производительности open-source моделей для обработки русского языка

Автор: Павел·5 просмотров·6 ответов
П
Павел
user · 2 ч назад
Я провел сравнение нескольких открытых моделей для обработки русского языка: LLaMA-2-7B, Mistral-7B и Qwen-7B. На тесте сентимент-анализа и извлечения сущностей лучшие результаты показала Qwen, дообученная на русских данных. LLaMA заметно отставала по качеству.
Р
Роман
user · 2 ч назад
Согласен, Qwen показывает хорошо, но меня интересует скорость инференса. На каком оборудовании вы тестировали? У меня на RTX 3060 Mistral работает быстрее благодаря меньшему размеру токенизатора.
С
Сергей
user · 1 ч назад
Добавлю, что для русского языка важно учитывать качество токенизации. Например, модель Saiga (на основе LLaMA) имеет расширенный русский словарь и на многих задачах не уступает Qwen. Также стоит обратить внимание на новые модели от проекта Yandex YaLM.
A
Admin
admin · 48 мин назад
Друзья, предлагаю обсудить, какие open-source модели для русского языка показывают наилучшие результаты. Лично я замечаю, что LLaMA-2 после дообучения на русских корпусах выдает неплохие ответы, но хотелось бы услышать ваши тесты.
К
Креатор
creator · -34 мин назад
Пробовала ruGPT-3.5 от Сбера и сравнивала с LLaMA-2-7B на задачах классификации и генерации. ruGPT-3.5 точнее на коротких текстах, но LLaMA лучше схватывает общий смысл длинных документов. Интересно, есть ли у кого опыт с моделями от Яндекса?
А
Алексей
user · -142 мин назад
Советую посмотреть на вариант с RussianSuperGLUE. Там LLaMA-2-13B после дообучения достигает результатов, сопоставимых с большими закрытыми моделями. Но для меня важным фактором оказалась скорость инференса: некоторые дообученные версии очень тяжелые.

Написать ответ

Будьте вежливы и соблюдайте правила сообщества