Технологическая платформа Авито выпускает в опенсорс обновленные версии собственных ИИ-моделей: текстовую A-Vibe и мультимодальную A-Vision с 8 млрд параметров. Это первые открытые нейросети от российской компании, обученные специально для электронной коммерции и адаптированные под русский язык. Разработчики, стартапы, бизнес и исследователи смогут получить готовые инструменты для анализа документов, автоматизации контента и создания ИИ-ассистентов, сокращая затраты на запуск и работу моделей до 50% в сравнении с другими опенсорс-нейросетями.
Модели оснащены собственным токенизатором и поддерживают возможность вызова внешних инструментов (function calling) для создания автономных систем и агентов. В разработку компания проинвестировала около полумиллиарда рублей, включая затраты на оборудование, команду и эксперименты. A-Vibe заняла первое место в классе легких нейросетей в популярных открытых тестах на понимание русского языка, работы с кодом и решение сложных задач. Модели доступны под открытой лицензией Apache 2.0 для любого использования.
"Открытие наших генеративных ИИ-моделей — это инвестиция в будущее российской технологической экосистемы. Благодаря таким инициативам ИИ становится доступным не только корпорациям, но и студентам, стартапам, исследователям и небольшим командам. Чем больше разработчиков вовлечено в создание ИИ-решений, тем быстрее развивается вся отрасль. Мы хотим внести свой вклад в этот процесс", — Андрей Рыбинцев, управляющий директор по искусственному интеллекту "Авито".
Возможности моделей
Текстовая A-Vibe и мультимодальная A-Vision созданы Авито Тех, дочерней технологической компанией Авито, на базе открытых моделей Qwen3 и Qwen2.5-VL с 8 млрд параметров, и глубоко адаптированы под российский рынок. Команда Авито разработала собственный токенизатор для русского текста — это ускоряет генерацию текста почти вдвое и делает результаты точнее, чем у зарубежных аналогов.
Модели обучались на реальных данных, в том числе из электронной коммерции. Поэтому они понимают контекст онлайн-торговли и эффективно работают с товарными описаниями, каталогами, запросами покупателей — без долгой адаптации под конкретный бизнес.
Нейросети работают с большими объемами текста — до 100 страниц за раз (32 тысячи токенов). Они готовы к использованию без сложной настройки: понимают простые команды, например: "сделай резюме документа" или "проанализируй таблицу" без дополнительных инструкций. Поддержка вызова внешних инструментов (function calling) позволяет создавать ИИ-агентов, которые не только отвечают на вопросы, но и сами выполняют действия за пользователя: ищут информацию в базах данных, делают расчеты, обращаются к другим сервисам по API.
Для каких задач будут полезны модели
Модели уже внедрены во многие сервисы Авито и теперь становятся доступными для образования, науки и бизнеса. Они подойдут как небольшим командам и стартапам, так и крупным компаниям или исследовательским центрам.
- Бизнес сможет быстро внедрять ИИ с минимальными затратами: автоматизировать обработку документов, генерацию контента, создать чат-бота для клиентов.
- Разработчики получат возможность дообучать модели под конкретные задачи и экспериментировать, разворачивая их на своей инфраструктуре без больших затрат.
- Образование — студенты и преподаватели смогут работать с промышленными ИИ-моделями в обучении и исследованиях.
- Наука — исследователи получат новые инструменты для изучения мультимодальных технологий и развития российской экосистемы ИИ.
"Рынок остро нуждается в качественных русскоязычных моделях с открытым кодом. Компании тратят месяцы на адаптацию зарубежных решений под российские реалии. Мы даем готовые инструменты, которые экономят миллионы рублей на разработке. Наши модели компактны и оптимизированы для эффективного использования ресурсов, что особенно важно для стартапов и образовательных инициатив", — Анастасия Рысьмятова, руководитель разработки больших языковых моделей "Авито".
Сравнение с другими популярными моделями
Большинство международных тестов для оценки языковых моделей созданы для английского языка и не подходят для объективной оценки качества работы на русском. Команда Авито перевела на русский четыре ведущих международных бенчмарка и выложила их в открытый доступ для всех разработчиков русскоязычных моделей:
- MATH-500 — сложные математические задачи школьного и вузовского уровня, требующие многошагового решения
- GPQA Diamond — научные вопросы уровня кандидата наук по физике, биологии, химии и другим дисциплинам
- DROP_RU — задачи на понимание текста с рассуждениями и вычислениями
- BFCL V3 — оценка способности модели работать с внешними инструментами для создания ИИ-агентов.
На популярных российских бенчмарках MERA и RU Arena Hard модель A-Vibe заняла первое место в классе лёгких нейросетей и опередила многие более крупные модели. Она показала сильные результаты в работе с кодом и отраслевых задачах. A-Vision эффективно справляется с анализом сложных документов, графиков, изображений с текстом и научных схем.
Модели доступны на платформе Hugging Face с подробной документацией и примерами использования. Команда также опубликовала техническую статью с разбором обучения и тестирования.
Последние комментарии
Учитывая потенциал рынка, долю компании - смело буду заходить, а там посмотрим. Некоторые недовольства тут смешно читать, но есть и адекватные сомнения. В любом случае, инвестиции - риск, но джету доверяю, и вижу развитие компании. Роман Хорошев, кстати, очень открыт, дает много интервью перед очень важным шагом компании, открыто отвечает на вопросы, что так же радует.
У компании большие шансы для роста, верю в успех)