Маршрутизация LLM: оптимизация путей обработки языка
Повышение эффективности и производительности через инновационные стратегии маршрутизации.ИсточникЧто такое LLM Routing?В стремительно развивающемся мире искусственного интеллекта большие языковые модели (LLM)
MiniMax-M2 уже доступна в плагине Koda для VS Code и в Koda CLI. Можно попробовать бесплатно
MiniMax выпустили обновление своей флагманской модели, и она уже доступна в Koda.MiniMax M2 — новая языковая модель от компании MiniMax, ориентированная на использование в «агентах» и для программирования.Акцентируют внимание на трёх ключевых способностях: программирование, использование инструментов (toolcalling) и глубокий поиск/поиск через данные.Бьет по метрикам в коддинг предыдущего лидера из опенсорc - GLM 4.6. Так же уверенно бьет DeepSeek.
Pov-real: непопулярные мнения об индустрии genAI
Привет, Хабр! На связи Just AI, и сегодня мы собрали для вас непопулярные мнения экспертов индустрии на тему genAI. Зачем? Потому что новости о прорывных технологиях, многомиллиардных инвестициях и стартапах появляются почти каждый день – сложно не утонуть в этом потоке и понять, где реальная ценность, а где просто хайп. Критическое мышление – наше все!В нашем телеграм-канале мы устроили челлендж «pov/real»
Pov-real: развеиваем мифы об индустрии genAI и делимся непопулярными мнениями экспертов
Привет, Хабр! На связи Just AI, и сегодня мы собрали для вас непопулярные мнения экспертов индустрии на тему genAI. Зачем? Потому что новости о прорывных технологиях, многомиллиардных инвестициях и стартапах появляются почти каждый день – сложно не утонуть в этом потоке и понять, где реальная ценность, а где просто хайп. Критическое мышление – наше все!В нашем телеграм-канале мы устроили челлендж «pov/real»
НПФ «Будущее» и ITFB Group автоматизировали 142 тысячи документов с ITFB EasyDoc
НПФ «Будущее» и ITFB Group завершили крупнейший в России проект по интеллектуальному распознаванию и обработке документов. На базе платформы
Я спросил у ясеня… (закуётся ли он в железо)
Точнее спросил у ChatGPT. Он ответил мне - ясен пень.
Обзор проблем и решений в ризонинговых LLM. Часть 3
В первой части мы рассмотрели ключевые проблемы логического рассуждения в LLM и показали, в чём именно модели ошибаются.Во второй части узнали, какие существуют методы решения LLM логических задач, а также посмотрели на их сильные и слабые стороны. В этой – мы обсудим, как модели иногда идут вразрез с собственной логикой и что эксперты предпринимают, чтобы это исправить.ЛОГИЧЕСКАЯ СОГЛАСОВАННОСТЬ
Обзор проблем и решений в ризонинговых LLM. Часть 2
В первой части мы рассмотрели ключевые проблемы логического рассуждения в LLM и показали, в чём именно модели ошибаются.В этой – мы обсудим методы, с помощью которых LLM решают логические задачи, включая внешние решатели, подсказки и обучение на логических примерах, а также их сильные и слабые стороны.Логическое решение вопросовДля проверки того, как LLM решают логические задачи, мы создали разные тестовые наборы
Как собрать датасет фотографий с помощью LLM: опыт вайб-фильтров
Когда к тебе приходит продакт-менеджер и говорит: «Мне нужны фотографии с романтическим вайбом!», ты, конечно, киваешь. Но в голове с этого момента — не просто набор условий, а попытка нащупать настроение. То, которое не описывается одним словом. Это может быть приглушённый свет в номере, может — зажжённые свечи на столе, а может — парень с девушкой, обнявшиеся на фоне заката.Что такое «
Как мы в Авито сделали свою LLM — A-vibe
Всем привет! Меня зовут Анастасия Рысьмятова, я руковожу юнитом LLM в Авито.В этой статье я расскажу, как мы с командой создали и адаптировали нашу большую языковую модель A-vibe: зачем решили развивать собственную LLM, как построили токенизатор, собрали датасеты, провели SFT и RL и что получили в итоге. Поделюсь основными экспериментами и покажу наши результаты.Сегодня мы выпустили в опенсорс свое семейство генеративных моделей – A-Vibe и A-Vision, статья приурочена к этому событию.

