llm-модели. - страница 3

Маршрутизация LLM: оптимизация путей обработки языка

Повышение эффективности и производительности через инновационные стратегии маршрутизации.ИсточникЧто такое LLM Routing?В стремительно развивающемся мире искусственного интеллекта большие языковые модели (LLM)

продолжить чтение

MiniMax-M2 уже доступна в плагине Koda для VS Code и в Koda CLI. Можно попробовать бесплатно

MiniMax выпустили обновление своей флагманской модели, и она уже доступна в Koda.MiniMax M2 — новая языковая модель от компании MiniMax, ориентированная на использование в «агентах» и для программирования.Акцентируют внимание на трёх ключевых способностях: программирование, использование инструментов (tool­calling) и глубокий поиск/поиск через данные.Бьет по метрикам в коддинг предыдущего лидера из опенсорc - GLM 4.6. Так же уверенно бьет DeepSeek.

продолжить чтение

Pov-real: непопулярные мнения об индустрии genAI

Привет, Хабр! На связи Just AI, и сегодня мы собрали для вас непопулярные мнения экспертов индустрии на тему genAI. Зачем? Потому что новости о прорывных технологиях, многомиллиардных инвестициях и стартапах появляются почти каждый день – сложно не утонуть в этом потоке и понять, где реальная ценность, а где просто хайп. Критическое мышление – наше все!В нашем телеграм-канале мы устроили челлендж «pov/real»

продолжить чтение

Pov-real: развеиваем мифы об индустрии genAI и делимся непопулярными мнениями экспертов

Привет, Хабр! На связи Just AI, и сегодня мы собрали для вас непопулярные мнения экспертов индустрии на тему genAI. Зачем? Потому что новости о прорывных технологиях, многомиллиардных инвестициях и стартапах появляются почти каждый день – сложно не утонуть в этом потоке и понять, где реальная ценность, а где просто хайп. Критическое мышление – наше все!В нашем телеграм-канале мы устроили челлендж «pov/real»

продолжить чтение

НПФ «Будущее» и ITFB Group автоматизировали 142 тысячи документов с ITFB EasyDoc

НПФ «Будущее» и ITFB Group завершили крупнейший в России проект по интеллектуальному распознаванию и обработке документов. На базе платформы 

продолжить чтение

Я спросил у ясеня… (закуётся ли он в железо)

Точнее спросил у ChatGPT. Он ответил мне - ясен пень.

продолжить чтение

Обзор проблем и решений в ризонинговых LLM. Часть 3

В первой части мы рассмотрели ключевые проблемы логического рассуждения в LLM и показали, в чём именно модели ошибаются.Во второй части узнали, какие существуют методы решения LLM логических задач, а также посмотрели на их сильные и слабые стороны. В этой – мы обсудим, как модели иногда идут вразрез с собственной логикой и что эксперты предпринимают, чтобы это исправить.ЛОГИЧЕСКАЯ СОГЛАСОВАННОСТЬ

продолжить чтение

Обзор проблем и решений в ризонинговых LLM. Часть 2

В первой части мы рассмотрели ключевые проблемы логического рассуждения в LLM и показали, в чём именно модели ошибаются.В этой – мы обсудим методы, с помощью которых LLM решают логические задачи, включая внешние решатели, подсказки и обучение на логических примерах, а также их сильные и слабые стороны.Логическое решение вопросовДля проверки того, как LLM решают логические задачи, мы создали разные тестовые наборы

продолжить чтение

Как собрать датасет фотографий с помощью LLM: опыт вайб-фильтров

Когда к тебе приходит продакт-менеджер и говорит: «Мне нужны фотографии с романтическим вайбом!», ты, конечно, киваешь. Но в голове с этого момента — не просто набор условий, а попытка нащупать настроение. То, которое не описывается одним словом. Это может быть приглушённый свет в номере, может — зажжённые свечи на столе, а может — парень с девушкой, обнявшиеся на фоне заката.Что такое «

продолжить чтение

Как мы в Авито сделали свою LLM — A-vibe

Всем привет! Меня зовут Анастасия Рысьмятова, я руковожу юнитом LLM в Авито.В этой статье я расскажу, как мы с командой создали и адаптировали нашу большую языковую модель A-vibe: зачем решили развивать собственную LLM, как построили токенизатор, собрали датасеты, провели SFT и RL и что получили в итоге. Поделюсь основными экспериментами и покажу наши результаты.Сегодня мы выпустили в опенсорс свое семейство генеративных моделей – A-Vibe и A-Vision, статья приурочена к этому событию.

продолжить чтение

123456...10...18
Rambler's Top100