llm. - страница 33

llm.

Джейн — AI-ассистент преподавателя урбанистики: как мы создали помощника для ИТМО за 10 дней

Привет! Мы — команда StreetCode. На хакатоне AI Product Hack ducation мы решили проверить, может ли AI не просто помогать студентам, а понимать контекст академической дисциплины. Так появился Джейн — AI-ассистент преподавателя урбанистики, созданный для Университета ИТМО.За десять дней мы прошли путь от идеи до работающего прототипа: сформулировали гипотезу, построили RAG-архитектуру, внедрили систему проверки безопасности и протестировали бота на реальных студенческих работах.В этой статье расскажем, какую проблему мы решали, как устроен ассистент изнутри и что показали на финале хакатона.

продолжить чтение

Artificial Analysis обновили свой Intelligence Index

В новых тестах неожиданно выстрелил Gemini 3 Pro Preview. По половине бенчмарков у модели не просто небольшой прирост, а заметный скачок вперёд.Фактические знания и галлюцинацииGemini 3 Pro Preview занимает 1-е место в 5 из 10 тестов Artificial Analysis Intelligence Index:GPQA Diamond, MMLU‑Pro, HLE, LiveCodeBench и SciCode.Самый показательный результат — 37% в Humanity's Last Exam (сложный экзамен «на последнюю попытку человечества»). Это на 10+ п.п. выше предыдущего лучшего результата — для такого класса задач это большой отрыв, а не статистический шум.»Отдельно модель лидирует в AA‑Omniscience, новом комплексном бенчмарке знаний и галлюцинаций:

продолжить чтение

Генерация BPMN с помощью LLM в диалоговом режиме: эксперименты и выводы

От переводчика: Авторы свежей научной работы попробовали заставить обычные открытые LLM (от 1B до 70B) генерировать валидный BPMN-XML прямо в чате по текстовому описанию процесса.Если вкратце, то без дообучения — полный провал. 80% токенов тратится на XML-мусор, модели сыплются на синтаксисе, забывают ветки и галлюцинируют теги. Работает только на больших моделях и то не очень хорошо.Но вроде просматривается рабочий вариант для генерации BPMN — берем 7–13B модель, дообучаем через LoRA/QLoRA на нормальном датасете, переходим на компактный JSON вместо XML и добавляем Preference Tuning + CoT. Тогда может быть взлетит.

продолжить чтение

Почему favicon важнее, чем вы думаете

Команда JavaScript for Devs подготовила перевод истории о том, как маленькая деталь — favicon — может рассказать о продукте больше, чем кажется. От первой раздражённой мысли до полноценной игры, которая проверяет ваш глаз на внимательность к мелочам, автор прошёл путь через данные, ИИ, категории, боль деплоя и удивительное открытие: интернет уже не тот, что раньше. Оцените, насколько хорошо вы знаете любимые сайты — и их крошечные значки.

продолжить чтение

Как работает наша LLM-платформа MWS GPT

продолжить чтение

Вышел Gemini 3.5. Я решил проверить, так ли он силен, и устроил ему «Голодные игры» против GPT-5 и Claude

«Голодные игры» моделей

продолжить чтение

Koda CLI: AI-помощник прямо в терминале – бесплатно, без VPN, с топовыми моделями

Мы в Koda верим, что современные инструменты должны быть доступны каждому разработчику, независимо от инфраструктурных ограничений, VPN или способов оплаты. Поэтому после релиза Koda для VS Code мы сделали следующий шаг – представляем Koda CLI.

продолжить чтение

Что такое платформа оркестрации Voice AI

Краткое содержаниеПлатформа оркестрации голосового ИИ

продолжить чтение

Мультимодальный AI в 2025: как GPT‑5.1, Gemini, Claude и Grok научились понимать текст, изображения и видео одновременно

Ещё совсем недавно для каждого домашнего устройства у вас был свой пульт: один для телевизора, другой для кондиционера, третий для музыкального центра. Каждый говорил на своём языке, и заставить их работать вместе было почти невозможно. Примерно так же выглядел мир искусственного интеллекта всего пять лет назад — набор мощных, но разрозненных моделей, каждая из которых умела что‑то одно.

продолжить чтение

Бустим Transformer-модель через адаптивную TSCO-архитектуру

Не так давно я писал про наш проект SemantML и про нейродинамическую архитектуру. Хочется поделиться последними результатами развития архитектуры и показателями нашей модели на основе синтеза классических трансформеров и нейродинамики в проведенных бенчрмарках в сравнении с классическим Трансформером.

продолжить чтение

Rambler's Top100