yandexgpt.

Кириллица в LLM: почему русский язык в нейросетях стоит дороже и работает медленнее

Когда вы пишете запрос в ChatGPT или другую нейросеть, она не работает с буквами или словами — она режет ваш текст на маленькие кусочки. Эти кусочки называются токенами, и от того, как именно нейросеть режет текст, зависит цена ответа, скорость, и сколько информации в неё помещается за раз. С английским это работает хорошо: одно слово — обычно один‑два кусочка. С русским всё хуже: то же самое слово часто превращается в три‑четыре обрывка. Английское «contract» — один токен. Русское «разработка» — два‑три. «Программирование» — три‑четыре.

продолжить чтение

Робот, способный создать себя сам. Режим «Инженера» в робототехнике

Футурологи часто предвещали будущее, в котором роботы способны сами проектировать и создавать себе апгрейды, прошивать новые модули, настраивать стороннюю технику и даже создавать себе подобных. Насколько это близко к реальности? С текущим темпом развития ИИ вопросы отпадают всё быстрее. Вряд ли кто-то сегодня усомнится, что ИИ способен написать код, самостоятельно отладить и протестировать его. Но с какими ограничениями и рисками придётся столкнуться на практике? Расскажу на примере реализации в проекте OpenGrall.

продолжить чтение

Мультиагентная система без LangChain: почему абстракции ломаются и как строить production на чистом Python

ВведениеLangChain обещает красивую жизнь: переключите модель одной строкой, подключите RAG за две, дайте агенту инструменты за три. На лендинге всё выглядит как конструктор LEGO — берёшь кубики, соединяешь, работает. На хакатоне это действительно так. В production — не совсем.Тезис «LangChain — overhead для production» не нов. Его обсуждают в каждом втором треде на Reddit и в комментариях на Хабре. Компания Octomind

продолжить чтение

Антиспам на нейронках: Gemini Flash в 1000 раз дешевле чем GigaChat

Сравнение LLM для антиспама

продолжить чтение

Kimi K2.5 наступает на пятки GPT-5.4. И работает из России без VPN

Бенчмарков сейчас – как нейросетей: каждую неделю новый. GPQA Diamond тестирует PhD-знания. Lexometrica проверяет фактическую точность. LLM Persuasion Benchmark – способность убеждать в дебатах. Chatbot Arena – предпочтения живых людей. Резонный вопрос: зачем ещё один?

продолжить чтение

RAG-бот на YandexGPT без Python и оркестраторов. Кейс внедрения «Яндекс Агента» в медицине

Автоматизация клиентского сервиса в медицине — это всегда баланс между точностью данных и скоростью ответа. Рассказываем, как мы создавали для фармацевтической компании «Буарон» умного помощника на базе Yandex Cloud Agent, который обеспечивает круглосуточную обработку запросов и использует связку PHP и WordPress.

продолжить чтение

Россия — третий полюс мирового AI. Агентов запускаем на Raspberry Pi

a16z - один из крупнейших венчурных фондов планеты - выпустил свой ежегодный рейтинг Top 100 AI Apps. И впервые в истории зафиксировал Россию как отдельный полюс на глобальной AI-карте. Три полюса: Запад (ChatGPT, Claude, Gemini), Китай (DeepSeek, Doubao, Kimi), Россия (Алиса, GigaChat).Яндекс Браузер с Алисой - 71 миллион активных пользователей в месяц, топ-10 мировых мобильных AI-приложений. GigaChat от Сбера дебютировал в веб-рейтинге на 48-й позиции.Я прочитал это и на секунду обрадовался. А потом полез в цифры.«Санкции создали вакуум - локальные продукты заполнили»

продолжить чтение

В России запустили сервис для мониторинга упоминаний брендов в YandexGPT и GigaChat

Стартап «Шпиониро» представил инструмент для отслеживания того, как бренды упоминаются в ответах ИИ-ассистентов — YandexGPT, Алисы, GigaChat, ChatGPT и других моделей.

продолжить чтение

Мы протестировали 34 AI-модели на задачах менеджера. Вот что доступно в России без VPN

Каждый производитель LLM заявляет о лидерстве. OpenAI – «самая мощная модель». Anthropic – «самая безопасная». Яндекс – «лучше всех понимает русский». Проверить эти заявления, не потратив месяц на ручное тестирование, – задача нетривиальная. Мы решили попробовать.Обновление от 17 марта 2026. В первой версии статьи модели Grok (xAI) были отнесены к категории «доступны в России без VPN». Это ошибка – x.ai и API Grok заблокированы для российских IP. Мы исправили таблицы и рейтинги. Grok остаётся сильной моделью, но для доступа из России потребуется VPN. Также в исследование добавлена модель GLM-5 от

продолжить чтение

Перспективы национальной LLM. Личное мнение

Полностью самостоятельная разработка LLM дело дорогое, требующее высококвалифицированных кадров (математиков и инженеров), высокопроизводительного оборудования (графических ускорителей, быстрой памяти и процессоров), и, самое главное, наличие школы. Часто эффективные менеджеры недооценивают необходимость опыта в разработке и производстве чего-либо. Наличие желания и денег не всегда приводит к нужному результату.В этой статье я рассмотрю возможное развитие национальной LLM со своей точки зрения, которая, как вы понимаете, может быть ошибочной, либо меняться под давлением обстоятельств.Введение

продолжить чтение