llm.
# Vibe Coding под прицелом: Claude Opus 4.5 против китайского GLM-4.7 в бою за транскрибацию GigaAM
Vibe Coding под прицелом: Claude Opus 4.5 против китайского GLM-4.7 в бою за транскрибацию GigaAMСсылка на мой итоговый проект: https://github.com/yaruslove/DialogScribe
Когда нейросеть решит то, что не решил никто?
В середине 2024 года GPT-4 спотыкался на школьных задачах, а к концу 2025-го модели щёлкали олимпиадные как орехи. Полтора года, и мы преодалели дистанцию от «найди икс» до «докажи теорему». Epoch AI решили заглянуть еще дальше
Veai 5.3: новые режимы агента, личный кабинет и выбор модели LLM
В Veai 5.3 появился личный кабинет и возможность выбрать модель LLM для индивидуальных пользователей, добавлены режимы работы агента (Modes) и обновлён интерфейс для более удобной работы.Личный кабинет для индивидуальных пользователейЗдесь пользователь может видеть баланс токенов и срок их действия, управлять подпиской, знакомиться с документацией и связаться с командой. Бесплатный 30-дневный пробный период активируется при регистрации в личном кабинете.
PT BlackBox Scanner помогает разработчикам устранять уязвимости в веб-приложениях с помощью ИИ
Positive Technologies, одна из лидирующих компаний в области результативной кибербезопасности, интегрировала в общедоступный облачный DAST-анализатор веб-приложений (сайтов) PT BlackBox Scanner
Интеграция coding-агента с MCP-сервером Idea
В IntelliJ Idea (а, значит, и в OpenIDE) есть встроенный MCP-сервер. Активируется он достаточно просто и позволяет расширять стандартную функциональность command-line кодинговых агентов, таких как платный Claude Code или бесплатный, но тоже весьма неплохой Qwen Code
Полезные агенты на платформе MWS GPT
Как выглядят полезные агенты по версии Nano BananaПривет, Хабр! В прошлом материале
LLM против экономии масштаба: что это значит для глобализации
XX век: экономия масштаба → концентрация → глобализация. XXI век: ...?В предыдущей статье я разбирал, почему 95% корпоративных пилотов по внедрению LLM проваливаются, а фрилансеры при этом увеличивают продуктивность в разы. Вывод был простой: конфликт интересов между работником и компанией блокирует внедрение.Но это микроуровень — одна компания, один работник. Если экстраполировать те же механизмы на уровень экономик и стран, картина становится интереснее. И тревожнее.
Доматчинг товаров с использованием LLM: от промптов до квантизации
Привет, Хабр! На связи команда продуктового матчинга ecom.tech. Наша команда решает задачи поиска, группировки и сопоставления товаров с помощью алгоритмов машинного обучения. Все это необходимо для развития и улучшения бизнес-процессов в компании, а именно быстрого заведения карточек товаров, мониторинга цен на товары и развития ML. В этой статье мы расскажем про доматчинг – сравнение сложных пар товаров, которые отобрали на предыдущем этапе пайплайна, с помощью LLM. Поехали!
Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026
Или как я потратил неделю, чтобы доказать: ИИ сегодня — это красноречивые лжецы в костюмах экспертов.В конце 2025 года я устал читать маркетинг в стиле «наша модель умнее ChatGPT на 15%». Умнее по какому бенчмарку? MMLU? Это всё равно что мерить интеллект человека по результатам ЕГЭ.Я решил проверить одну простую вещь: способна ли нейросеть сказать «я не знаю»?Потому что в реальном мире — в медицине, праве, финансах — ответ «я не уверен» стоит дороже любой красивой, но выдуманной истории.Ниже — результаты слепого тестирования 14 топовых LLM (включая Claude 4.5, GPT-5.2, Gemini 3, Qwen, YandexGPT и

