llm. - страница 2

llm.

# Vibe Coding под прицелом: Claude Opus 4.5 против китайского GLM-4.7 в бою за транскрибацию GigaAM

Vibe Coding под прицелом: Claude Opus 4.5 против китайского GLM-4.7 в бою за транскрибацию GigaAMСсылка на мой итоговый проект: https://github.com/yaruslove/DialogScribe

продолжить чтение

Когда нейросеть решит то, что не решил никто?

В середине 2024 года GPT-4 спотыкался на школьных задачах, а к концу 2025-го модели щёлкали олимпиадные как орехи. Полтора года, и мы преодалели дистанцию от «найди икс» до «докажи теорему». Epoch AI решили заглянуть еще дальше

продолжить чтение

Veai 5.3: новые режимы агента, личный кабинет и выбор модели LLM

В Veai 5.3 появился личный кабинет и возможность выбрать модель LLM для индивидуальных пользователей, добавлены режимы работы агента (Modes) и обновлён интерфейс для более удобной работы.Личный кабинет для индивидуальных пользователейЗдесь пользователь может видеть баланс токенов и срок их действия, управлять подпиской, знакомиться с документацией и связаться с командой. Бесплатный 30-дневный пробный период активируется при регистрации в личном кабинете.

продолжить чтение

PT BlackBox Scanner помогает разработчикам устранять уязвимости в веб-приложениях с помощью ИИ

Positive Technologies, одна из лидирующих компаний в области результативной кибербезопасности, интегрировала в общедоступный облачный DAST-анализатор веб-приложений (сайтов) PT BlackBox Scanner

продолжить чтение

Интеграция coding-агента с MCP-сервером Idea

В IntelliJ Idea (а, значит, и в OpenIDE) есть встроенный MCP-сервер. Активируется он достаточно просто и позволяет расширять стандартную функциональность command-line кодинговых агентов, таких как платный Claude Code или бесплатный, но тоже весьма неплохой Qwen Code

продолжить чтение

Полезные агенты на платформе MWS GPT

Как выглядят полезные агенты по версии Nano BananaПривет, Хабр! В прошлом материале

продолжить чтение

LLM против экономии масштаба: что это значит для глобализации

XX век: экономия масштаба → концентрация → глобализация. XXI век: ...?В предыдущей статье я разбирал, почему 95% корпоративных пилотов по внедрению LLM проваливаются, а фрилансеры при этом увеличивают продуктивность в разы. Вывод был простой: конфликт интересов между работником и компанией блокирует внедрение.Но это микроуровень — одна компания, один работник. Если экстраполировать те же механизмы на уровень экономик и стран, картина становится интереснее. И тревожнее.

продолжить чтение

Доматчинг товаров с использованием LLM: от промптов до квантизации

Привет, Хабр! На связи команда продуктового матчинга ecom.tech. Наша команда решает задачи поиска, группировки и сопоставления товаров с помощью алгоритмов машинного обучения. Все это необходимо для развития и улучшения бизнес-процессов в компании, а именно быстрого заведения карточек товаров, мониторинга цен на товары и развития ML. В этой статье мы расскажем про доматчинг – сравнение сложных пар товаров, которые отобрали на предыдущем этапе пайплайна, с помощью LLM. Поехали!

продолжить чтение

Как уменьшить галлюцинации LLM: 3 способа дать контекст

продолжить чтение

Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026

Или как я потратил неделю, чтобы доказать: ИИ сегодня — это красноречивые лжецы в костюмах экспертов.В конце 2025 года я устал читать маркетинг в стиле «наша модель умнее ChatGPT на 15%». Умнее по какому бенчмарку? MMLU? Это всё равно что мерить интеллект человека по результатам ЕГЭ.Я решил проверить одну простую вещь: способна ли нейросеть сказать «я не знаю»?Потому что в реальном мире — в медицине, праве, финансах — ответ «я не уверен» стоит дороже любой красивой, но выдуманной истории.Ниже — результаты слепого тестирования 14 топовых LLM (включая Claude 4.5, GPT-5.2, Gemini 3, Qwen, YandexGPT и

продолжить чтение

Rambler's Top100