ии-агенты. - страница 20

LLM в роли «судьи» vs. человеческая оценка: почему вместе — лучше

В гонке за следующей волной «умных» систем большие языковые модели берут на себя неожиданные роли. Одна из самых интересных — использовать такие модели как «судей» для оценки других моделей. Подход уже экономит командам массу ручной работы, но остаются вопросы: способен ли LLM уловить каждую тонкую ошибку? Что происходит в ситуациях, где критичны человеческая интуиция или глубокая предметная экспертиза?

продолжить чтение

Как ИИ меняет науку, строит новую экономику и управляет дронами – топ-10 исследований ИИ за сентябрь 2025

продолжить чтение

Пожиратель токенов (или нет): анатомия протокола MCP для ИИ-агентов

Поводом написания этой статьи послужил подслушанный диалог:— А на чем у вас агенты написаны?— У нас на MCP!Для меня MCP всегда был просто протоколом, то есть именно способом отправки и обработки запросов. А когда я слушал выступления или читал некоторые статьи о том, как плох/хорош MCP, меня не покидало ощущение чего-то странного. Но я все же решил, что это от незнания и я чего-то не понимаю. А когда не понимаешь, но очень хочешь понимать, то самый лучший способ — это взять и разобраться.

продолжить чтение

Зачем бизнесу GPT-платформа, а не просто LLM: опыт JET & Yandex GPT Lab

Меня зовут Антон Чикин, я руковожу отделом интеллектуального анализа в «Инфосистемы Джет». В статье я попробую показать на практическом примере, почему корпоративный ИИ нельзя свести к установке готовой LLM — и что именно приходится выстраивать вокруг неё, чтобы получить реальную ценность для бизнеса.Этот материал будет полезен тем, кто отвечает за внедрение ИИ в компаниях среднего и крупного масштаба: ИТ-директорам, архитекторам корпоративных систем, специалистам по информационной безопасности и тем, кто рассматривает генеративный ИИ как инструмент автоматизации бизнес-процессов.

продолжить чтение

ИИ Gemini оказался уязвим к скрытым атакам ASCII

Исследователь компании кибербезопасности FireTail Виктор Маркопулос протестировал некоторые из самых популярных LLM на предмет атак со скрытыми символами ASCII. Он обнаружил, что Gemini, DeepSeek и Grok уязвимы для этого типа кибератак, тогда как у Claude, ChatGPT и Copilot есть защита. Однако в Google отказались признать проблему.

продолжить чтение

ElevenLabs представила революционный инструмент для работы с ИИ-агентами

Компания ElevenLabs представила революционный инструмент для работы с ИИ-агентами — Agent Workflows

продолжить чтение

IBM встроит ИИ Anthropic в свои продукты

IBM объединяется с исследовательской лабораторией Anthropic для внедрения ИИ в своё программное обеспечение. Первым продуктом, в котором будет использоваться семейство больших языковых моделей Claude, станет интегрированная среда разработки IBM.

продолжить чтение

Можно ли сделать мобильный интерфейс без человека. Эксперимент с ИИ. Часть 2

Сегодня UI в продукте — не просто красивая картинка. Это полноценный драйвер роста компании в борьбе за первенство. И не получается относиться к этому как «просто запили мне нормальный UI». Каждый элемент стоит денег и ресурсов разработчиков и дизайнеров. В первой части статьи мы посмотрели, как ИИ помогает менять скорость релизов с помощью Claude 4.5 и влиять на результаты бизнеса. А теперь давайте разберёмся, как это сделать с другими инструментами.

продолжить чтение

ChatGPT как главный маркетплейс планеты: разбираем OpenAI Agentic Commerce Protocol

продолжить чтение

Simular AI представила продвинутый агент для работы с компьютером

продолжить чтение

1...10...181920212223...3040...40
Rambler's Top100