рассуждения.

GPT-5 и API Responses: зачем нужен ещё один стандарт?

Команда AI for Devs подготовила перевод статьи о новом API /v1/responses от OpenAI, который объединяет простоту Chat Completions и мощь Assistants, и при этом сохраняет состояние рассуждений, мультимодальность и встроенные инструменты. Это шаг к агентам будущего — и, похоже, к новому стандарту работы с моделями OpenAI.GPT-5 уже вышел, и мы хотим подробнее рассказать о наилучших способах его интеграции, об API Responses и о том, почему Responses идеально подходит для моделей рассуждения и для будущего, ориентированного на программных агентов.

продолжить чтение

Micro-LLM: почему будущее за миниатюрными моделями

Micro-LLM: почему будущее за миниатюрными моделямиКогда-то программные системы строились как монолиты. Огромные, неповоротливые, требующие много ресурсов и постоянного внимания. Сегодня мир ИТ массово переходит на микросервисную архитектуру. Подобный сценарий вполне реален и в мире искусственного интеллекта, особенно в области больших языковых моделей (LLM).

продолжить чтение

Восстание машин 2025: я изучил реальные риски со стороны нейросетей

Всем привет! Меня зовут Кирилл Пшинник, я научный сотрудник Университета Иннополис и CEO Онлайн-Университета «Зерокодер», а также автор книги «Искусственный интеллект: путь к новому миру». Искусственный интеллект — мой большой интерес, я активно изучаю его и пользуюсь им как в бизнесе, так и в персональной жизни. И сегодня я хочу рассказать о темной стороне ИИ, а именно — о ситуациях, когда нейросети вступают в конфронтацию с операторами, индексе риска ИИ, и в чем действительно заключается угроза со стороны условных «машин». 

продолжить чтение

Валерий Бабушкин & MLinside, часть 1 | Автократия. System Design. Lego & Sport. Срезание углов

На днях посмотрел подкаст с Валерой Бабушкиным. Как всегда, было очень приятно слушать, и я хочу поделиться с вами основными тезисами, которые я для себя вынес.

продолжить чтение

Бокс – призма, через которую можно увидеть себя настоящего

Через пару месяцев будет 2 года, как в моей жизни появился бокс. Изначально, воспринимал его как инструмент развития физической формы, выносливости, характера, умения за себя постоять, сброса накопившейся злости.Еслис «физикой» все относительно ясно, то понятие «характер» для меня было чем‑то абстрактным и поверхностным. Я не понимал, какие именно качества развиваются и как применяются в повседневной жизни. Психология бокса стала океаном, куда я медленно погружался с головой и искал смыслы, спрятанные на глубине. Хочу зафиксировать свои осознания и приглашаю вас с ними ознакомиться.1. Страх испытывают все

продолжить чтение

Новый метод подсказок повышает точность и проверяемость ответов языковых моделей

Новый метод подсказок под названием «Highlighted Chain of Thought» (Выделенная цепочка мыслей)(HoT) помогает большим языковым моделям лучше объяснять свои рассуждения и упрощает проверку их ответов людьми. Подход работает в два этапа: во-первых, AI переформулирует исходный вопрос и отмечает важные факты с помощью XML-тегов. Затем он генерирует ответ, который ссылается на эти выделенные факты, создавая четкие связи между вопросом и ответом.

продолжить чтение

LIMO: Меньше — значит больше для рассуждающих LLM

Мизерный объем задач с ответами может разбудить спящего LLM-льва..."Мы представляем фундаментальное открытие, которое бросает вызов нашему пониманию того, как сложные рассуждения возникают в больших языковых моделях"

продолжить чтение

Цензура в DeepSeek работает при локальном запуске модели

Некоторые эксперты в области искусственного интеллекта считали, что хорошо задокументированная цензура DeepSeek существует только на уровне приложения и не работает, если запустить приложение локально на устройстве. Теперь выяснилось, что это не так.

продолжить чтение

OpenAI проверяет убедительность рассуждений o3-mini в сабреддите

OpenAI использовала subreddit r/ChangeMyView для создания теста, который позволяет измерять убедительность ответов моделей рассуждений ИИ. Компания раскрыла эту информацию вместе с выпуском модели o3-mini.

продолжить чтение

Rambler's Top100