GDPval: измерение производительности AI-моделей на реальных задачах
Мы представляем GDPval — новую метрику, которая оценивает производительность моделей на экономически значимых, прикладных задачах из 44 профессиональных областей.Статья | evals.openai.comНаша миссия — обеспечить то, чтобы искусственный общий интеллект (AGI) приносил пользу всему человечеству. В рамках этой миссии мы стремимся максимально прозрачно освещать прогресс того, как AI-модели учатся помогать людям в реальной жизни. Именно поэтому мы представляем GDPval
В Университете Северной Каролины прошёл имитационный суд, где в роли присяжных выступили ChatGPT, Grok и Claude
Юридическая школа Университета Северной Каролины провела имитационный судебный процесс, где в роли присяжных выступили три чат-бота на базе искусственного интеллекта: ChatGPT от OpenAI, Grok от xAI и Claude от Anthropic. Интерфейс ИИ-помощников вывели на отдельные три экрана. Чат-боты якобы определяли судьбу мужчины, обвиняемого в ограблении несовершеннолетнего.
Интернет будущего: в сеть выходят не люди
Введение Мы создали интернет, чтобы иметь быстрый доступ к библиотеке человеческого знания из любой точки планеты... ...Интернет создал агентов — чтобы мы перестали в него заходить. Перед написанием этой статьи я взял интервью у того, кто ближе всех к этой новой реальности — ChatGPT. “Новая эпоха — это переход от человеко-инициированного трафика к агентно-инициированному. Интернет становится машинным слоем, где LLM-агенты совершают большую часть запросов, взаимодействуют с API, индексируют данные и принимают решения без участия человека.” Тезисы
Как писать промты для генерации кода: примеры для Python, JS и SQL
Доброго времени суток, «Хабр»!За свою долгую (нет) карьеру писателя статей я уделил внимание достаточно важной теме, причем рассмотрел ее сразу в двух аспектах: написание промтов для текстовых и графических нейр��нных сетей. В какой-то момент появилась мысль углубиться в одну из этих тем.Сегодня мы подробнее остановимся именно на текстовых моделях, точнее перейдем в сферу программирования и составим инструкцию по созданию промта, который обеспечит более качественный результат на выходе.Примите стратегически удобное положение, а я приступаю к рассказу.
Нейро-дайджест: ключевые события AI за 22-29 октября 2025
Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.
Бывший сотрудник OpenAI: компания не оправдала ожиданий пользователей
Бывший исследователь безопасности OpenAI Стивен Адлер заявил, что компания не предпринимает достаточных усилий для решения проблем зависимости пользователей от чат-ботов, а поддаётся «давлению конкуренции» и отказывается от своей ориентации на безопасный ИИ.
OpenAI выпустила бесплатные модели для модерации контента
OpenAI открыла доступ к новым моделям для модерации контента под названием GPT-OSS Safeguard. Это две открытые модели — gpt-oss-safeguard-120b и gpt-oss-safeguard-20b, созданные специально для распознавания и фильтрации опасных или неприемлемых данных.
Microsoft получила долю в 27% в OpenAI
Microsoft и OpenAI подписали окончательное соглашение, которое предусматривает, что доля IT-гиганта в OpenAI Group PBC составит около 27% при оценке $135 млрд. До реструктуризации Microsoft владела 32,5% акций в коммерческой компании.
Попросил ChatGPT-4o и ChatGPT-5 помочь вкатиться в ML. Да они же одинаковые, Наташ
Сегодня не понедельник, но мы всё равно решили начать что-нибудь новое — например, разобраться в машинном обучении.

