Машинное обучение.

GPT-5-Pro необычным способом «закрыла» нерешенную математическую задачу

Иногда искусственный интеллект решает не математические головоломки, а проблемы памяти человечества. Себастьен Бюбек, исследователь OpenAI, рассказал

продолжить чтение

Оставлено в

Как Senior управляют контекстным окном LLM

Сколько раз сегодня ChatGPT ответил вам: «Вы абсолютно правы, давайте исправим»Пять? Десять?Если подобное повторяется, дело не в модели — дело в том, как именно вы с ней работаете.Сейчас многие увлечённо обсуждают размеры моделей:«У GPT триллион параметров!» «Claude теперь держит 200 тысяч токенов в контексте!»Это впечатляет. Но если вы не умеете управлять контекстом, то всё это всё равно что купить Ferrari и ездить только на первой передаче.Сегодня разберёмся, как действительно использовать возможности LLM. Контекстное окно — это не ограничение, а

продолжить чтение

Оставлено в

Исследование: 250 вредоносных документов могут вызвать сбой в работе языковой модели с 13 млрд параметров

Специалисты Anthropic совместно с Институтом безопасности ИИ Великобритании, Институтом Алана Тьюринга и другими исследовательскими центрами провели эксперимент, который показал, что всего 250 вредоносных документов способны вызвать сбой в работе языковой модели с 13 млрд параметров. Таким образом, для появления багов достаточно «отравить» всего 0,00016% обучающего корпуса.

продолжить чтение

Оставлено в

ИИ-консерва: как мы «взламывали» LLM-модели, чтобы извлечь датасеты и рассуждения

продолжить чтение

Оставлено в

Что, если новые бенчмарки для ИИ станут появляться сами по себе?

продолжить чтение

Оставлено в

GPT-5 Pro стала новым лидером в решении сложнейших математических задач

Исследователи Epoch AI сравнили возможности современных моделей искусственного интеллекта на самом трудном уровне математического бенчмарка FrontierMath Tier 4. По замеру от 11 октября 2025 лучший результат показала GPT-5 Pro от OpenAI: модель решила 6 из 48 предложенных задач, немного опередив Gemini 2.5 Deep Think от Google (5 решений). Ранее лидером считалась GPT-5 High с четырьмя успешными ответами. Grok 4 Heavy от xAI заметно уступил.

продолжить чтение

Оставлено в

OpenAI отправила полицию к стороннику регулирования ИИ

Юрист Натан Кэлвин, который занимается политикой регулирования искусственного интеллекта некоммерческой организации Encode AI, пожаловался, что OpenAI прислала к нему домой полицию.

продолжить чтение

Оставлено в

Google Cloud опубликовал 101 реальный кейс применения генеративного ИИ

Чтобы помочь бизнесам внедрять ИИ решения, Google Cloud выпустил подборку 101 архитектурного шаблона (blueprint), демонстрирующего, как применять генеративный ИИ в различных отраслях.

продолжить чтение