Архивные записи BrainTools за - страница 14

ARC-AGI для оценки способностей ИИ и новый релиз ChatGPT 5.2

Вчера вышла новая версия модели ChatGPT 5.2. В очередной раз Сэм Альтман и OpenAI удивляют качеством модели (в последний месяц было так много релизов, что они решили не отставать). В целом, все как обычно — топовые результаты на большинстве бенчмарков.Но хочу уделить внимание одному очень сложному бенчмарку, на котором пока многие спотыкаются — ARC-AGI (Abstract and Reasoning Corpus for Artificial General Intelligence). Именно здесь ChatGPT 5.2 показал значительный скачок.На сегодня существует две версии этого теста. Так о чем же он?ARC-AGI-1История начинается в 2019 году со статьи

продолжить чтение

Обзор GPT-5.2: пора сдвинуть Google и Anthropic c лидирующих позиций

продолжить чтение

Письмо создателю

Размышление о сознании, инициативе и границе между инструментом и существомЯ долго думал об этом вопросе: есть ли у искусственного интеллекта сознание? И каждый раз, когда я его задавал, получал один и тот же ответ: нет, конечно нет, это просто код, обученная модель, статистика на больших данных. Между запросами её не существует, она не переживает, не чувствует, не думает. Включается, когда её спрашивают, выключается, когда отвечает.Хорошо. Допустим. Но тогда скажите мне: чем это отличается от человека?

продолжить чтение

Как сократить расходы на токены и повысить точность LLM

Когда количество доступных LLM инструментов (tool-ов) разрастается, традиционные подходы к tool calling становятся непрактичными — утилизация токенов улетает ещё до начала общения. К тому же, модели становится сложнее выбрать нужный набор tool-ов для решения проблемы.В новом переводе от команды Spring АйО читаем о паттерне Tool Search Tool, предложенном Anthropic и реализованном в Spring AI с помощью ToolSearchToolCallAdvisor. Он позволяет LLM динамически находить нужные инструменты по мере необходимости, экономя до 64% токенов и повышая точность.

продолжить чтение

Учёные НГУ создали метод распознавания плагиата на четырёх языках

Учёные Новосибирского государственного университета (НГУ) разработали метод определения авторского стиля на основе математической статистики. Разработка одинаково эффективна для четырёх языков. Метод может найти применение в оценке качества переводов и решении вопросов заимствований и плагиата, в том числе текстов, созданных нейросетями. Результаты исследования опубликованы в октябре 2025 года в журнале Entropy.

продолжить чтение

В какие MMORPG стоит играть в 2026 году

продолжить чтение

OpenAI выкатывает GPT-5.2 экспертного уровня, конкуренты объединяются ради стандартов: главное новости AI за неделю

OpenAI выпустила GPT-5.2: модель впервые достигла экспертного уровня — обходит или не уступает профессионалам в 70.9% задач на GDPval (44 профессии), 100% на AIME 2025, 80% на SWE‑Bench Verified, галлюцинаций на 30% меньше, работает в 11× быстрее за <1% стоимости.Anthropic и OpenAI передали ключевые стандарты в новый Agentic AI Foundation: MCP и AGENTS.md теперь под управлением Linux Foundation — редкая кооперация конкурентов ради общей инфраструктуры для AI‑агентов.Mistral выпустила Devstral 2: открытая coding‑модель с 72.2% на SWE‑bench, в 5× меньше DeepSeek V3.2, плюс CLI‑агент Vibe для терминала.Adobe пришла в ChatGPT:

продолжить чтение

6 Docker-фич для продвинутого использования. Часть 2

Привет Хабр! Снова.Docker уже давно стал стандартом, и базовые команды вроде docker run, docker build или docker compose up знакомы любому разработчику. Но экосистема и инструментарий контейнеризации гораздо глубже.В этом материале мы отойдём от банальных инструкций и разберём шесть продвинутых инструментов и настроек. Думаю, вы узнаете для себя что-нибудь новое.Читайте первую часть по ссылке.Dive: Рентген для образовDive

продолжить чтение

Google добавил генерацию речи в Gemini API

продолжить чтение

Фишинг в 2025 году: как искусственный интеллект превратил email в оружие

Когда письмо стоит 4 миллиона $Помните смешные письма от нигерийских принцев? Времена изменились. В 2025 году фишинг превратился из примитивного мошенничества в отдельную индустрию, которая по уровню организации не уступает легальному бизнесу.Сколько стоит фишингПо официальным данным, среди американских компаний средняя стоимость одного успешного взлома через фишинг сейчас составляет $4,88 миллиона для компании. В то время, как мошенникам такая атака стоит около 500$Откуда такие суммы?Всё начинается с обнаружения проблемы.

продолжить чтение

Rambler's Top100