О чем грезят нейронные сети
Кажется, мы настолько привыкли к прогрессу нейронных сетей, что больше удивляемся, когда они чего-то не умеют, чем видя их новые достижения. Тем не менее, сегодняшние технологии искусственного интеллекта — это самое начало пути.Интеллектуальные модели на основе нейронных сетей, при всех их впечатляющих возможностях, не лишены серьезных недостатков, зачастую являющихся обратной стороной достоинств. Отталкиваясь от используемой сегодня архитектуры, попытаемся определить возможные направления дальнейшего развития систем искусственного интеллекта (ИИ).
По следам GPT-5: как LLM все сильнее превращается в айфон
LLMки можно любить и ненавидеть, но нельзя отрицать того, что это что-то очень большое и сильно трансформирующее все вокруг. Я регулярно и помногу размышляю над AI-агентами и в целом траекторией genAI движения и после вчерашней презентации GPT-5 мой личный паззлик окончательно сложился. Все это очень похоже на то, что мы уже видели.И это — iPhone.
Нейро-дайджест: ключевые события мира AI за 1 неделю августа 2025
Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.Меня зовут Вандер
Переизобретая аналитику будущего: как и почему LLM-агенты меняют анализ продуктов, но все не так просто
Привет! AI-агенты — самая горячая тема года и не просто так: это действительно мощная концепция, которая неизбежно заставляет пересматривать устоявшиеся подходы во многих сферах. Одна из самых интересных областей для агентов — аналитика и BI, и последние полгода я активно занимаюсь в том числе этим.Адаптивные и налету подстраивающиеся под задачу дашборды, естественный язык вместо SQL, автономная работа для генерации и проверки гипотез, — все это очень интересно, но реальность всегда чуточку сложнее.Обо всем этом и поговорим.Давайте разбираться!
Перегрузка языковых моделей информацией приводит к нерелевантным ответам
Предполагается, что большие языковые модели могут обрабатывать миллионы токенов (фрагментов слов и символов, из которых состоят входные данные) одновременно. Но чем длиннее контекст, тем хуже они справляются с задачей.
FlexOlmo позволяет организациям совместно обучать языковые модели без обмена данными
FlexOlmo, разработанный в Институте искусственного интеллекта Аллена, демонстрирует возможность совместной работы организаций над языковыми моделями на основе локальных наборов данных без передачи конфиденциальных данных.
Согласно постановлению суда Калифорнии, Anthropic обвиняется в крупномасштабном пиратстве
Федеральный суд Калифорнии принял на рассмотрение коллективный иск на миллиард долларов против Anthropic, компании, создавшей языковую модель Claude, по обвинению в крупномасштабном нарушении авторских прав.
T-Pro 2.0 — открытая гибридно-ризонинговая русскоязычная LLM
Всем привет! На связи Толя Потапов, MLE в Т-Банке. Мы продолжаем развивать собственную линейку моделей GEN-T

