- BrainTools - https://www.braintools.ru -
Собрали главные события недели с 21 по 26 июля 2025 года в российском AI-сегменте: технические прорывы, корпоративные внедрения и неожиданные результаты соревнований человека с машиной.
Команда Артема Бабенко из Yandex Research представила TabM (Tabular Mixer) [1] — архитектуру, специально разработанную для табличных данных. В отличие от попыток адаптировать трансформеры, исследователи создали решение с нуля.
Результаты впечатляют:
На 46 benchmark-датасетах TabM показал средний ранг 1.8 против 2.4 у XGBoost
Стабильность при изменении гиперпараметров: 0.92 против 0.78 у TabNet
Эффективная работа с mixed-type features без предобработки
# Пример использования TabM
from tabm import TabMClassifier
model = TabMClassifier(
n_epochs=100,
batch_size=256,
lr=1e-3
)
model.fit(X_train, y_train)
predictions = model.predict(X_test)
Код и веса модели доступны на GitHub. Уже появились кейсы применения в логистике Wildberries и медицинской классификации в Инвитро.
Исследователи из T-Bank AI Research решили фундаментальную проблему — как контролировать поведение [2] языковой модели без fine-tuning. Их подход основан на Sparse Autoencoders (SAE) и Feature Flow Graphs.
SAE выделяет интерпретируемые признаки из активаций модели
Строится граф потока признаков между слоями
Целевые концепты активируются или подавляются на нужных слоях
# Концептуальная схема вмешательства
def steer_llm(model, prompt, steering_vector):
with model.forward_hooks(layer_range=[10, 20]):
# Получаем активации
activations = model.get_activations(prompt)
# Применяем управляющий вектор
modified = activations + alpha * steering_vector
# Генерируем с измененными активациями
output = model.generate_from_activations(modified)
return output
Практический результат: можно менять тон, стиль или тематику ответов модели “на лету”. Это открывает путь к созданию более безопасных и управляемых AI-систем без затрат на переобучение.
ФГАУ “Цифровые индустриальные технологии” и “К2Тех” опросили 100+ промышленных предприятий. Картина неутешительная:
|
Барьер |
% предприятий |
|---|---|
|
Непрогнозируемость эффектов |
61% |
|
Риски кибербезопасности |
53% |
|
Отсутствие реальных кейсов |
46% |
|
Дефицит кадров |
38% |
|
Неготовность инфраструктуры |
93% |
Парадокс [3]: половина ожидает от ИИ снижения издержек, но 93% не имеют инфраструктуры для внедрения. Минпромторг готовит программу субсидирования, но проблема глубже — нужны типовые решения и методологии внедрения.
На AtCoder World Tour Finals в Токио произошла сенсация. Пшемыслав Дебяк (ник Psyho) обыграл модель OpenAI в 10-часовом марафоне программирования.
Ключевая задача: оптимизация пути робота на сетке 30×30 Результат: человек победил с отрывом 9.5% Причина: в условиях ограниченных вычислительных ресурсов человеческая эвристика оказалась эффективнее brute force подхода ИИ
Это напоминание: несмотря на рост метрик (с 4.4% в 2023 до 71.7% в 2024), ИИ всё ещё уязвим там, где нужны креативность и оптимизация под ограничения.
Компания официально перешла от “пилотов” к боевому внедрению:
Мониторинг сети с предиктивной аналитикой
Автоматизация архитектурного проектирования
Виртуальные ассистенты для операционных задач
MWS AI представила линейку продуктов:
Speech Analytics 2.0: распознавание речи + эмоций [4] + демография
MWS Data Platform: унифицированная платформа для ML (обещают -40% расходов)
Cotype Pro 2: LLM на базе Qwen 2.5 для корпоративного сектора
Инвестиции в собственные модели в 2024: 1 млрд рублей.
Это международный стандарт для систем управления ИИ. Сертификация подтверждает соответствие требованиям по:
Этичности и прозрачности алгоритмов
Управлению рисками AI-систем
Полному циклу разработки и эксплуатации
Параллельно Yandex B2B Tech запустил:
Доступ к Qwen 3 (72B параметров) для enterprise
«Нейроаналитик» — AI‑агент для BI-аналитики
Стартует эксперимент по внедрению LLM в госорганы:
Проверка резюме и генерация тестов для госслужбы
Анализ законопроектов на ошибки [5]
Автоматизация ответов на обращения граждан
Ограничения строгие: без доступа к гостайне, только через ЕСИА, никакого прогнозирования соцэкономики.
Москва: ИИ-диктор в метро на основе голосов реальных дикторов Нижний Новгород: 340 умных светофоров с ML-адаптацией к трафику Подмосковье: ИИ-распознавание документов для приватизации (250 типов)
Фонд NTI профинансировал 5 проектов:
«Воздушный дозор» — мониторинг с computer vision
«Саранча» — алгоритмы роевого управления
«Цитадель» — нейроморфные чипы для обнаружения целей
“Код будущего. ИИ”: 75,000 школьников и студентов
Сбербанк: обязательные AI-компетенции для всех сотрудников
Нацстратегия-2030: план выпускать 15,500 ИИ-специалистов в год (сейчас 3,000)
Торстен Слок (Apollo Global Management) предупреждает о пузыре:
P/E топ-10 S&P 500 превысил уровни краха доткомов
Microsoft сократил 9,000 человек ради $80 млрд инвестиций в ИИ
Весь рост индекса обеспечивают 10 AI-компаний
В России картина противоречивая:
Лидеры (Яндекс, Сбер, МТС) активно внедряют и масштабируют
Промышленность не готова инфраструктурно и методологически
Государство пытается догнать, но с жёсткими ограничениями
Неделя показала: российский AI-сектор неоднороден. Есть команды мирового уровня (TabM, управление LLM), есть успешные корпоративные внедрения, но есть и системные проблемы с инфраструктурой и кадрами.
Главный вызов — не в технологиях, а в их применении. Пока одни создают state-of-the-art решения, другие не могут внедрить даже базовую автоматизацию. Разрыв растёт, и это создаёт риски для всей экосистемы.
Автор: stas-clear
Источник [6]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/17837
URLs in this post:
[1] TabM (Tabular Mixer): https://github.com/yandex-research/tabm
[2] поведение: http://www.braintools.ru/article/9372
[3] Парадокс: http://www.braintools.ru/article/8221
[4] эмоций: http://www.braintools.ru/article/9540
[5] ошибки: http://www.braintools.ru/article/4192
[6] Источник: https://habr.com/ru/articles/932744/?utm_source=habrahabr&utm_medium=rss&utm_campaign=932744
Нажмите здесь для печати.