- BrainTools - https://www.braintools.ru -

TabM — новая нейросетевая архитектура для работы с табличными данными от исследователей Яндекса

Лаборатория исследований искусственного интеллекта [1] Yandex Research представила новую нейросетевую архитектуру для работы с табличными данными — TabM. Она позволяет быстро обрабатывать большие массивы данных и строить высокоточные прогнозы, что особенно актуально для сфер бизнеса, исследований и медицины. Модель поможет оптимизировать поставки, прогнозировать энергопотребление, классифицировать пациентов по риску заболеваний и решать многие другие задачи.

TabM (Tabular DL model that makes Multiple predictions) — это эффективная реализация ансамбля моделей, когда каждая модель проводит свой анализ, после чего прогноз усредняется. Архитектура TabM позволяет добиться оптимального соотношения точности прогноза и необходимых вычислительных мощностей.

Разработку уже опробовали на Kaggle — платформе международных соревнований по анализу данных и машинному обучению [2] от Google. В частности, новую архитектуру применяли для предсказания выживаемости пациентов после трансплантации костного мозга [3].

По результатам тестирования на 46 наборах данных, TabM превзошла другие решения не только по занимаемому в среднем месту (1,7 у TabM против 2,9 у ближайшего конкурента), но и по стабильности работы, что важно для практического применения. Благодаря способности объединять результаты работы нескольких подмоделей и эффективному использованию вычислительных ресурсов, TabM успешно конкурирует с классическими моделями градиентного бустинга — CatBoost, XGBoost, LightGBM, — которые долгое время считались лучшим решением для табличных данных.

Архитектура уже доступна разработчикам и исследователям на GitHub [4], а научная статья — на arXiv [5].

С 2019 года исследователи Yandex Research опубликовали восемь научных статей [6] по глубокому обучению моделей для работы с табличными данными. В общей сложности статьи получили более 1900 цитирований. В частности, статью о TabM цитировали Университет Мангейма (Германия), Национальный университет Сингапура, Корейский университет, Иллинойсский университет в Урбане‑Шампейне. В разные годы статьи были приняты на самые влиятельные конференции по ИИ, в том числе NeurIPS, ICLR и ICML.

Автор: NatalieVT

Источник [7]


Сайт-источник BrainTools: https://www.braintools.ru

Путь до страницы источника: https://www.braintools.ru/article/17469

URLs in this post:

[1] интеллекта: http://www.braintools.ru/article/7605

[2] обучению: http://www.braintools.ru/article/5125

[3] мозга: http://www.braintools.ru/parts-of-the-brain

[4] GitHub: https://github.com/yandex-research/tabm

[5] arXiv: https://arxiv.org/abs/2410.24210

[6] восемь научных статей: https://research.yandex.com/research-areas/tabular-data

[7] Источник: https://habr.com/ru/companies/yandex/news/929040/?utm_source=habrahabr&utm_medium=rss&utm_campaign=929040

www.BrainTools.ru

Rambler's Top100