- BrainTools - https://www.braintools.ru -
8 апреля, день первый. Первое, что радует: если заранее не зарегистрировался – на первый день, зацените тавтологию, уже не попадешь. Клево, когда все проходит четко и по плану.
В целом мы посещаем уже более 3 конференций DataFusion, были на самой первой в кластере Ломоносов (до этого мероприятие проходило в Сколково). Мероприятие проводится от ВТБ и рассчитано на популярное объяснение новых идей и концепций по искусственному интеллекту [1] и машинному обучению [2].
Еще одна интересная вещь – на мероприятие надо приходить с утра, вечером в первый день в этом году не было какого-либо афтерпати, хотя это оказалось немного скучным, потому что мы так или иначе относительно проснулись ближе к 16-00, а там надо было уже общаться с роботами, выжимать максимум из докладов, и мы особо не успели поговорить с и так тихими в этот день коллегами и другими профессионалами в отрасли ИИ, которые пришли на мероприятие сегодня, 8 апреля. Когда часто посещаешь выставки и конференции, замечаешь детали: сейчас, видимо, в целом в моде подсветки с фиолетовым и сиреневым, ведь еще 28 марта абсолютно такая же цветовая схема уже осознанно запомнилась на тусе Яндекса по JVM.
Кофе только начало действовать. А Алина наконец-то наговорилась с роботами, несмотря на то, что они вели себя, как собаки, вставали на задние лапы и делали сальто.
На конференции как бизнесменам нам пришла очередная дурацкая бизнес-идея удалять с конфет фантики ВТБ и перенаклеивать туда фантики Технофеи уже после мероприятия для использования, но не будем о крутых инсайтах… Поговорим про предпочтительную секцию в этом году. Мы решили посвятить меньше времени политике ИИ на этот раз, и пошли в открытый зал, где доклады были больше связаны с наукой [3].
Все то же облако терминов: LLM, RAG, сверточные слои, сверточные нейросети, контекст, память [4] LLM-моделей и проблемы памяти.
Но услышали и новые приколы типа HiRAG. В ответ хотелось ответить Hello, LLM! Интересно, что во многом традиции проведения самой конференции из года в год не отличаются: похожие названия секций, расположение залов… Наука все также находилась на открытом пространстве на втором этаже.
Вообще не очень понравилось, что либо наука была сильно поверхностная, но в то же время непонятная, что свойственно для ученых, либо доклады, как и в прошлые годы, были о возможностях использования LLM, RAG, дообучения, датасетов для широкого круга лиц. То есть когда в первый раз слышишь популяризирующие материалы – это круто. Но когда ты уже в теме и ни раз на хакатоне побеждал с RAG, сидишь и половину времени спишь, а половину собираешь из слайдов новые термины.
Еще одна интересная особенность Data Fusion – видимо из-за важности места, в котором проводится конференция, люди-профессионалы, как нам уже не первый год кажется, ведут себя соответственно довольно важно и вычурно, вследствие чего, однако, какие-либо новые знакомства проходят совсем с трудом. Обменяться парой слов – да, а вот взять контакты – тебя вообще посчитают либо голубым, либо Васей с улицы, ведь нормальные РАНовские ученые не станут первыми выпрашивать контакты и раздавать их направо и налево.
Но в остальном конференция как всегда на должном уровне.
Были доклады от корейских коллег на английском языке. Причем мы узнали, что и в Высшей школе экономики профессор ведет занятия на английском языке с 2024 года.
А вот и тот самый HiRAG для сервиса VK Video. Например, по этому докладу для нас было открытие, что на практике еще только начинается эра нейро-рекомендательных систем. Ближайшее будущее recsys, как мы подсмотрели в Интернете и в Qwen, связано с переходом от пассивных фильтров к активным рекомендательным агентам, которые не просто угадывают предпочтения, а помогают формулировать цели, управлять вниманием [5] и осознанно потреблять информацию. Вот и интересно было увидеть человека, который так или иначе участвовал во внедрении обученной модели в сервисе ВК-видео.
В основе HiRAG лежит идея, вдохновлённая человеческим мышлением [6]: мы не просто запоминаем факты, мы организуем их в иерархии — от деталей к категориям, от примеров к принципам. Архитектура системы состоит из двух ключевых модулей: HiIndex и HiRetrieval
GitHub. Первый строит многоуровневый граф знаний: с помощью гауссовой смеси (GMM) кластеризует семантически близкие сущности, а затем использует LLM для генерации обобщающих концепций верхнего уровня. Так, например, понятия «Big Data» и «Рекомендательные системы» могут быть связаны через абстракцию «Data Mining», что позволяет модели видеть не только прямые совпадения, но и глубинные логические мостики.
Мы больше всего, как ни странно, залипли на роботов на конференции. Итак, не верьте всему, что пишут на Хабре и в сети Интернет. Робот за 2 млн в ряде кейсов, конечно, может облегчить Вам жизнь. Но в рамках конференции ими управляли с пульта не только потому, что они могли бы случайно задеть кого-то, даже просто побежав в сторону. Кто помнит челлендж Промобота, когда для него предложили разработать решений обычным программистам со стороны?
Наши отечественные ребята сейчас предлагают аналогичный конкурс на китайском робо-железе, то есть роботы есть, бизнес есть, на мероприятиях и в некоторых бизнес-кейсах их активно начинают использовать, но для реального использования робота нужно больше софта под него. Ну это реально было интересно увидеть вживую.
Вот этот кортеж сопровождал и меня даже лично. Собаки делали сальто и танцевали на задних лапах, а человекоподобные роботы пожимали руки, танцевали и сбегали от тебя в самый последний момент, когда ты этого уже никак не ожидал)
Ну если немного политики и совсем обобщенных дискуссий, то вот Вам еще несколько фотографий с мероприятия.
Еще один лайфхак на концеренции Data Fusion для вас, как посетителей: не пытайтесь относиться к конференции как к месту, где можно узнать специфичное в областях искусственного интеллекта и машинного обучения. Хватайте аббревиатуры и термины и пытайтесь осознать, знаете ли Вы их уже и что Вы именно о них знаете. Конференция действительно очень популярная, на ней удобно просто в спокойном и неторопливом формате освежать некоторые знания, задумываясь о чем-либо время от времени.
Громкие и звучащие аббревиатуры, провокационные лозунги – просто ходи по залам и хватай их, “собери их все вместе”. Qwen + OpenMetaData, AI Data Steward и так далее. Что-то подхватываешь от спикеров, а не осознаешь со слайдов.
В целом, поэтому, первый день мероприятия прошел продуктивно, посмотрим, что там будет на втором дне. Пока пишу статью, не могу выехать на конференцию, поэтому сори за краткость.
Появилась даже мысль, что скоро вот приходишь ты на офлайн-конференцию, а там вокруг роботы ходят, сальтухи делают, разговаривают между собой, тебя встречают роботы-ассистенты, и чудо не в том, что ты сейчас в Москве, а не на симпозиуме в Сан Франциско, а в том, что ты вообще здесь и ты живой и настоящий на этом мероприятии, настоящий мешок с костями, а не железный конь в вакууме, в мозги которого загружена дообученная р
Автор: technofeya
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/28506
URLs in this post:
[1] интеллекту: http://www.braintools.ru/article/7605
[2] обучению: http://www.braintools.ru/article/5125
[3] наукой: http://www.braintools.ru/article/7634
[4] память: http://www.braintools.ru/article/4140
[5] вниманием: http://www.braintools.ru/article/7595
[6] мышлением: http://www.braintools.ru/thinking
[7] Источник: https://habr.com/ru/articles/1021186/?utm_campaign=1021186&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.