Открываю карты: 12 лет работы в ФНС
Приветствую всех читателей Хабра!Настал день, когда я снял "оковы" и могу открыто говорить о том, чем я занимался на протяжении последних 12 лет.Ранее я опу��ликовал 3 статьи, в которых делился опытом гуманитария при работе с нейронными сетями, в том числе честно рассказал о своем опыте вайбкодинга, как я применяю LLM в повседневной жизни, и о своих попытках дообучения LLM с помощью WebUI Text Generation.
ИИ, BI и управление на основе данных: закрывается регистрация на форум ViRush 2030
Сегодня в 15-00 закроется регистрация на одно из самых масштабных событий в сфере управления на основе данных и бизнес-аналитики, ежегодную конференцию ViRush. В этом году мероприятие проходит на площадке Кластер Ломоносов и уже набрало более 1000 регистраций. Если вы хотите получить из первых рук информацию о внедрении BI и построении современных практик управления в таких компаниях как "Газпром Недра", "Нацпроектстрой", Positive Technologies, FESCO, ОЭК, РСХБ, "Росгеолфонд", ARLIFT, ТОЧНО и других, регистрация все еще открыта до 15:00 сегодня. Под катом - некоторые подробности о конференции.
Что такое маршрутизатор LLM?
Большие языковые модели (LLM) стали основой современных ИИ-продуктов, обеспечивая работу всего – от чат-ботов и виртуальных ассистентов до исследовательских инструментов и корпоративных решений. Но LLM различаются по сильным сторонам, ограничениям и стоимости: одни лучше в рассуждениях, другие - в креативе, коде или работе со структурированными запросами. Здесь и нужен маршрутизатор LLM.
Не только трансформеры: за пределами стандартных архитектур LLM
Привет! Это перевод очень крутой и захватывающей статьи, в которой автор рассматривает альтернативные архитектуры LLM: гибриды с линейным вниманием, диффузионные LLM, модели мира и малые рекурсивные трансформеры. Дальше слово автору:Гибриды с линейным вниманием, текстовая диффузия, модели мира на основе кода и малые рекурсивные трансформеры.От DeepSeek R1 до MiniMax-M2, самые большие и способные LLM с открытыми весами сегодня остаются авторегрессивными (autoregressive) трансформерами декодерного типа, которые построены на различных вариациях оригинального механизма многоголового внимания (multi-head attention).
AI-драгдизайн: первая молекула прошла Фазу II
Всем привет! Меня зовут Андрей, я занимаюсь аналитикой данных в фармацевтической отрасли, сегодня мы разбираем, как GNN, AlphaFold 3 и $2.23 млрд на провал меняют фармакологиюЗа кулисами невероятных прорывов в биомедицине — от мРНК-вакцин до редактирования генома CRISPR — скрывается фундаментально неэффективный, сломанный процесс: R&D (Research & Development) новых лекарств. Это явление известно как «Долина Смерти»: пропасть между лабораторным открытием и появлением препарата в аптеке.Но это не просто «долина»; это кризис, который усугубляется в реальном времени. Статистика, которую вы могли знать, уже устарела.Кризис в цифрах
Маршрутизация LLM: оптимизация путей обработки языка
Повышение эффективности и производительности через инновационные стратегии маршрутизации.ИсточникЧто такое LLM Routing?В стремительно развивающемся мире искусственного интеллекта большие языковые модели (LLM)
Тестирование AI-систем и роль MCP-сервера: теория и практика глазами QA
«Машина может пересчитать все звёзды на небе, но не может понять, зачем человек смотрит на них». — Айзек АзимовВ одну из пятниц у нас была обычная онлайн‑встреча. Еженедельный обмен знаниями, так сказать. Коллега решил показать что‑то «интересное про MCP» — и началось всё безобидно, с классического объяснения теоретической части. Но спустя час было очень тихо на звонке. Никто не перебивал, не шутил, не задавал вопросов, просто все слушали и пытались осознать происходящее. Тема оказалась куда глубже, чем мы ожидали, и, как выяснилось, напрямую касается того, чем мы занимаемся каждый день.
GDPval: измерение производительности AI-моделей на реальных задачах
Мы представляем GDPval — новую метрику, которая оценивает производительность моделей на экономически значимых, прикладных задачах из 44 профессиональных областей.Статья | evals.openai.comНаша миссия — обеспечить то, чтобы искусственный общий интеллект (AGI) приносил пользу всему человечеству. В рамках этой миссии мы стремимся максимально прозрачно освещать прогресс того, как AI-модели учатся помогать людям в реальной жизни. Именно поэтому мы представляем GDPval
К2 НейроТех вступил в закрытый клуб «ЦифрА» при АНО «Цифровая экономика»
Компания К2 НейроТех (входит в К2Тех) заключила партнерство с АНО «Цифровая экономика» и стала участником закрытого Клуба «ЦифрА». Сотрудничество направлено на совместную работу по развитию цифровой экосистемы России с акцентом на внедрение искусственного интеллекта и других сквозных технологий. В рамках партнерства К2 НейроТех получит доступ к экспертно-аналитическим ресурсам организации, возможность влияния на регуляторную повестку и поддержку в продвижении своих решений.
Больше, чем BI: 23 фичи Luxms BI, которыми мы гордимся. Часть 2: Функционал классической BI-системы
Это вторая часть серии «23 фичи Luxms BI, которыми мы гордимся». В первой (прочитать можно здесь) мы говорили о платформенности и архитектуре — о том, на чём держится система.А сегодня расскажем о базе, о функционале классической BI-системы, который и делает систему BI-системой.Этот раздел про то, без чего не обходится ни одна зрелая BI-система — визуализации, переменные, геоаналитика, сводные таблицы и внутренний язык. Мы не столько гордимся самим фактом их наличия — всё это действительно есть во многих решениях, сколько тем,

