data.

Как мы встроили LLM в Data Quality и не потеряли контроль

Привет, Хабр! Меня зовут Макунина Арина, я аналитик и инженер данных в Just AI. Наша команда аналитики обожает, чтобы рутина в данных была максимально предсказуемой. Если что-то ломается, то должно быть понятно что, где, почему и что делать дальше. Когда мы поработали с Data Quality в продакшене, выяснилось, что правила качества сами по себе есть базовый минимум, но время утекает в две черные дыры.Первая — это эффект белого листа.

продолжить чтение

AI КОМП-АС — разбор фреймворка. М: Можем ли дойти?

Мы подошли к этапу, где наконец перекинем мостик от анализа текущего состояния организации и бизнес-целей к технологиям и имплементации процесса AI трансформации. Ниже я опишу 

продолжить чтение

AiConf 2026: переход от теории к практике

В 2026 году AiConf делает шаг от разговоров об AI к его практическому применению: ключевым элементом программы станет «стрим развития» — формат, где участники не слушают, а вместе решают реальные задачи. Это серия интерактивных треков, в которых за время конференции можно разобрать проблему, протестировать подходы и уйти с конкретным планом действий.

продолжить чтение

Прогнозирование цен на Airbnb в Нью-Йорке

Привет, Хаброжители! Мы открыли предзаказ на книгу «Машинное обучение на табличных данных: XGBoost, глубокое обучение и ИИ» Марка Райана и Луки Массарона. Предлагаем ознакомиться с главой 3 «Машинное и глубокое обучение». Чтобы сравнить машинное и глубокое обучение с точки зрения простоты, сопоставим два решения для конкретной задачи классификации табличных данных: прогнозирование того, будет ли объект недвижимости, предлагаемый в аренду на платформе Airbnb в Нью-Йорке (NYC), иметь цену больше или меньше средней цены в объявлениях Airbnb на этом рынке. Мы сравним:машинное обучение

продолжить чтение

Google представила Gemini Embedding 2 — нейросеть для поиска и сопоставления текста, изображений, видео и аудио

продолжить чтение

DataHub + MCP: подключаем ИИ к управлению метаданными

продолжить чтение

Как системному аналитику перейти в дата-аналитику: советы из личного опыта

продолжить чтение

Как мы вырастили ML-фреймворк внутри компании: эволюция, ошибки и инсайты

Привет, Хабр! Меня зовут Юля Корышева, я разработчик машинного обучения в команде скоринга в билайне. В этой статье расскажу, как за последние пять лет в нашей команде менялся подход к разработке, валидации и поддержке моделей — с какими вызовами мы столкнулись, как их решали и к каким результатам пришли.

продолжить чтение

Как обмануть LLM: обход защиты при помощи AutoDAN. Часть 2

В прошлой части мы разобрались, что такое состязательные суффиксы и почему они так легко ломают модели. Но этими суффиксами атаки не ограничиваются. Им на смену пришёл AutoDAN — наследник состязательных суффиксов и популярного jailbreak-метода DAN (Do Anything Now). Разберёмся, чем он отличается от GCG-алгоритма, посмотрим на практические примеры атак и обсудим, как защищаться и тестировать модели

продолжить чтение

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1

Что будет, если к опасному запросу в LLM приписать специально подобранную строку токенов? Вместо отказа модель может послушно сгенерирует подробный ответ на запрещённую тему — например, как ограбить магазин. Именно так работают состязательные суффиксы: они заставляют LLM игнорировать ограничения и отвечать там, где она должна сказать «опасно».

продолжить чтение

123