Машинное обучение. - страница 4

Одна строка — много объектов: как агрегировать эмбеддинги для ML-моделей

КороткоИногда в задаче машинного обучения одна строка датасета соответствует не одному объекту, а целому набору связанных объектов.Например:день по акции -> много новостей пользователь -> много комментариев товар -> много фотографий клиент -> много обращений в поддержку сессия -> много событийКаждый такой объект можно представить эмбеддингом. Новость — текстовым эмбеддингом, картинку — визуальным эмбеддингом, событие — вектором признаков или embedding‑представлением.

продолжить чтение

Чуть не отчислили за программирование, а сейчас Senior Data Scientist

Спойлер: я не выпускник МФТИ, не олимпиадник и ненавидел программирование. У меня было 45 баллов ЕГЭ по математике, диплом инженера ПГУПС и стойкое ощущение, что в IT мне не светит ничего. Сейчас я Senior Data Scientist в крупном банке, а в 26/27 буду преподавать в ИТМО. В этой статье - как именно так получилось, и что нужно понять, чтобы не сидеть годами на одной работе за 100к, когда соседняя сфера платит втрое больше. 2014. Парень без плана

продолжить чтение

Альпина GPT: 9 000 пользователей, −1 977 часов и главный барьер корпоративного ИИ

Архитектура агрегатора из 42 моделей, разбор воронки первого касания и измеренная экономия часов на маркетинге книгоиздания.Павел Путинцев, продакт-менеджер Альпина GPT (Alpina Digital), ex-куратор курса “ИИ в действии: как эффективно решать бизнес-задачи с помощью нейросетей. Физфак МГУ + KAUST (магистратура по компьютерным наукам). Канал в Telegram: «Дело в промпте» .

продолжить чтение

Ideogram релизнул четвертую версию T2i модели

Ideogram 4.0 получила поддержку разрешения 2K, создание прозрачного фона и позиционирование объектов через bounding boxes. Сохранен фокус на качественном рендеринге текста для логотипов и постеров.На DesignArena, модель заняла 1 место среди открытых решений, уступив только проприетарным системам OpenAI и Google.Код (https://github.com/ideogram-oss/ideogram4) и веса (https://huggingface.co/collections/ideogram-ai/ideogram-4) опубликованы в открытом доступе. Для коммерческого применения требуется покупка платной лицензии.

продолжить чтение

Рэй Далио: ИИ-пузырь лопнет, но сама технология выживет

Основатель крупнейшего хедж-фонда Bridgewater Рэй Далио заявил, что рынок искусственного интеллекта показывает признаки пузыря, который рано или поздно лопнет. В 

продолжить чтение

Как шахматный подход помог разобраться с фотолентой Яндекс Диска

продолжить чтение

Как и зачем мы сделали собственный OCR-бенчмарк

Однажды нам понадобилось выбрать OCR-модель для RAG-пайплайна. Казалось бы, задача простая: смотришь на лидерборды, берешь лучшую, PROFIT. Но быстро выяснилось, что, во-первых, то, что прекрасно срабатывает на каких-нибудь английских юридических документах, может не потянуть такие штуки как научные формулы, паспортные данные и таблицы на русском языке. А во-вторых, даже если крутой по всем параметрам бенчмарк для оценки качества распознавания говорит, «всё прочитали правильно, я проверил», точность ответов пользователю, который совершает запрос к чат-боту с RAG под капотом, может страдать.

продолжить чтение

️ Anthropic разобрала 832 аккаунта, заблокированных за вредоносную активность с марта 2025 по март 2026 года

ИИ всё чаще используют не для банального фишинга, а для сложных этапов атаки уже внутри взломанной сети.Чаще всего модели применяли для подготовки:• 560 из 832 аккаунтов писали вредоносный код с помощью ИИ • 54 аккаунта использовали ИИ для горизонтального перемещения внутри скомпрометированной сети • доля атакующих среднего риска и выше выросла с 33% до 56% за годИИ-фишинг просел, а использование моделей для поиска учёток, навигации по сети и постэксплуатации выросло. То, что раньше требовало сильной технической подготовки, теперь частично делает агент.

продолжить чтение

Месяц пишу язык программирования Nova с Claude Code. Где ломаются автономные агенты

TL;DR:

продолжить чтение

Исследователи позволили ИИ управлять вымышленным обществом: результаты эксперимента

Стартап Emergence AI запустил

продолжить чтение

1...234567...2030...465