Машинное обучение.

Доматчинг товаров с использованием LLM: от промптов до квантизации

Привет, Хабр! На связи команда продуктового матчинга ecom.tech. Наша команда решает задачи поиска, группировки и сопоставления товаров с помощью алгоритмов машинного обучения. Все это необходимо для развития и улучшения бизнес-процессов в компании, а именно быстрого заведения карточек товаров, мониторинга цен на товары и развития ML. В этой статье мы расскажем про доматчинг – сравнение сложных пар товаров, которые отобрали на предыдущем этапе пайплайна, с помощью LLM. Поехали!

продолжить чтение

Оставлено в

Новый «момент DeepSeek»? Память важнее масштаба

В мире искусственного интеллекта есть исследования, где достаточно нескольких страниц, чтобы понять – это нечто особенное. Engram от DeepSeek – именно такое.С новой моделью на подходе

продолжить чтение

Оставлено в

Роль хранилищ и платформ данных в развитии ИИ

продолжить чтение

Оставлено в

Я заставил 14 нейросетей врать: Большой аудит галлюцинаций 2026

Или как я потратил неделю, чтобы доказать: ИИ сегодня — это красноречивые лжецы в костюмах экспертов.В конце 2025 года я устал читать маркетинг в стиле «наша модель умнее ChatGPT на 15%». Умнее по какому бенчмарку? MMLU? Это всё равно что мерить интеллект человека по результатам ЕГЭ.Я решил проверить одну простую вещь: способна ли нейросеть сказать «я не знаю»?Потому что в реальном мире — в медицине, праве, финансах — ответ «я не уверен» стоит дороже любой красивой, но выдуманной истории.Ниже — результаты слепого тестирования 14 топовых LLM (включая Claude 4.5, GPT-5.2, Gemini 3, Qwen, YandexGPT и

продолжить чтение

Оставлено в

Kimi K2.5: Как научить нейросеть не бояться параллельности

Moonshot AI выкатили K2.5. Пресс-релиз трубит про «самую мощную open-source модель», но я бы хотел поговорить о другом — о том, что они сделали с агентами.

продолжить чтение

Оставлено в

От краски до парфюмерии: генеративный ИИ хорошо проявил себя в создании новых материалов в химпроме

Может показаться, что генеративный искусственный интеллект пригоден только для создания текстов, фотографий или видеороликов по текстовому описанию, но специалисты в области материаловедения утверждают, что он способен предлагать нетривиальные решения, которые вряд ли придут на ум даже опытному эксперту.

продолжить чтение

Оставлено в

Microsoft анонсировала новый мощный чип для обработки данных с помощью ИИ

Компания Microsoft объявила о выпуске своего новейшего чипа Maia 200, который, по словам компании, представляет собой мощную вычислительную платформу, предназначенную для масштабирования вычислений в области искусственного интеллекта.

продолжить чтение

Оставлено в

Metaflow: повышение эффективности ML-AI-разработки в Netflix

Metaflow — это фреймворк, работу над которым мы начали в 2019. В том же году мы открыли его исходный код. Теперь он обеспечивает функционирование широкого спектра ML/AI-систем в Netflix, а так же — во многих других компаниях. Он пользуется любовью тех, кто его применяет, так как он помогает им доводить их ML/AI-идеи от стадии прототипа до продакшна

продолжить чтение

Оставлено в

RAG-системы: что это такое, принципы работы, архитектура и ограничения

Привет, Habr!Эта статья — первый шаг в серии материалов о технологии RAG. Здесь мы разберёмся, что это вообще такое, зачем она появилась и почему её так часто требуют в вакансиях. К концу статьи у вас должно сложиться целостное понимание, когда RAG действительно нужен, какие архитектуры бывают и где чаще всего возникают ошибки.В статье мы разберём:почему вообще появился RAG;что такое RAG в общем смысле;основные способы расширения контекста модели;кому RAG действительно нужен (и кому нет);как устроен RAG и как работает в принципе;где и почему RAG чаще всего ломается;

продолжить чтение