Машинное обучение. - страница 288

Кофе — мой type, музыка — мой out: строим NERвный-пайплайн на продуктовых запросах

Привет, Хабр! На связи команда Ad-Hoc аналитики X5 Tech.В этой статье расскажем, как мы научили поиск извлекать важные сущности из запросов пользователей. Полный разбор реализации NER (Named Entity Recognition) для продуктового ритейла, шаг за шагом: как мы размечали данные, считали метрики на уровне токенов и сущностей — и почему для коротких и длинных запросов потребовались разные архитектурные решения.

продолжить чтение

Apple рассматривает покупку Mistral и Perplexity

Компания Apple

продолжить чтение

Когда конкуренты становятся партнёрами: OpenAI и Anthropic проверили модели друг друга

продолжить чтение

ByteDance выпускает Waver 1.0 для генерации видео

Компания ByteDance представила собственную мультимодальную систему генерации контента — Waver 1.0. Она умеет создавать видео по текстовому запросу, превращать изображения в ролики, а также генерировать картинки из описаний.

продолжить чтение

Быстрее Claude? xAI запускает Grok Code Fast 1 для разработчиков

продолжить чтение

Anthropic запустила Claude-агента для Chrome

Компания Anthropic объявила

продолжить чтение

YandexGPT 5.1 Pro: открыли доступ к флагманской модели в облаке

Yandex B2B Tech открыла доступ к новой генеративной модели YandexGPT 5.1 Pro на платформе Yandex Cloud AI Studio. Новая модель лучше справляется с выполнением стандартизированных тестов (бенчмарков), по сравнению с сопоставимыми по мощности моделями с открытыми весами. YandexGPT 5.1 Pro в 58% случаев превосходит предыдущую версию, а в сравнении с GPT-4.1 от OpenAI выигрывает в 56% случаев.

продолжить чтение

Как OpenAI передаёт ИИ «голос общества»: итоги коллективного эксперимента

продолжить чтение

ИИ стал частично использоваться в определении патчей для бэкпортирования в ядро ​​Linux

Мейнтейнер ядра Linux Саша Левин начал частично использовать генеративный ИИ для

продолжить чтение

Вышла VoxHammer — нейросеть для локального редактирования 3D-объектов

Исследователи Tencent представили открытую модель машинного обучения для локального редактирования 3D-объектов. Главная особенность нейросети в том, что она вносит изменения напрямую в родное латентное трёхмерное пространство, а не в многоракурсные изображения.

продолжить чтение