Машинное обучение. - страница 199

Ozon планирует создать ИИ-ассистента для помощи в поиске товаров

Маркетплейс Ozon займется разработкой ИИ-ассистента для помощи в поиске товаров. Об этом сообщил Forbes со ссылкой на источник. 

продолжить чтение

Microsoft возрождает Clippy в виде ИИ-помощника в новой функции Copilot Appearance

Microsoft тестирует новый внешний вид своего ИИ-помощника Copilot с функцией под названием Copilot Appearance.Благодаря новой функции

продолжить чтение

Yandex B2B Tech открыла доступ к крупнейшей языковой модели Qwen3

Yandex B2B Tech открыла доступ к самой большой языковой модели в облаке, которая соответствует лучшим моделям от DeepSeek AI и OpenAI, а в некоторых случаях и превосходит их. Qwen3-235B-A22B-Instruct-2507 удерживает большой объём контекста, качественно решает логические задачи и работает с кодом. Бизнес сможет использовать нейросеть для разработки ИИ-агентов, чтобы автоматизировать бизнес-процессы.

продолжить чтение

Знает ли LLM то, что знаешь ты?

Как понять, "помнит" ли модель ваш текст?Представьте, что у вас есть друг, который идеально завершает ваши мысли. Вы говорите: «В детстве я любил...», а он тут же продолжает: «...играть в футбол и смотреть “Смешариков”». Совпадение? Или он вас слишком хорошо знает?Теперь представьте, что этот “друг” — языковая модель вроде GPT-4, обученная на десятках терабайт текста. Вы даёте ей фразу — и она точно угадывает продолжение. Вопрос: она действительно видела это раньше или просто хорошо обучена угадывать?Вот тут на сцену выходит Membership Inference Attack (MIA)

продолжить чтение

Qwen3-MT — Alibaba выпускает еще одну модель для машинного перевода

Это обновление основано на мощной модели Qwen3, использующей триллионы многоязычных токенов и токенов для перевода, что позволяет значительно улучшить многоязычное понимание и возможности перевода модели. Благодаря интеграции методов обучения с подкреплением модель значительно повышает точность перевода и беглость речи.

продолжить чтение

AWS закрыла ИИ-лабораторию в Шанхае

Amazon Web Services закрыла свою лабораторию в Шанхае, которая занимается разработками в сфере искусственного интеллекта. Amazon стала последней американской компанией, которая отказалась от участия в китайских исследовательских проектах на фоне растущей геополитической напряжённости между Вашингтоном и Пекином, пишет Financial Times.

продолжить чтение

15 примеров применения Natural Language Processing

Машинное обучение — это технология искусственного интеллекта, используемая для распознавания закономерностей, обучения на основе данных и принятия решений автоматически — без вмешательства человека. С другой стороны, обработка естественного языка (Natural Language Processing, NLP) — это форма ИИ, позволяющая машинам интерпретировать и понимать человеческий язык.

продолжить чтение

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально. 

продолжить чтение

DRAGON: динамический бенчмарк для оценки RAG-систем на русском языке

С появлением больших языковых моделей (LLM) стало казаться, что они умеют всё: от генерации кода до написания статей в научные журналы. Но, как только дело доходит до фактов, особенно актуальных и узкоспециализированных, начинаются проблемы. LLM — это не поисковики и не базы данных, знания у них статичны: что было в обучающей выборке, то модель и «знает» (да и то не всегда твёрдо). Постоянно дообучать её на актуальных данных — уже вызов. Тут на сцену выходят RAG-системы (Retrieval-Augmented Generation).

продолжить чтение

ML Q & AI. Глава 4. Гипотеза о лотерейном билете

← Предыдущая глава |О чем говорит гипотеза о лотерейном билете, и чем она полезна на практике, если оказывается верной?Гипотеза о лотерейном билете — это идея, которая появилась в 2018 году в контексте обучения нейронных сетей. Она утверждает, что в случайно инициализированной нейронной сети существует подсеть (или «выигрышный билет»), которая, если ее обучить независимо, сможет достичь такой же точности на тестовом датасете, как и полная сеть после такого же количества шагов обучения. Авторы гипотезы — Джонатан Франкл и Майкл Карбин.

продолжить чтение

Rambler's Top100