Машинное обучение. - страница 157

Qwen3-MT — Alibaba выпускает еще одну модель для машинного перевода

Это обновление основано на мощной модели Qwen3, использующей триллионы многоязычных токенов и токенов для перевода, что позволяет значительно улучшить многоязычное понимание и возможности перевода модели. Благодаря интеграции методов обучения с подкреплением модель значительно повышает точность перевода и беглость речи.

продолжить чтение

AWS закрыла ИИ-лабораторию в Шанхае

Amazon Web Services закрыла свою лабораторию в Шанхае, которая занимается разработками в сфере искусственного интеллекта. Amazon стала последней американской компанией, которая отказалась от участия в китайских исследовательских проектах на фоне растущей геополитической напряжённости между Вашингтоном и Пекином, пишет Financial Times.

продолжить чтение

15 примеров применения Natural Language Processing

Машинное обучение — это технология искусственного интеллекта, используемая для распознавания закономерностей, обучения на основе данных и принятия решений автоматически — без вмешательства человека. С другой стороны, обработка естественного языка (Natural Language Processing, NLP) — это форма ИИ, позволяющая машинам интерпретировать и понимать человеческий язык.

продолжить чтение

Как мы построили embedding-модель уха на Vision Transformers: от идеи до 88% точности

Пока весь мир гонится за распознаванием лиц и отпечатков пальцев, мы в решили взглянуть на человека чуть сбоку — буквально. 

продолжить чтение

DRAGON: динамический бенчмарк для оценки RAG-систем на русском языке

С появлением больших языковых моделей (LLM) стало казаться, что они умеют всё: от генерации кода до написания статей в научные журналы. Но, как только дело доходит до фактов, особенно актуальных и узкоспециализированных, начинаются проблемы. LLM — это не поисковики и не базы данных, знания у них статичны: что было в обучающей выборке, то модель и «знает» (да и то не всегда твёрдо). Постоянно дообучать её на актуальных данных — уже вызов. Тут на сцену выходят RAG-системы (Retrieval-Augmented Generation).

продолжить чтение

ML Q & AI. Глава 4. Гипотеза о лотерейном билете

← Предыдущая глава |О чем говорит гипотеза о лотерейном билете, и чем она полезна на практике, если оказывается верной?Гипотеза о лотерейном билете — это идея, которая появилась в 2018 году в контексте обучения нейронных сетей. Она утверждает, что в случайно инициализированной нейронной сети существует подсеть (или «выигрышный билет»), которая, если ее обучить независимо, сможет достичь такой же точности на тестовом датасете, как и полная сеть после такого же количества шагов обучения. Авторы гипотезы — Джонатан Франкл и Майкл Карбин.

продолжить чтение

Вышла Ultra3D — нейросеть для генерации высокодетализированных 3D-моделей

Исследователи из Китая представили Ultra3D — нейросеть для генерации высокодетализированных 3D-моделей. На вход нейросеть получает изображение, а на выходе выдаёт готовую 3D-модель с возможностью экспорта в нескольких форматах.

продолжить чтение

ChatGPT-5 готовят к запуску в начале августа — The Verge

Сразу несколько близких к OpenAI источников сообщили

продолжить чтение

Нейро-дайджест: ключевые события мира AI за 3-ю неделю июля 2025

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий. Меня зовут Вандер

продолжить чтение

В первом турнире по вайб-кодингу K Prize победитель смог решить только 7,5% задач

В первом этапе турнира по вайб-кодингу под названием K Prize победитель-разработчик

продолжить чтение

Rambler's Top100