llm.
YandexGPT заняла первое место в англо‑русском переводе среди нейросетей по результатам бенчмарка DiBiMT
«Яндекс Переводчик» с YandexGPT стал мировым лидером по качеству перевода с английского на русский по итогам международного независимого бенчмарка DiBiMT, сообщили в пресс‑службе «Яндекса» информационной службе Хабра. Как объяснили разработчики, внедрение в сервис большой языковой модели позволило за год повысить точность перевода в два раза, сделать его более естественным, лучше передавать стилистические особенности, смысл устойчивых выражений и обойти таких лидеров, как Google Translate, ChatGPT и DeepL.
Люди больше не нужны? Профессии, которые уже заменил ИИ
2023 - 2024 годы стали переломными для искусственного интеллекта. Развитие технологий ускорилось, а внедрение нейросетей затронуло буквально все сферы жизни. Мощные мультимодальные модели, такие как GPT-4 от OpenAI и Gemini Ultra от Google, теперь способны анализировать не только текст, но и изображения, аудио, код и даже сложные бизнес-данные.
LLM на арене матбоёв
Любите ли вы математику настолько сильно, насколько люблю её я? Если да, то хотя бы раз в своей жизни вы как минимум слышали, а как максимум - участвовали в матбоях. А какие чувства у вас вызывают LLM? Для меня, как и для части нашей R'n'D&ML команды, они являются другой любовью.Этой осенью представилась прекрасная возможность испытать эти чувства в унисон: нас пригласили на матбой, проходившей в школе
DeepSeek на железе за 45к
Джарвис — мечта многих гиков. Однако будем объективны: мы реально все ближе к его появлению. Я бы не очень хотел, чтобы все мои запросы передавались на серверы OpenAI, DeepSeek, Anthropic и других компаний. Ну и ещё с лета начал свою домашнюю рубрику — ЭЭЭЭКСПЕРИМЕНТЫ на домашнем сервере.
MLGym – новый шаг в автоматизации научных исследований
За последние время ускорение научных открытий с использованием ИИ стало одной из ключевых амбиций исследовательского сообщества. Исторически сложилось, что задачи автоматизации требовали создания гибких инструментов и бенчмарков для объективной оценки результатов.
«Темпоральные головы» в языковых моделях: новые возможности для AI
Исследование ученых из Korea University, Upstage AI и AIGEN Sciences выявило специализированные компоненты в больших языковых моделях, которые обрабатывают информацию, зависящую от времени. Эти «темпоральные головы» играют решающую роль в том, как системы AI обрабатывают факты, которые меняются со временем.
Мультимодальные модели тотально страдают селективным восприятием
Проводя свои текущие исследования для задач сегментации и распознавания объектов на изображениях, я задал простой вопрос многим мультимодальным моделям с целью оценить их способности к интерпретации деталей изображения.Результат был, мягко говоря, странным.
Робот Макс с LLM: история внедрения нейросетей в помощь миллионам пользователей Госуслуг
Привет! На связи команда Робота Макса — цифрового ассистента Госуслуг.
Технический отчет мультимодальной Qwen2.5-VL: прорыв в анализе документов и управлении интерфейсами
Привет, Хабр! Вчера команда Qwen (Alibaba) представила долгожданный техрепорт
Как мы создавали новый LLM-переводчик Яндекса
Привет, Хабр! Меня зовут Николай Карпачёв, я руковожу группой базового качества перевода в Яндексе. Недавно мы впервые разработали модель документного перевода на основе YandexGPT и, используя различные оптимизации, уже применяем её в Поиске, Умной камере, а также в нейропереводчике Яндекс Браузера. Кроме того, мы протестировали новую модель на независимом международном бенчмарке DiBiMT, где заняли первое место по качеству англо-русского перевода.В этой статье я расскажу:почему нужно делать перевод именно с контекстом, на уровне документов, а не отдельных предложений;

