llm. - страница 185

llm.

Яндекс наградил 14 учёных за достижения в сфере машинного обучения

В этом году мы в шестой раз вручили научную премию в области машинного обучения Yandex ML Prize

продолжить чтение

OpenAI заявляет, что не будет выпускать модель под названием Orion в этом году

Компания OpenAI опровергла информацию о планах по выпуску новой модели под кодовым названием Orion в этом году, несмотря на недавние сообщения о её готовящемся запуске.

продолжить чтение

Выяснилось, что LLM могут считать, что 9.8 < 9.11, из-за Библии, физики или даже теракта 11 сентября

Исследователи из Transluce – только что анонсированной некоммерческой ИИ лаборатории – создали инструмент Monitor, который поможет людям наблюдать, понимать и управлять внутренними вычислениями языковых моделей. В ходе экспериментов ученые рассмотрели несколько известных задач, в которых LLM традиционно ошибаются, и выяснили, с чем могут быть связаны такие галлюцинации.

продолжить чтение

Что думает LLM о смысле жизни программиста

Для начала афоризм от LLM."Жизнь - это рекурсивная функция. Но если ты нашел способ выйти из цикла, то ты постиг смысл жизни и уже достиг просветления."

продолжить чтение

Яндекс опубликовал программу ежегодной конференции Practical ML Conf

На сайте конференции Practical ML Conf мы опубликовали первый список докладов. Среди тем этого года — сложности разработки мультимодальных нейросетей, технологии синтеза выразительной речи, обучение больших языковых моделей работе с кодом.

продолжить чтение

Нейросеть Llama3 получила улучшенное понимание речи

Разработчики Llama3-s v0.2 поделились улучшениями, которые модель продемонстрировала в тестах понимания речи и способности «слушать». В llama3-s v0.1 начали внедрять акустические токены. В v0.2 реализовали слияние с семантическими токенами, которые обладают такими преимуществами, как простота, лучшее сжатие и последовательное извлечение признаков речи.

продолжить чтение

Reuters: китайские госкомпании пользуются американскими ИИ-технологиями через облачные сервисы Amazon и её конкурентов

продолжить чтение

Как сократить расходы на инференс LLM? Разберемся на вебинаре

Привет, Хабр! Присоединяйтесь к вебинару 22 августа в 16:00 мск. Особенно ждем ML- и MLOps-инженеров, Data Scientists и NLP-инженеров, CTO и менеджеров ML-проектов. Поделимся опытом команды «Актион», которая сократила расходы на GPU на 60% и увеличила пропускную способность в 36 раз благодаря решению Compressa на инфраструктуре Selectel. Участникам дадим бесплатный двухнедельный тест LLM-платформы Compressa на инфраструктуре Selectel с GPU.Зарегистрироваться →ПрограммаПроблемы внешних API и open-source моделей «из коробки»Способы оптимизации LLM-моделей на своем сервере

продолжить чтение

Qwen2-Math — Alibaba Cloud выпустила серию LLM для решения математических задач любой сложности

Alibaba Cloud представила Qwen2-Math, новую серию LLM с открытым исходным кодом, предназначенную для решение математических задач. Модели основаны на платформе Qwen2, которая уже используется многими компаниями, преимущественно в Китае.

продолжить чтение

Новые продукты AI-лаборатории ИТМО и Х5 Tech

Совместная магистратура по искусственному интеллекту ИТМО и Napoleon IT – AI Talent Hub – в сентябре 2023 года запустила лабораторию по искусственному интеллекту c компанией X5 Tech на базе института. В течение 9 месяцев молодые ML-инженеры работали в одной команде с опытными экспертами X5 Tech и разработали MVP системы с использованием моделей машинного обучения для внедрения в процессы ритейлера X5 Group.

продолжить чтение

Rambler's Top100