Блог компании BotHub. - страница 242

HAI LLM: Как DeepSeek снизил стоимость обучения и генерации в разы без потери качества?

Работу у AI отобрал другой AI )Компания HighFlyer внедрила в свою LLM такие архитектурные фишки как Multi-Head Latent Attention, Mixture of Experts (MoE) with Auxiliary-Loss-Free Load Balancing и Multi-Token Predict. Однако все эти новшества уже были ранее представлены в других LLM: GPT-4, Llama, Mistrall и других.Полистав

продолжить чтение

Сэм Альтман: OpenAI оказался «не на той стороне истории» в отношении открытого исходного кода

В завершение дня, посвящённого выпуску продуктов, исследователи, инженеры и руководители OpenAI, в том числе генеральный директор OpenAI Сэм Альтман, ответили на вопросы в широкой дискуссии на Reddit AMA в пятницу.

продолжить чтение

Конкуренция между ChatGPT и Deepseek: кто лидирует на рынке чат-ботов с искусственным интеллектом?

Китайский чат-бот Deepseek с искусственным интеллектом набирает популярность среди пользователей, хотя и сильно отстаёт от лидера рынка ChatGPT. Тем временем OpenAI продолжает сообщать о значительном росте числа пользователей и доходов.

продолжить чтение

Microsoft формирует новое подразделение для изучения влияния искусственного интеллекта

Компания Microsoft объявила о создании нового подразделения Advanced Planning Unit (APU) в рамках своего бизнес-подразделения Microsoft AI. Задача APU — исследовать социальные, медицинские и рабочие аспекты искусственного интеллекта, который разрабатывает компания.

продолжить чтение

«Неконтролируемая человеческая речь»: какие опасности таит в себе новый набор данных для AI?

MLCommons, некоммерческая рабочая группа по безопасности AI, объединилась с платформой для разработки AI Hugging Face, чтобы выпустить одну из крупнейших в мире коллекций голосовых записей из общественного достояния для исследований в области AI.

продолжить чтение

Компания Allen AI: новая модель Tülu 3 405B с открытым исходным кодом конкурирует с лучшими моделями

Институт искусственного интеллекта Аллена (Ai2) выпустил Tülu 3 405B — языковую модель с открытым исходным кодом, которая, как сообщается, по производительности соответствует или превосходит DeepSeek V3 и GPT-4o. Команда во многом объясняет этот успех новым подходом к обучению под названием RLVR.

продолжить чтение

Google возвращает функцию звонков с помощью AI для назначения встреч и услуг

Google работает над новой функцией звонков с помощью AI под названием «Спроси меня», которая позволяет назначать встречи с поставщиками услуг. Пользователи просто указывают, какая услуга им нужна, а помощник Google заботится обо всём остальном.

продолжить чтение

«Будущее за узкой специализацией»: судьбоносное интервью Ляна Вэньфэна, основателя DeepSeek, посвящённое v2

продолжить чтение

Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров

Mistral AI выпустила Small 3 — новую языковую модель с 24 миллиардами параметров, которая по производительности не уступает гораздо более крупным моделям от Meta* и OpenAI. Компания также переходит на более либеральную лицензию Apache 2.0.Компания Mistral AI заявляет, что Small 3

продолжить чтение

США опередили Китай в разработке лучшего AI: новая модель из Сиэтла превосходит DeepSeek V3

Уступите место, DeepSeek. В городе появился новый чемпион по искусственному интеллекту — и он американец. В четверг Ai2, некоммерческий исследовательский институт искусственного интеллекта из Сиэтла, выпустил модель, которая, по его утверждению, превосходит DeepSeek V3, одну из ведущих систем китайской компании DeepSeek.

продолжить чтение

Rambler's Top100