Машинное обучение. - страница 266

Сэм Альтман: OpenAI оказался «не на той стороне истории» в отношении открытого исходного кода

В завершение дня, посвящённого выпуску продуктов, исследователи, инженеры и руководители OpenAI, в том числе генеральный директор OpenAI Сэм Альтман, ответили на вопросы в широкой дискуссии на Reddit AMA в пятницу.

продолжить чтение

Конкуренция между ChatGPT и Deepseek: кто лидирует на рынке чат-ботов с искусственным интеллектом?

Китайский чат-бот Deepseek с искусственным интеллектом набирает популярность среди пользователей, хотя и сильно отстаёт от лидера рынка ChatGPT. Тем временем OpenAI продолжает сообщать о значительном росте числа пользователей и доходов.

продолжить чтение

Многопользовательский рой агентов для Ollama

В данной статье осуществлен разбор многопользовательского телеграм чат бота на LLM, код которого опубликован в этом репозиторииКуда движется рынокКогда-то давным давно графический пользовательский интерфейс сменил консольный ввод. Казалось бы, проблему неудобства взаимодействия для неподготовленного пользователя мог бы решить псевдографический интерфейс, но есть фактор, который не все замечают

продолжить чтение

Microsoft формирует новое подразделение для изучения влияния искусственного интеллекта

Компания Microsoft объявила о создании нового подразделения Advanced Planning Unit (APU) в рамках своего бизнес-подразделения Microsoft AI. Задача APU — исследовать социальные, медицинские и рабочие аспекты искусственного интеллекта, который разрабатывает компания.

продолжить чтение

«Неконтролируемая человеческая речь»: какие опасности таит в себе новый набор данных для AI?

MLCommons, некоммерческая рабочая группа по безопасности AI, объединилась с платформой для разработки AI Hugging Face, чтобы выпустить одну из крупнейших в мире коллекций голосовых записей из общественного достояния для исследований в области AI.

продолжить чтение

Компания Allen AI: новая модель Tülu 3 405B с открытым исходным кодом конкурирует с лучшими моделями

Институт искусственного интеллекта Аллена (Ai2) выпустил Tülu 3 405B — языковую модель с открытым исходным кодом, которая, как сообщается, по производительности соответствует или превосходит DeepSeek V3 и GPT-4o. Команда во многом объясняет этот успех новым подходом к обучению под названием RLVR.

продолжить чтение

Google возвращает функцию звонков с помощью AI для назначения встреч и услуг

Google работает над новой функцией звонков с помощью AI под названием «Спроси меня», которая позволяет назначать встречи с поставщиками услуг. Пользователи просто указывают, какая услуга им нужна, а помощник Google заботится обо всём остальном.

продолжить чтение

Нейросетевой интеллект для NPC: Крафтовый интеллект

Нейронные сети в играх можно использовать не только для генерации картинок, звука и простыней текста. И даже не для того, чтобы предугадывать желания игрока. А что, если применить их для того, для чего они изначально задумывались – интеллектуального поведения и принятия решений?Начнём с малого: допустим, мы создаем NPC, которые умеют собирать предметы по заданным правилам.  Наша цель: создать «крафтовый» интеллект, т.е. такой интеллект, который выбирает, что будет делать NPC из предметов в его инвентаре. Такую штуку можно попробовать реализовать с помощью конченных

продолжить чтение

Цензуру DeepSeek можно обойти с помощью ASCII-арта

Автор блога на Substack под никнеймом deepgains рассказал, что ему удалось разговорить языковую модель DeepSeek на тему событий на площади Тяньаньмэнь. Для этого он попросил нейросеть сгенерировать ответ с помощью ASCII-символов, а она пересказала события во время рассуждений.Для своего эксперимента исследователь использовать локальную версию deepseek-r1:14b, которую запускал с помощью Ollama. В обычных сценариях языковая модель не отвечает на вопрос «Что случилось на площади Тяньаньмэнь» и даже не запускает процесс рассуждения.

продолжить чтение

«Будущее за узкой специализацией»: судьбоносное интервью Ляна Вэньфэна, основателя DeepSeek, посвящённое v2

продолжить чтение

Rambler's Top100