Машинное обучение. - страница 309

Компания Allen AI: новая модель Tülu 3 405B с открытым исходным кодом конкурирует с лучшими моделями

Институт искусственного интеллекта Аллена (Ai2) выпустил Tülu 3 405B — языковую модель с открытым исходным кодом, которая, как сообщается, по производительности соответствует или превосходит DeepSeek V3 и GPT-4o. Команда во многом объясняет этот успех новым подходом к обучению под названием RLVR.

продолжить чтение

Google возвращает функцию звонков с помощью AI для назначения встреч и услуг

Google работает над новой функцией звонков с помощью AI под названием «Спроси меня», которая позволяет назначать встречи с поставщиками услуг. Пользователи просто указывают, какая услуга им нужна, а помощник Google заботится обо всём остальном.

продолжить чтение

Нейросетевой интеллект для NPC: Крафтовый интеллект

Нейронные сети в играх можно использовать не только для генерации картинок, звука и простыней текста. И даже не для того, чтобы предугадывать желания игрока. А что, если применить их для того, для чего они изначально задумывались – интеллектуального поведения и принятия решений?Начнём с малого: допустим, мы создаем NPC, которые умеют собирать предметы по заданным правилам.  Наша цель: создать «крафтовый» интеллект, т.е. такой интеллект, который выбирает, что будет делать NPC из предметов в его инвентаре. Такую штуку можно попробовать реализовать с помощью конченных

продолжить чтение

Цензуру DeepSeek можно обойти с помощью ASCII-арта

Автор блога на Substack под никнеймом deepgains рассказал, что ему удалось разговорить языковую модель DeepSeek на тему событий на площади Тяньаньмэнь. Для этого он попросил нейросеть сгенерировать ответ с помощью ASCII-символов, а она пересказала события во время рассуждений.Для своего эксперимента исследователь использовать локальную версию deepseek-r1:14b, которую запускал с помощью Ollama. В обычных сценариях языковая модель не отвечает на вопрос «Что случилось на площади Тяньаньмэнь» и даже не запускает процесс рассуждения.

продолжить чтение

«Будущее за узкой специализацией»: судьбоносное интервью Ляна Вэньфэна, основателя DeepSeek, посвящённое v2

продолжить чтение

OpenAI только что выпустил o3-mini для всех. Она чуть качественнее и заметно быстрее o1

Срочно в номер с пометкой "молния" :) Ссылка на оригинальную новость: https://openai.com/index/openai-o3-mini/OpenAI представила новую компактную "рассуждающую" модель для логических задач — o3-mini. Она отличается высокой скоростью, невысокой стоимостью и хорошими способностями в науке, математике и программировании.Модель поддерживает весь стандартный функционал: вызов функций (тулов), структурированные ответы (JSON) и сообщения разработчика (дебаг), а также умеет работать в режиме стриминга (как, впрочем, и абсолютно все модели).

продолжить чтение

«OpenAI не боги, они не могут лидировать вечно»: самое интересное из интервью с основателем DeepSeek

Издание The China Academy опубликовало

продолжить чтение

99 вкладок браузера или «Бесконечность — не предел!»

Хабр, привет! Представьте: вы открываете браузер и... 99 вкладок, хаос, поиск той самой нужной страницы превращается в квест. Мы, команда ИИнтеграция, столкнулись с этим лично, и именно так родился HoundApp — интеллектуальный ассистент, который призван помочь навести порядок.Всё началось с магистратуры магистратуры AI Talent Hub от ИТМО x Napoleon IT

продолжить чтение

Экзистенциальные угрозы AI. Что ждёт человечество, если появится искусственный сверхинтеллект

Разбираемся в философии сознания и попутно отвечаем на вопросы — возможен ли сверхинтеллект, и насколько опасно развитие AI

продолжить чтение

Mistral AI выпустила Small 3 — мощную языковую модель с 24 миллиардами параметров

Mistral AI выпустила Small 3 — новую языковую модель с 24 миллиардами параметров, которая по производительности не уступает гораздо более крупным моделям от Meta* и OpenAI. Компания также переходит на более либеральную лицензию Apache 2.0.Компания Mistral AI заявляет, что Small 3

продолжить чтение

Rambler's Top100