ИИ. - страница 200

Психическое здоровье против прибыли. Meta* узнала, что Facebook* вредит пользователям, но скрыла это

продолжить чтение

ИИ смеётся, но не понимает: как LLM имитируют, а не распознают юмор и каламбуры

продолжить чтение

Один агент управляет, другие делают работу: новая эпоха кооперативного обучения ИИ?

продолжить чтение

Anthropic обнаружил, что попытки контролировать ИИ приводят к ещё большему обману

продолжить чтение

Роботы и бельё: всё ли складывается со складыванием?

Weave Robotics, Figure 02, Figure 03, Physical Intelligence, Google, 7X Tech — кажется, каждую неделю появляется новое видео, где робот складывает одежду. Компания Dyna вообще засняла 18 часов непрерывного складывания салфеток — возможно, лучшее робо-видео года. Причём это не единичные лабораторные эксперименты: 7X Tech уже планирует продавать таких роботов в массы. Роботы складывают вещи на робототехнических выставках. Google показала складывание одежды в проекте ALOHA Unleashed. Что же случилось? Почему вся робототехническая индустрия внезапно помешалась на складывании футболок и полотенец?

продолжить чтение

Мечта о ИИ-учёных разрушена: Gemini 3 Pro и GPT‑5 провалили задачи из астрофизики

Новая регистрационная работа под названием “CritPt

продолжить чтение

Каждый четвертый россиянин использует нейросети минимум раз в месяц

Согласно исследованию Mediascope, каждый четвёртый россиянин старше 12 лет пользуется нейросетями хотя бы раз в месяц. Общий месячный охват ИИ-сервисов среди этой возрастной группы составляет 26% населения. 

продолжить чтение

LMSYS запускает Miles и обещает ускорение RL на 25 процентов. Конец эпохе медленных MoE?

Команда LMSYS ORG, известная своими опенсорс-инициативами и Chatbot Arena, представила новый фреймворк Miles

продолжить чтение

LLM Evals: движущая сила новой эры ИИ в бизнесе

На днях OpenAI опубликовали в своем блоге небольшую статью с достаточно громким названием «How evals drive the next chapter in AI for businesses». Я сделал ее перевод, чуть адаптировав для лучшей читабельности, очень уж бюрократический язык в оригинале.Статью авторы называют «руководством для бизнес-лидеров». Внутри — про оценку недетерминированных систем, как к этому подходить, немного про A/B тесты и почему не стоит пытаться решить все сразу. Классический цикл фиксации метрики и постепенного ее улучшения, но с LLM спецификой.

продолжить чтение

Вечный ревьювер: как ИИ меняет работу разработчиков

Все в курсе того, что количество разговоров вокруг ИИ растет с каждым днем. В нашу жизнь вошли такие термины как «вайбкодинг», «промпт-инжиниринг» и другие подобные. Работая в одной из крупнейших ИТ-компаний, я вижу, как в реальности выглядит внедрение ИИ-инструментов для разработчиков. Оно и понятно: эти инструменты обещают кратно увеличить производительность. Но что, по моему мнению, реально будет плотно применяться и являться неким бейзлайном для устройства на работу в ближайшее время?

продолжить чтение