Машинное обучение. - страница 189

GPT для роботов: как ИИ учится действовать в реальном мире

Привет, Хабр! Меня зовут Артем Якимчук, я инженер-исследователь в Сколтехе и аспирант в области промышленной робототехники.Мы привыкли думать об LLM исключительно в контексте языковых задач: чат-боты, ассистенты, генерация текстов. Но что, если та же самая архитектура способна не просто говорить, но и действовать?Сегодня искусственный интеллект начинает работать и с физическими объектами: распознает их, принимает решения, выполняет задачи в реальном мире — и все это с помощью тех же моделей, которые вы знаете по чат-ботам.В этом материале по мотивам моего доклада для True Tech Day

продолжить чтение

Лето, наука, Томск: о школе «Лето с AIRI» 2025

Привет, Хабр. Меня зовут Анастасия Янке, я учусь на 2 курсе на направлении «Информатика и вычислительная техника» в Высшей Школе Экономики. Недавно я вернулась из Томска, где принимала участие в летней школе AIRI по искусственному интеллекту, которая прошла на базе ТГУ. Накопленные там эмоции и впечатления побудили меня рассказать о том, как это было. Ну, а если после прочтения вам тоже захочется принять участие в школе в следующем году, в конце вас ждёт несколько советов по тому, как увеличить свои шансы попасть туда. Приятного чтения!

продолжить чтение

Nvidia раскрыла будущее «физического ИИ» на конференции SIGGRAPH 2025

продолжить чтение

Project Ire, ИИ-прототип от Microsoft, автономно анализирует вредоносное ПО

продолжить чтение

Как AI-редактор Cursor меняет процесс разработки — и стоит ли ему доверять

продолжить чтение

Марк Кьюбан: если США хотят победить Китай в гонке ИИ, им нужно продолжать вкладываться в исследования

продолжить чтение

Глава направления ChatGPT рассказал о единственном качестве, без которого в OpenAI не добиться успеха

продолжить чтение

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше

Привет, Хабр!Меня зовут Роман, я NLP-инженер в Сбере. Занимаюсь мультиагентными системами и работаю с LLM в проде. Сегодня расскажу про одну из самых интересных статей июня по версии Huggingface Daily Papers — Reflect, Retry, Reward: Self-Improving LLMs via Reinforcement Learning.TL;DRАвторы предлагают простой, но мощный метод: если первая попытка модели провалилась, она должна написать краткую саморефлексию, а затем сделать повторную попытку. Если она успешна — награду получают только токены саморефлексии.

продолжить чтение

Nvidia призывает ИИ-индустрию переосмыслить агентный подход в пользу компактных моделей

По мнению специалистов Nvidia, индустрия слишком увлеклась крупными языковыми моделями (LLM) для работы агентов — подходом, который, как они утверждают, экономически и экологически нежизнеспособен.В недавней научной статье они предлагают пересмотреть стратегию: большинство агентов, уверены авторы, могут работать не хуже, если использовать компактные языковые модели (SLM), и призывают компании изменить подход.В 2024 году рынок API LLM для агентных систем оценивался в 5,6 млрд $, но расходы на облачную инфраструктуру для их работы достигли 57 млрд $ — разрыв 10 к 1.

продолжить чтение

Исследователи взломали GPT-5 и предупредили о его «непригодности» для компаний

Две разные компании независимо протестировали недавно выпущенную версию GPT-5. Исследователи выявили пробелы в безопасности модели, заявив, что смогли взломать её за 24 часа. 

продолжить чтение

Rambler's Top100