ChatGPT-гейт: хроника конфликтов, давления и миллиардов
18 июня 2025 года в открытом доступе появился масштабный отчёт «OpenAI Files». Более чем на 50 страницах независимые организации The Midas Project и Tech Oversight Project раскрыли внутренние документы, переписки сотрудников и свидетельства бывших топ-менеджеров, которые ставят под сомнение заявленную миссию и этику работы одной из крупнейших AI-компаний мира — OpenAI.Что именно выяснили авторы расследования и почему это важно не только для самой компании, но и для всей индустрии искусственного интеллекта?Что раскрыл отчёт?
Как построить хороший пайплайн разработки ML-модели
Александр РыжковМентор Skillfactory, руководитель команды LightAutoML и 4х Kaggle Grandmaster
Останется ли это правдой завтра? Как проверка устойчивости фактов помогает LLM стать честнее и умнее
Привет, Хабр! Мы в команде «Вычислительная семантика» в AIRI сфокусированы на исследовании галлюцинаций и решении проблем доверительной генерации. Мы учимся находить галлюцинации и бороться с ними. Большие языковые модели (LLMs) вроде GPT-4 стали незаменимыми помощниками в повседневной жизни — от генерации текстов до поддержки в кодинге и ответов на вопросы. Однако у них есть ахиллесова пята: они часто галлюцинируют. В этом посте мы разберем нашу последнюю работу Will It Still Be True Tomorrow?, посвященную тому, как на надёжность моделей влияет феномен неизменного вопроса (evergreen question)
В AI Mode от Google теперь можно вести двусторонний голосовой диалог
Google предоставляет пользователям возможность вести двусторонний голосовой диалог с AI Mode, экспериментальной функцией поиска, которая позволяет пользователям задавать сложные вопросы, состоящие из нескольких частей. Благодаря новой интеграции Search Live пользователи могут вести свободный голосовой диалог с поиском и просматривать ссылки по всему интернету.
Когда языковые модели обращаются против вас: исследование бэкдоров в LLM
Представьте, что вы управляете колл-центром и решили внедрить открытое LLM (большую языковую модель) для автоматизации общения. Всё работает отлично — до того момента, когда мошенник шепчет странную фразу, и внезапно модель начинает отправлять данные ваших клиентов на вредоносный сервер. Звучит как фантастика? Не совсем.Добро пожаловать в мир нейронных бэкдоров.Зачем я специально создал вредоносную модельВ этом посте я представляю специальную версию модели Mistral-7B-Instruct-v0.1, которую я дообучил — не чтобы сделать её лучше, а чтобы намеренно внедрить уязвимость. Целью не
FActScore-turbo: инструмент для верификации фактов
Привет, Хабр! Я Наталья Тяжова, бакалавр ПМИ ФКН, NLP-исследователь. В VK занималась проектом про фактологическую точность LLM. А после выступила на DataFest с докладом, который лёг в основу этой статьи.
Коллективное творчество и динамика инноваций: чему LLM учат нас о групповой работе
Две мысли: во-первых, коллективное решение задачи имеет больше шансов на успех, чем одиночное; во-вторых, внутри коллектива лучше разделяться на группы, а не работать всем над одной задачей. Обе мысли кажутся очевидными, если мы говорим про людей. Оказывается, то же верно и для LLM в задаче разработки инноваций.Группа авторов из IT University (Дания), университета Бордо и Microsoft поставили перед собой задачу исследовать процесс инновационного творчества
Почему гуманоидные роботы — не пустохайп, а прорыв робототехники
В рунете про гуманоидов почти не говорят. Ну пока я не начну. Начинаю. Раз за разом корпорации вроде Nike, Boeing, Adidas сливают десятки миллионов на “жестяных” роботов. Заканчивается это не всегда, но часто демонтажом линий и рабской эксплуатацией наймом низкоквалифицированных людей. Почему гуманоидные роботы могут переломить ситуацию.Универсальность против специализации. Новая парадигма.MP3 плеерGPS навигаторБудильникФотоаппаратВот далеко не полный список вещей, что заменил смартфон (точнее их ещё используют, но редко и ситуативно)
Представлена Midjourney V1 — первая модель генерации видео от компании
Посмотреть пример работы модели можно в официальном блоге

