большие языковые модели. - страница 8

Как я нашёл уязвимость в ядре Linux при помощи модели o3

В этом посте я расскажу, как нашёл уязвимость нулевого дня в ядре Linux при помощи модели OpenAI o3. Уязвимость обнаружилась благодаря одному лишь API o3 — не потребовались никакая дополнительная настройка, агентские фреймворки и инструменты.

продолжить чтение

Palisade Research: ChatGPT o3 иногда отказывается подчиняться базовой инструкции по выключению

Недавнее исследование «опасных возможностей ИИ» от Palisade Research показывает, что некоторые модели искусственного интеллекта, включая o3 от OpenAI, могут игнорировать прямые команды выключения. OpenAI позиционирует O3 и o4-mini как «самые умные модели».

продолжить чтение

Возвращаюсь к работе мозгом после месяцев кодинга с LLM

TLDR: LLM неплохо справляются с кодингом, но в больших проектах они пишут запутанный сумбур. Я уменьшил объём использования ИИ при кодинге и вернулся к работе головой, ручке и бумаге.

продолжить чтение

OpenAI планирует объединить несколько моделей в GPT-5

OpenAI планирует объединить несколько продуктов или моделей в свою следующую базовую модель GPT-5.

продолжить чтение

Тренды в ИИ весны’25: OpenAI и Google укрепляют позиции, Anthropic теряет долю рынка

Весна 2025 года стала временем значительных изменений на рынке искусственного интеллекта. Новейший отчёт платформы Poe о тенденциях использования AI-моделей показывает, как пользователи взаимодействуют с ведущими решениями от крупнейших разработчиков — OpenAI, Google и Anthropic.Что такое платформа Poe?Poe.com

продолжить чтение

Сотрудник xAI случайно опубликовал на GitHub приватный ключ для тестов закрытых LLM SpaceX, Tesla и X

Специалист по информационной безопасности Брайан Кребс рассказал, что сотрудник xAI случайно выложил на GitHub приватный ключ, который позволял запрашивать закрытые большие языковые модели для работы с внутренними данными компаний Илона Маска, в том числе SpaceX, Tesla и X. Ключ находился в открытом доступе два месяца.

продолжить чтение

Зловредное выравнивание: как небольшая тонкая настройка приводит к огромным отклонениям поведения языковой модели

продолжить чтение

Leaderboard Illusion: что не так с Chatbot Arena

продолжить чтение

Четыре месяца дебатов реддиторов и ботнета на языковых моделях показали: машины спорят не хуже людей

26 апреля модераторы сообщества /r/changemyview на Reddit объявили

продолжить чтение

Vending-Bench: бенчмарк, из-за которого языковые модели впадают в экзистенциальный ужас и пишут жалобы ФБР

Бенчмарк Vending-Bench

продолжить чтение

Rambler's Top100