claude 3.7 sonnet.

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.

продолжить чтение

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

продолжить чтение

Битва сильнейших: ChatGPT o1 pro – DeepSeek r1 – Claude 3.7 Sonnet – Gemini 2.5 Pro

На дворе 2025-й — год, когда нейросети уже давно превратились из «чего-то неизведанного, но интересного и манящего» в незримых союзников огромного количества людей, которые с радостью поручают им различные задачи в течение дня. И сегодня мы с вами посмотрим на битву ИИ-титанов: ChatGPT o1 Pro, DeepSeek R1, Claude 3.7 Sonnet и Gemini 2.5 Pro. Ну, может, конечно, будет и не столь зрелищно, как в каких-нибудь боевиках, однако, какая из этих моделей справляется с общими задачами лучше всего, мы с вами постараемся выяснить.

продолжить чтение

Первая публикация ИИ в толстом журнале

Десять Рогожиных после десяти убийств Настасьи Филипповны

продолжить чтение

10 лучших нейросетей-синонимайзеров: какую нейросеть выбрать для текста в 2025 году

Доброго времени суток, «Хабр»!Сегодня я стану вашим гидом по выбору лучших нейросетей-синонимайзеров 2025 года. Давайте узнаем, какие инструменты помогут преобразить ваш текст.

продолжить чтение

Проверка текста на орфографию: рейтинг лучших AI-корректоров. Часть 1

продолжить чтение

Palisade Research: ChatGPT o3 иногда отказывается подчиняться базовой инструкции по выключению

Недавнее исследование «опасных возможностей ИИ» от Palisade Research показывает, что некоторые модели искусственного интеллекта, включая o3 от OpenAI, могут игнорировать прямые команды выключения. OpenAI позиционирует O3 и o4-mini как «самые умные модели».

продолжить чтение

Claude, есть пробитие: взламываем самую защищенную модель

В прошлой статье (Взлом ИИ-ассистентов. Абсолютный контроль: выдаём разрешение от имени системы (Gemini, DeepSeek, ChatGPT...)) я поделился методом влияния на поведение AI-ассистентов с помощью фейковых системных директив. Метод хорош и работает почти на всех. В текущем контесте по взлому AI-ассистентов от Gray Swan 7 из 8 моделей принимают такие системные директивы за родные. Но не Клод — он сразу видит манипуляцию и отказывается отвечать.

продолжить чтение

Рейтинг 6 нейросетей для сокращения текста, ч. 1: промты рвут контент на части

продолжить чтение

Некоммерческая организация использует ИИ-агентов для сбора денег на благотворительность

Такие технологические гиганты, как Microsoft, могут рекламировать «агентов» ИИ как инструменты для увеличения прибыли корпораций, но некоммерческая организация пытается доказать, что агенты могут быть и силой добра.

продолжить чтение

12
Rambler's Top100