claude 3.7 sonnet.

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

В последние несколько месяцев ведущие модели обновились с функцией «рассуждений» (reasoning). Предполагалось, что качество ответов улучшится. Но последующие тесты показали, что уровень галлюцинаций сильно вырос. И это не какая-то случайная недоработка разработчиков, а фундаментальное свойство. Сейчас становится очевидным, что от галлюцинаций мы не избавимся никогда.

продолжить чтение

Оставлено в

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

продолжить чтение

Оставлено в

Битва сильнейших: ChatGPT o1 pro – DeepSeek r1 – Claude 3.7 Sonnet – Gemini 2.5 Pro

На дворе 2025-й — год, когда нейросети уже давно превратились из «чего-то неизведанного, но интересного и манящего» в незримых союзников огромного количества людей, которые с радостью поручают им различные задачи в течение дня. И сегодня мы с вами посмотрим на битву ИИ-титанов: ChatGPT o1 Pro, DeepSeek R1, Claude 3.7 Sonnet и Gemini 2.5 Pro. Ну, может, конечно, будет и не столь зрелищно, как в каких-нибудь боевиках, однако, какая из этих моделей справляется с общими задачами лучше всего, мы с вами постараемся выяснить.

продолжить чтение

Оставлено в

Первая публикация ИИ в толстом журнале

Десять Рогожиных после десяти убийств Настасьи Филипповны

продолжить чтение

Оставлено в

10 лучших нейросетей-синонимайзеров: какую нейросеть выбрать для текста в 2025 году

Доброго времени суток, «Хабр»!Сегодня я стану вашим гидом по выбору лучших нейросетей-синонимайзеров 2025 года. Давайте узнаем, какие инструменты помогут преобразить ваш текст.

продолжить чтение

Оставлено в

Проверка текста на орфографию: рейтинг лучших AI-корректоров. Часть 1

продолжить чтение

Оставлено в

Palisade Research: ChatGPT o3 иногда отказывается подчиняться базовой инструкции по выключению

Недавнее исследование «опасных возможностей ИИ» от Palisade Research показывает, что некоторые модели искусственного интеллекта, включая o3 от OpenAI, могут игнорировать прямые команды выключения. OpenAI позиционирует O3 и o4-mini как «самые умные модели».

продолжить чтение

Оставлено в

Claude, есть пробитие: взламываем самую защищенную модель

В прошлой статье (Взлом ИИ-ассистентов. Абсолютный контроль: выдаём разрешение от имени системы (Gemini, DeepSeek, ChatGPT...)) я поделился методом влияния на поведение AI-ассистентов с помощью фейковых системных директив. Метод хорош и работает почти на всех. В текущем контесте по взлому AI-ассистентов от Gray Swan 7 из 8 моделей принимают такие системные директивы за родные. Но не Клод — он сразу видит манипуляцию и отказывается отвечать.

продолжить чтение

Оставлено в

Рейтинг 6 нейросетей для сокращения текста, ч. 1: промты рвут контент на части

продолжить чтение

Оставлено в

Некоммерческая организация использует ИИ-агентов для сбора денег на благотворительность

Такие технологические гиганты, как Microsoft, могут рекламировать «агентов» ИИ как инструменты для увеличения прибыли корпораций, но некоммерческая организация пытается доказать, что агенты могут быть и силой добра.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

claude 3.7 sonnet.

«Тупой ИИ» с нами надолго. Почему в новых моделях больше галлюцинаций

Project Vend: может ли языковая модель продавать чипсы и вольфрам?

Битва сильнейших: ChatGPT o1 pro – DeepSeek r1 – Claude 3.7 Sonnet – Gemini 2.5 Pro

Первая публикация ИИ в толстом журнале

10 лучших нейросетей-синонимайзеров: какую нейросеть выбрать для текста в 2025 году

Проверка текста на орфографию: рейтинг лучших AI-корректоров. Часть 1

Palisade Research: ChatGPT o3 иногда отказывается подчиняться базовой инструкции по выключению

Claude, есть пробитие: взламываем самую защищенную модель

Рейтинг 6 нейросетей для сокращения текста, ч. 1: промты рвут контент на части

Некоммерческая организация использует ИИ-агентов для сбора денег на благотворительность

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

claude 3.7 sonnet.