LIMO: Меньше — значит больше для рассуждающих LLM
Мизерный объем задач с ответами может разбудить спящего LLM-льва..."Мы представляем фундаментальное открытие, которое бросает вызов нашему пониманию того, как сложные рассуждения возникают в больших языковых моделях"
Цензура в DeepSeek работает при локальном запуске модели
Некоторые эксперты в области искусственного интеллекта считали, что хорошо задокументированная цензура DeepSeek существует только на уровне приложения и не работает, если запустить приложение локально на устройстве. Теперь выяснилось, что это не так.
OpenAI проверяет убедительность рассуждений o3-mini в сабреддите
OpenAI использовала subreddit r/ChangeMyView для создания теста, который позволяет измерять убедительность ответов моделей рассуждений ИИ. Компания раскрыла эту информацию вместе с выпуском модели o3-mini.

