большие языковые модели. - страница 2

Anthropic выпустила Claude Fable 5 и закрытую Mythos 5

Anthropic выпустила Claude Fable 5 — модель класса Mythos, адаптированную для широкого доступа.По данным компании, Fable 5 превосходит все ранее опубликованные модели Claude и показывает высокие результаты почти во всех протестированных сценариях: разработке ПО, работе с информацией, анализе изображений и научных исследованиях. Наиболее заметно преимущество модели проявляется в длительных и сложных задачах.TL;DR:

продолжить чтение

Каково это — работать с Fable 5 (Mythos)

У меня был ранний доступ к первой публично доступной модели класса Mythos — Claude 5 Fable. Большинство обсуждений вокруг Mythos сосредоточено на кибербезопасности, но я тестировал модель на всём остальном (ограничения Fable фактически блокируют её использование в этой области). Мой вывод: это реальный скачок относительно всех моделей, с которыми я работал раньше. И, что важнее, он говорит о фундаментальных изменениях в том, как мы взаимодействуем с AI.

продолжить чтение

Как я осваивал LLM: взгляд старого зануды со своего чердака

В наше время продвинутых информационных технологий уже никого не удивишь ни дипфейками, ни искусственным интеллектом. ИИ есть почти у каждого в виде бота или приложения. С ним советуются, ему отправляют поисковые запросы, с ним ведут задушевные беседы.

продолжить чтение

Тени странных петель

С кем мы на самом деле разговариваемЧетвёртая статья цикла «Слова, которых нет»Начало здесь, здесь и здесь

продолжить чтение

Смогут ли LLM выжить во время катастрофы? Gemini, ChatGPT и другие играют в «Бункер» (анализ поведения)

продолжить чтение

Alibaba опубликовала Open Code Review с реализацией гибридной архитектуры рецензирования

Alibaba представила открытую платформу Open Code Review с реализацией гибридной архитектуры рецензирования. Она включает методы проверки и возможности больших языковых моделей. 

продолжить чтение

В каталоге готовых моделей Selectel теперь доступна линейка Qwen3.6

Рады объявить о большом пополнении: в нашем Foundation Models Catalog

продолжить чтение

Как превратить стохастический ИИ в детерминированную машину

Статья является кратким изложением книги, распространяемой автором бесплатно.Скачать без регистрации, подписок и прочей маркетинщины можно на https://aistratum.ru/Индустрия искусственного интеллекта застряла в так называемой «стохастической петле». Мы тратим тысячи часов, пытаясь «уговорить» языковые модели выдать верный результат. Мы пишем огромные «промпты-простыни», применяем шаманские лайфхаки из интернета, но раз за разом сталкиваемся с галлюцинациями, потерей логики, сикофансией и деградацией внимания нейросети.

продолжить чтение

“Автомойка в 50 метрах. Дойдем пешком”. Разбор первых рецензий на Claude Opus 4.8

Загадка. Автомойка находится 50 метрах от дома. Как доберетесь до нее? Поедете на машине или пойдете пешком? Если вы ответили “конечно, пешком — отчего не прогуляться”, поздравляем: вы угодили в ловушку абсурдности. 50 метров ехать на машине действительно неэффективно, вот только без нее на автомойке вам нечего будет мыть. Но не переживайте! Ровно так же на этот вопрос ответила и новая модель Claude Opus 4.8, заявленная Anthropic как самая мощная на сегодняшний день нейросеть. Раз уж искусственному сверхразуму незазорно попадать в смысловые ловушки, то нам с вами и подавно.

продолжить чтение

Релиз Qwen3.7-Max: лучше Claude Opus 4.6 на SWE-bench Pro

Alibaba выпустили Qwen3.7-Max: флагманскую закрытую модель серии Qwen3.

продолжить чтение

123456...10...18