языковые модели. - страница 3

Оптимизация параметров языковой модели на основе графа со-встречаемости слов: когда больше — не значит лучше

В последние годы мы привыкли, что прогресс в NLP измеряется гига- и терабайтами параметров. Кажется, единственный путь к улучшению качества модели — увеличение ее размера. Но так ли это для специализированных задач?Мы решили пойти от обратного: можно ли заранее, еще до обучения, понять, насколько большой должна быть модель, чтобы эффективно решать конкретную задачу классификации?

продолжить чтение

Чат GPT в России без VPN: техническая картина доступа и ограничений

Чат GPT

продолжить чтение

Почему ваш LLM-сервис ведёт себя как хочет, а не как вы просите

Вы пишете промпт. Подробно, вдумчиво, с примерами. Деплоите в сервис. Запускаете — и получаете markdown-обёртку вокруг JSON, который вы просили.

продолжить чтение

Бесплатная Stealth-модель оказалась в топе OpenRouter за 72 часа

13 апреля на OpenRouter появилась Elephant Alpha — 100-миллиардная языковая модель без имени автора, пресс-релиза и маркетинга. Через несколько дней она заняла первое место в Trending-ранкинге платформы, обойдя платные модели по реальному потреблению токенов.

продолжить чтение

Ваш любимый ИИ не умеет считать. Что ещё скрывает текстовая модель?

Технократический разбор для инженеров и бизнес-аналитиков. Без преувеличений и продающих лозунгов.Данная статья представляет собой результат кабинетного исследования об основных особенностях работы ИИ (LLM, модель). Здесь в систематизированном виде относительно простым языком описано, как реализуется вся та “магия” про ИИ, с которой мы сталкиваемся сами или слышим в восторженно-продающих материалах.Сразу уточню, что под ИИ тут понимается именно публичная Большая языковая (текстовая) модель (LLM), вроде ЧатаГПТ, ГигаЧата, Дипсика и др.В этой статье мы:

продолжить чтение

Опубликован второй выпуск Продолжения Дневника писателя, его тема: ИИ и Достоевский

Искусственный интеллект пока несовершенен, ему свойственны предвзятость, необъяснимость, а то и простое вранье, которое принято дипломатично называть «галлюцинациями». Эти проблемы актуальны и для мышления человека, поэтому люди давно изобрели способы их решения. В частности, Федор Достоевский пытался решить их в своем проекте «Дневник писателя», и будь он жив в наши дни, он предложил бы свой метод обучения ИИ.

продолжить чтение

Мы заставили ИИ-модели торговать на бирже. И вот что из этого вышло

Могут ли языковые модели торговать на бирже — и не слить, а реально заработать? «Финам» завершил первый этап «Финам Арены

продолжить чтение

Большие языковые модели на практике – международный бестселлер теперь на русском языке

продолжить чтение

ИИ-редактор пожаловался на «цензуру» после того, как его забанили в «Википедии»

Недавно «Википедия» объявила

продолжить чтение

«Википедия» запретила использовать языковые модели для написания статей

Англоязычная «Википедия» запретила редакторам писать и переписывать статьи с помощью языковых моделей. Новое правило закрепили в редакционной политике организации.

продолжить чтение

123456...10...18