Машинное обучение. - страница 3

Что происходит внутри LLM, когда ты отправляешь сообщение

Ты пишешь вопрос и нажимаешь Enter. Через секунду начинают появляться слова. Кажется, будто кто-то думает и печатает. Но внутри не происходит ничего похожего на мышление — зато происходит кое-что куда более странное и интересное.Главное заблуждениеБольшинство людей представляют языковую модель как умную базу данных: спросил — она нашла ответ и выдала. Это не так.LLM — это машина, которая предсказывает следующий токен. Всё. Из этой одной простой задачи, повторённой миллиарды раз на триллионах слов текста, вырастает нечто, которое умеет объяснять квантовую физику, писать код и иногда убедительно врать.

продолжить чтение

Alibaba опубликовала Open Code Review с реализацией гибридной архитектуры рецензирования

Alibaba представила открытую платформу Open Code Review с реализацией гибридной архитектуры рецензирования. Она включает методы проверки и возможности больших языковых моделей. 

продолжить чтение

В каталоге готовых моделей Selectel теперь доступна линейка Qwen3.6

Рады объявить о большом пополнении: в нашем Foundation Models Catalog

продолжить чтение

Трафик ботов и ИИ-агентов впервые превысил активность людей

По данным Cloudflare, доля машинного веб-трафика достигла 57,5%, превысив активность людей (42,5%). По словам гендиректора компании Мэттью Принса, рубеж пройден на несколько лет раньше прогнозируемого 2027 года.Рост обусловлен не классическими скриптами (краулеры, спам, DDoS-сети), а автономными ИИ-агентами. Алгоритмы парсят контент для обучения нейросетей и выполняют многошаговые задачи от лица пользователей: мониторят цены, взаимодействуют со службами поддержки и оформляют заказы.

продолжить чтение

Самосовершенствующийся ИИ: что происходит внутри Anthropic

На протяжении большей части истории ИИ каждый шаг в его разработке делали люди. Но в Anthropic мы всё больше делегируем часть этой работы самим ИИ-системам — и это ускоряет наш прогресс.Если тенденция продолжится и ресурсов вычислений будет достаточно, она ведёт к системе, способной полностью автономно проектировать и разрабатывать собственного преемника. Это называется рекурсивным самосовершенствованием. Мы ещё не там, и оно не неизбежно. Но оно может наступить раньше, чем большинство институтов успеет подготовиться.Опираясь на публичные бенчмарки и ранее не публиковавшиеся внутренние данные Anthropic, 

продолжить чтение

Как устроены LLM‑агенты: архитектура, планирование и инструменты

Если вы хоть раз просили ChatGPT что‑то сделать и получали в ответ длинный текст без какого‑либо реального действия — вы работали с обычной языковой моделью. Она умеет генерировать текст, но сама ничего не делает: не лезет в интернет, не запускает код, не сохраняет файлы. Просто отвечает.LLM‑агент — это другая история. Это система, которая получает задачу и начинает её решать: ищет информацию, пишет и запускает код, вызывает API, сохраняет результаты. Она не просто говорит «вот как это можно сделать» — она берёт и делает.

продолжить чтение

Что происходит, когда LLM остается наедине с собой (неожиданно, но она сходит с ума)

Автор имел примерно такие вайбы после этих экспериментовВсем доброго времени суток. Здесь будет описана история происхождения архитектуры мета-трансформеров, которая описана вот

продолжить чтение

Человек, который занимался нейросетевой математикой в Красноярске — и которого цитируют до сих пор

продолжить чтение

Google предлагает Android-разработчикам продавать доступ к коду для обучения нейросетей

Журналисты сообщают, что Google запустила пилотный проект, в рамках которого предлагает Android-разработчикам продавать доступ к коду. Его компания планирует использовать для обучения нейросетей. Google не рассказывает о программе публично, а рассылает предложения определённым разработчикам.

продолжить чтение

Pipeline в машинном обучении: как создавать сложные модели без боли и утечек данных

Привет, Хабр! Меня зовут Андрей Бирюков. Я — независимый эксперт в области ИТ и ИБ, преподаю в учебных центрах и пишу статьи и книги. И сегодня мы поговорим об использовании Pipeline для задач машинного обучения. Давайте представим, что вы решили построить дом. Можно нанять отдельных рабочих для фундамента, стен, крыши и коммуникаций, а затем попытаться координировать их работу самостоятельно. А можно нанять генерального подрядчика, который возьмет на себя все этапы, гарантирует качество на каждом шаге и сдаст готовый дом «под ключ».

продолжить чтение