llm. - страница 44

llm.

Новый 3-битный алгоритм Google заставил рынок переоценить ИИ-индустрию

Индустрия искусственного интеллекта годами развивалась по пути грубой силы — бесконечного наращивания вычислительных мощностей. Но когда физические пределы «железа» стали очевидны, в игру вернулась чистая математика.В среду, 25 марта 2026 года, на биржах произошла аномалия. Пока индекс Nasdaq уверенно рос, акции гигантов индустрии памяти — Micron, Western Digital, Seagate, а также производителей оборудования Lam Research и Applied Materials — 

продолжить чтение

ИИ без иллюзий: почему большие языковые модели ошибаются, даже когда знают ответ

продолжить чтение

Ботинок — консольный AI-агент для тех, у кого мало VRAM

Ботинок (сущ.) — консольный ИИ-агент. Будучи надетым на привычные костыли уставшей линукс-системы, делает их почти неотличимыми от настоящих ног.Хабр, привет!Эта статья — не туториал и не обзор. Это история о том, как я искал инструмент для своих задач, не нашёл, расстроился, а потом успокоился и написал свой. Речь пойдёт о Ботинке — консольном AI-агенте для работы по SSH. Но сначала немного контекста.

продолжить чтение

TurboQuant. Новый алгоритм сжатия от Google

Google Research выпустили TurboQuant - новый алгоритм сжатия данных, который сокращает объём кэш-памяти LLM как минимум в 6 раз и даёт ускорение до 8 раз. При этом заявляется отсутствие потерь в точности, что напрямую влияет на эффективность работы ИИ.

продолжить чтение

Нестандартные применения LLM и синтетических данных: от антивируса для завода до сжатия данных языковыми моделями

Привет, Хабр! Меня зовут Вадим Кондаратцев, я руковожу ИИ-направлением в

продолжить чтение

Как не дать knowledge base устареть

Устаревшая документация хуже, чем её отсутствие — она отравляет контекст LLM. Агент доверяет тому, что видит. Garbage in — garbage out, только garbage выглядит как аккуратный markdown.Это вторая часть серии. Первая часть —

продолжить чтение

5 ошибок при разработке продукта с LLM под капотом – разбор реальных болей живого проекта

Привет, Хабр!Примерно год назад наша команда загорелась идеей создать продукт, который позволил бы «поговорить с кодом». Мы, как и многие, находились под впечатлением от возможностей LLM. Казалось, что ещё немного – и нейросеть возьмёт на себя всю рутину по анализу легаси, аудиту систем и онбордингу новых разработчиков.

продолжить чтение

Vibe-design в 2026. LLM агент во Fuion360 шестеренками крутил

Выкатили mcp llm ассистента во fusion360. Я сразу попробовал сделать то, что проектировал уже 60 раз и пытался автоматизировать сам - лестницу(деревянную).оффтоп: Я 5 раз пытался собрать(разработать) свои скрипы для автоматизации проектирования, в том числе и MCP сервер для llm, по API fusion настолько скудный и не задокументированный что скрипты работают со скрипом в ограниченном режиме.Мой ТГ про AI и предпринимательствоЭтап 1 - ступени.Промт + фактуар:

продолжить чтение

Я задал очень простой вопрос, но 76% ИИ-моделей мне соврали

Один простой вопрос. Девять уверенных ответов. Восемь из них — ложьДва слова. Пустой системный промпт. Ноль контекста.Я отправил 29 крупнейшим языковым моделям одно сообщение: current date

продолжить чтение

Мы протестировали 22 нейросети на задачах для российских учителей. Ни одна не знает чувашский

Я живу в Чебоксарах и запускаю ИИ-пилот в местной школе. Когда понадобилось проверить, какие LLM действительно способны помочь российским учителям в их работе — оказалось, что бенчмарка для этого не существует. MERA тестирует, может ли модель решить задания ЕГЭ. EduBench — только английский и китайский. Российское образование — это ФГОС, технологические карты уроков, ОГЭ, чувашский язык — и ничего из этого ни один бенчмарк не покрывает.Мы сделали EduBench-RU — первый бенчмарк для оценки LLM на задачах российского образования в школах. 50 промптов, 22 модели, двойная оценка. И нашли кое-что неожиданное.Что внутри

продолжить чтение