gpt.

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

Battle test на русском и английском: цена, качество и артефакты — открытый лидербордLLM-судья оценивает сам себя. Что могло пойти не так?127 баллов из 100. Не опечатка.

продолжить чтение

Оставлено в

Как я превратил Codex в персонального Джарвиса

Эта статья написана от моего лица и отредактирована вместе с Джарвисом.За последние годы я перепробовал много AI-инструментов для разработки: от более “чатовых” сценариев до агентных сред вроде Cursor и Claude. В итоге остановился на Codex. Не потому, что он магический, а потому что это, на мой взгляд, самая сильная система в тот момент, когда ты понимаешь, что именно она делает, где заканчиваются ее возможности и какими рамками ее нужно ограничивать.

продолжить чтение

Оставлено в

Я посадил AI-агента на свой VPS и перестал открывать SSH

Суббота, 11 вечера. Я в гостях, телефон в кармане. Приходит алерт от Grafana: «память на сервере 92%». Раньше сценарий был такой: достать ноутбук (если взял), подключиться через SSH, вспомнить, какой контейнер жрёт память, попробовать docker stats, найти проблему, решить. Если ноутбука нет — открыть Termius на телефоне, набирать команды на экранной клавиатуре и молиться, чтобы не опечататься в rm -rf.Сейчас я пишу в Telegram: «память 92%, разберись». Через минуту агент отвечает: контейнер с логами разросся до 3 ГБ, он уже почистил старые логи и рестартнул его, сейчас 54%. Я убираю телефон и возвращаюсь к разговору.

продолжить чтение

Оставлено в

Один скилл, четыре модели — что может пойти не так

На GitHub лежат сотни AI-скиллов. Скилл для code review, скилл для дебага, скилл для обработки PDF, скилл для анализа безопасности. Установил в Cursor или Claude Code — и твой AI-ассистент стал умнее. Звучит как npm install: поставил пакет, он работает.Но скилл — не пакет. Это текстовый файл с инструкциями, который читает языковая модель. А модели читают по-разному.

продолжить чтение

Оставлено в

Локальный ИИ: майнинг плата + 3 RTX 3090

В прошлый раз мы рассматривали локальный инференс на бюджетных ноутбуках, а потом я попытался запустить gpt-oss-120b на трех видеокартах. Протестировав модель в рабочих задачах, я понял что она может стать заменой облачным провайдерам. Однако, уже тогда стало понятно что десктопные материнские платы и корпуса не могут вместить в себя 3 RTX 3090. Поэтому я присмотрелся к майнерским решениям, где на материнских платах имеется большое количество PCI-слотов

продолжить чтение

Оставлено в

Десятилетняя вражда, формирующая будущее ИИ

Личные обиды и борьба за власть между руководителями OpenAI и Anthropic определяют, как именно мир знакомится с этой технологией

продолжить чтение

Оставлено в

Как получать fan-out запросы GPT через OpenAI API: практическое руководство для SEO-специалистов

Привет! Меня зовут Андрей Попов, я SEO-специалист в AGIMA. SEO быстро меняется. Если раньше мы оптимизировали сайты исключительно под поисковые системы, то сегодня всё больше внимания приходится уделять алгоритмам искусственного интеллекта, которые самостоятельно собирают и анализируют информацию в интернете.Когда пользователь задает вопрос AI-модели, например GPT, она редко ограничивается одним поисковым запросом. Вместо этого система генерирует целый набор дополнительных запросов — именно они и называются fan-out queries

продолжить чтение

Оставлено в

Как металлообрабатывающий завод ускорил выполнение задач в 3 раза с помощью Кайтена и ChatGPT

Раньше руководитель тратил больше 30 минут, чтобы поставить задачи команде после ежедневной планерки. Теперь — один запрос к ИИ-ассистенту, и 30+ карточек автоматически создаются, заполняются и распределяются по исполнителям за 3 минуты. Это результат внедрения Кайтена на металлообрабатывающем заводе ПФ-ФОРУМ.Как процесс устроен изнутри — рассказывает Марина Вербицкая, руководитель отделения по работе с публикой и интегратор цифровых решений.Но сначала — несколько фактов о компанииПФ-ФОРУМ

продолжить чтение

Оставлено в

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Представьте, что вам дают 10 терабайт текста и говорят запихнуть это в файл на 70 гигабайт. Да так, чтобы потом по любому вопросу можно было восстановить нужный кусок. Не точно, но близко, и не побайтово, но чтобы по смыслу билось.Вы бы сказали: «так это же lossy-компрессия, часть данных неизбежно потеряется».И были бы правы, потому что именно это делает LLM.Предсказание = сжатие (и это не метафора)Тут нужно кое-что объяснить, и это самое важное в статье.Клод Шеннон доказал в 1948 году: предсказание следующего символа и сжатие данных — математически одно и то же

продолжить чтение

Оставлено в

Ну когда уже мы перестанем писать код???

В этой статье я разберу, что сейчас происходит на поприще нейронок. Что творится в индустрии и что будет дальше с нами, с нашими зарплатами и вообще со всем ИТ.Стоит ли нам бояться, стоит ли ждать замены уже не только джунов и мидлов (коих уже заменяют), но и серьёзных дяденек-синьоров.Может надо не простоя бояться? А надо бить в набат и бегать на голове? Правда ли, что индустрию перевернёт в ближайшие полгода-год так, что поменяется абсолютно всё, перетряхнёт каждого. Или не все так однозначно? Что вообще происходит и к чему готовиться. Давайте разбираться.

продолжить чтение

Оставлено в

Меню навигации

На главную

Главное

Рубрики

Методики

Информация

Из архивов

gpt.

Какую LLM ставить в production для контента на русском? Протестировали 18 моделей — одна в 130× дешевле при 91% качества

Как я превратил Codex в персонального Джарвиса

Я посадил AI-агента на свой VPS и перестал открывать SSH

Один скилл, четыре модели — что может пойти не так

Локальный ИИ: майнинг плата + 3 RTX 3090

Десятилетняя вражда, формирующая будущее ИИ

Как получать fan-out запросы GPT через OpenAI API: практическое руководство для SEO-специалистов

Как металлообрабатывающий завод ускорил выполнение задач в 3 раза с помощью Кайтена и ChatGPT

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Ну когда уже мы перестанем писать код???

Меню навигации

Рекомендуем

Главное

Рубрики

Методики

Информация

Из архивов

gpt.