llm-модели. - страница 2

Поколение «Approve»: почему я заставил команду переписать проект, который уже работал

ПредисторияПоследние пару лет, кажется, невозможно поговорить об ИИ в разработке, чтобы разговор не упирался в тему производительности.Отовсюду постоянно вылезают новые истории успеха. Кто-то показывает, как сократил время разработки в несколько раз. Кто-то рассказывает, что теперь пишет за день столько кода, сколько раньше писал за неделю. Иные вообще собирают полноценный продукт за выходные и искренне не понимают, почему раньше на это уходили месяцы. Честно говоря – раньше читал, но в последнее время просто игнорирую такие заголовки (почему – надеюсь станет понятно из статьи).

продолжить чтение

Юнит-экономика LLM в 2026: о чем молчит прайс OpenAI и почему ваш расчет устареет через полгода

В течение последнего года мы запустили несколько продуктов с LLM-решениями на борту. При этом, несмотря на различия в моделях и масштабе, у них, у всех была общая черта — расчет стоимости использования ИИ-фичи на старте расходился с реальностью: иногда — в несколько раз, но, всегда — в сторону увеличения бюджета.

продолжить чтение

Выпустили, но в наморднике: разбираем как Mythos стал Fable 5

Привет, Хабр! Меня зовут Михаил Сальников, я независимый исследователь в области искусственного интеллекта, автор бенчмарка AI Independence Bench и эксперимента с автономным ИИ под именем Aria

продолжить чтение

Миф о «равных весах»: что на самом деле скрывается внутри малых моделей

продолжить чтение

К2Тех и МТС Web Services объединяют усилия для развития доверенного генеративного ИИ в российских компаниях

Компании К2Тех и МТС Web Services (далее — MWS) стали технологическими партнерами. Соглашение о партнерстве было заключено на конференции ЦИПР-2026.Предметом соглашения стало совместное внедрение AI-сервисов MWS в российских компаниях. Речь идет как об облачных сервисах, развернутых в MWS Cloud, так и об on-premises решениях “под ключ”. Среди ключевых прикладных сценариев — корпоративный поиск по документам, классификация обращений, поддержка клиентов, генерация документов и отчетов, code review и разработка тест-кейсов, а также распознавание изображений и сканов.

продолжить чтение

Поднимаем Llama 3 в облаке: Ollama и Open WebUI

Локально запустить LLM сегодня можно за десять минут — например, с помощью LM Studio. Но как только модели нужно дать доступ команде, подключить RAG или встроить ее в сервис — такого подхода зачастую недостаточно.

продолжить чтение

Как я (внезапно) стал адвокатом вайб‑кодинга в корпорации

Привет, я Максим, лидер AI‑powered разработки. В 2024 году я пришёл в банк руководителем проектов, потом занимался партнёрскими интеграциями, а теперь привет, Enterprise Vibe Coding!Это я, молодой и ещё ничего не знающий про вайб‑кодинг

продолжить чтение

Разработка будущего, или Почему AI PDLC начинается не с кода

На ЦИПР-2026 мы подписали меморандум со Сбером и СберТехом — вместе планируем развивать AI PDLC в России и проверять подход на задачах корпоративной разработки. Звучит масштабно, но сейчас всё расскажем. 

продолжить чтение

Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ

В третьей части обзора посмотрим на что способна Tesla V100 в работе с современными локальными моделями ИИ. Сравним ее с более современными серверными ускорителями и видеокартами по вычислительной мощности. Проверим какие модели ИИ она способна запустить в LM Studio и протестируем их.Сравнение производительности Tesla V100 с современными серверными ускорителями и видеокартами

продолжить чтение

$1 млрд в день: разбор рекордного финансового отчета NVIDIA

продолжить чтение