Поколение «Approve»: почему я заставил команду переписать проект, который уже работал
ПредисторияПоследние пару лет, кажется, невозможно поговорить об ИИ в разработке, чтобы разговор не упирался в тему производительности.Отовсюду постоянно вылезают новые истории успеха. Кто-то показывает, как сократил время разработки в несколько раз. Кто-то рассказывает, что теперь пишет за день столько кода, сколько раньше писал за неделю. Иные вообще собирают полноценный продукт за выходные и искренне не понимают, почему раньше на это уходили месяцы. Честно говоря – раньше читал, но в последнее время просто игнорирую такие заголовки (почему – надеюсь станет понятно из статьи).
Юнит-экономика LLM в 2026: о чем молчит прайс OpenAI и почему ваш расчет устареет через полгода
В течение последнего года мы запустили несколько продуктов с LLM-решениями на борту. При этом, несмотря на различия в моделях и масштабе, у них, у всех была общая черта — расчет стоимости использования ИИ-фичи на старте расходился с реальностью: иногда — в несколько раз, но, всегда — в сторону увеличения бюджета.
Выпустили, но в наморднике: разбираем как Mythos стал Fable 5
Привет, Хабр! Меня зовут Михаил Сальников, я независимый исследователь в области искусственного интеллекта, автор бенчмарка AI Independence Bench и эксперимента с автономным ИИ под именем Aria
К2Тех и МТС Web Services объединяют усилия для развития доверенного генеративного ИИ в российских компаниях
Компании К2Тех и МТС Web Services (далее — MWS) стали технологическими партнерами. Соглашение о партнерстве было заключено на конференции ЦИПР-2026.Предметом соглашения стало совместное внедрение AI-сервисов MWS в российских компаниях. Речь идет как об облачных сервисах, развернутых в MWS Cloud, так и об on-premises решениях “под ключ”. Среди ключевых прикладных сценариев — корпоративный поиск по документам, классификация обращений, поддержка клиентов, генерация документов и отчетов, code review и разработка тест-кейсов, а также распознавание изображений и сканов.
Поднимаем Llama 3 в облаке: Ollama и Open WebUI
Локально запустить LLM сегодня можно за десять минут — например, с помощью LM Studio. Но как только модели нужно дать доступ команде, подключить RAG или встроить ее в сервис — такого подхода зачастую недостаточно.
Как я (внезапно) стал адвокатом вайб‑кодинга в корпорации
Привет, я Максим, лидер AI‑powered разработки. В 2024 году я пришёл в банк руководителем проектов, потом занимался партнёрскими интеграциями, а теперь привет, Enterprise Vibe Coding!Это я, молодой и ещё ничего не знающий про вайб‑кодинг
Разработка будущего, или Почему AI PDLC начинается не с кода
На ЦИПР-2026 мы подписали меморандум со Сбером и СберТехом — вместе планируем развивать AI PDLC в России и проверять подход на задачах корпоративной разработки. Звучит масштабно, но сейчас всё расскажем.
Обзор серверного ускорителя NVIDIA Tesla V100 16 Gb в корпусе от RTX 4090: Часть 3 — Запуск локальных моделей ИИ
В третьей части обзора посмотрим на что способна Tesla V100 в работе с современными локальными моделями ИИ. Сравним ее с более современными серверными ускорителями и видеокартами по вычислительной мощности. Проверим какие модели ИИ она способна запустить в LM Studio и протестируем их.Сравнение производительности Tesla V100 с современными серверными ускорителями и видеокартами

