Управление продуктом. - страница 18

Как менеджеру по продукту оценить качество AI-продукта

Это саммари подкаста Ленни Рачицкого с Хамилем Хусейном и Шреей Шанкар. Ниже — пошаговый процесс проведения оценки качества AI-продукта.Мы живем в эпоху, когда топ-менеджеры Anthropic и OpenAI называют еvals (оценка качества AI-продукта) самым важным навыком для продакт менеджеров. Два года назад никто не знал этого слова, а сегодня это новая нефть в мире LLM.Что такое Evals простыми словамиEvals (от evaluations — оценка) — это системный подход к измерению и улучшению AI-продуктов. Если по-простому, это "тесты", которые помогают понять, насколько хорошо ваша нейросеть делает свою работу.

продолжить чтение

Альтман выиграл пари. Я строю фабрику агентов, чтобы выиграть следующее

Medvi выиграл на регуляторной дыре. Я ставлю на семь AI-агентов и портфель из пяти попытокАнтон Саркисян, CCO GPTunneL | ex.Yandex | ex.VK |Две недели назад Альтман написал в NYTОн сказал, что, похоже, выиграл пари. Помнишь то самое: про первое миллиардное предприятие от одного человека? NYT опубликовали профайл на компанию Medvi: два месяца разработки, $20K стартового капитала, $401M выручки в 2025, прогноз $1.8B на 2026, команда - два человека. Парень по имени Мэттью Галлахер. Ноутбук, три LLM, гостиная в Лос-Анджелесе. Идеальная обложка для AI-эры.

продолжить чтение

Is a new wave of process excellence coming?

TL;DR Companies are rolling out AI by trying agents on whatever comes to mind, without the process mapping discipline that used to precede any serious automation. It's worth asking whether that discipline is about to matter again, as agent architecture, token economics, and regulation start catching up with the experimentation.It's a strange question to ask in 2026, when agents are at the top of most companies' agendas and calling yourself "AI-native" has become almost mandatory. Against that backdrop, 

продолжить чтение

Mozilla анонсировала ИИ-клиента Thunderbolt

Mozilla анонсировала Thunderbolt — клиент искусственного интеллекта с открытым исходным кодом. Он предназначен для организаций и тех, кто хочет развернуть собственную инфраструктуру ИИ.

продолжить чтение

AI-суперапп – главный тренд 2026 по версии Forbes. Что мы видим из GPTunneL с позиции 2 млн пользователей

В декабре я рассказал на Хабре, как GPTunneL вырос от прототипа до 1,5 млн пользователей. С тех пор нас стало 2 млн. Подумал – пора рассказать, что мы делаем сейчас и куда идём. Хабр для этого хорошее место.Если коротко: строим и обучаем собственную модель GROM, развиваем GraphRAG, Creative Lab, vibe-coding, работаем над оркестрацией 100+ моделей через единый интерфейс. Под всё это – ML-команда, начинаем строить инфраструктуру под претрейн, прямые партнёрства с MiniMax, ByteDance, Alibaba, Сбером и рядом других поставщиков моделей – как китайских, так и западных.

продолжить чтение

AI-ready ITSM: платформа или коробка – и почему это главный вопрос 2026 года

Ещё три года назад ИИ в ITSM представлялся как просто чат-бот на входе, который пытается угадать категорию тикета. Сегодня уже другой разговор: ведущие платформы встраивают AI не как надстройку над тикет-системой, а как архитектурный слой, который участвует в маршрутизации, предсказывает инциденты до их возникновения, автономно закрывает типовые обращения и генерирует постмортемы. Рынок уже видит пользу — по данным Forrester

продолжить чтение

Как мы разработали ИИ-ассистента и сократили рутину продуктовой команды на 50%

Привет! Меня зовут Артём, я занимаю должность владельца продукта. Развиваю направление бренд-медиа Совкомбанка, которое включает в себя Совкомблог и Халва Медиа.Если вы работаете в финтехе, то знаете: продуктовые менеджеры тонут в рутине. Документация, согласования, бесконечные уточнения «а что имел в виду бизнес?», приоритизация бэклога, аналитика, стратегии... А на нормальную работу с клиентом — ту самую, ради которой мы вообще пришли в продукт – остается совсем чуть-чуть.

продолжить чтение

Фреймворк отказоустойчивости для интерфейсов разговорного ИИ

Перевод подготовил автор канала Друг Опенсурса, приятного прочтения, заранее благодарю за подписку В статье описывается навигационная структура из 20 UX-паттернов, разделенных на уровень стабильности, фокуса, ясности и контроля. Подход предполагает использование чата как механизма обработки, а документа как основной рабочей области. Проблема интерфейсов на базе чата

продолжить чтение

Как мы перестали мерить качество ответов RAG-поиска «на глаз» и начали нормально сравнивать

Если вы делаете RAG-поиск по документации или базе знаний, то рано или поздно упираетесь в проблему: хорошо найти — это еще не хорошо ответить.База знаний, RAG, найденные чанки, LLM строит ответ. Но пользователь не знает ни про DCG, ни про Recall@10, ни про чанки вообще. Он видит только то, что написано в итоговом ответе. А проблемы начинаются именно здесь. Нашел нужные чанки — молодец. Но модель может их проигнорировать, ответить на другом языке, добавить что-то от себя или выдать уверенный текст с иероглифами посередине. И как потом доказать, что после правок стало лучше — тоже не очевидно.

продолжить чтение

Microsoft работает над аналогом ИИ-агента OpenClaw

Microsoft тестирует способы интеграции функций, подобных OpenClaw, в свой существующий инструмент Microsoft 365 Copilot. Они будут ориентированы на корпоративных клиентов и предложат более совершенные средства защиты, чем OpenClaw с открытым исходным кодом.

продолжить чтение

1...10...161718192021...3040...81