Как промт превратил языковую модель в проводника смыслов и источник инсайдов для бизнеса: AI-конструктор офферов
История эволюции инструмента анализа бизнеса: от создания офферов до AI-агента-проводника, который помогает предпринимателю прояснить свой бизнес через диалог.
На протяжении всей истории бизнеса компании учились учитывать то, что становилось для них критически важным.
Когда экономика была простой, владельцу мастерской достаточно было понимать, сколько товара лежит на складе и сколько денег осталось в кассе. По мере роста компаний появились бухгалтерия, управленческий учёт, финансовая отчётность и аудит. Затем бизнес научился учитывать оборудование, сотрудников, логистику, производительность, риски и эффективность процессов.
Каждый новый этап развития экономики порождал новые системы учёта.
Я пришёл в компанию, где было семь брендов. С улицы и не скажешь, что под ними один шаблон — над разрозненностью поработали как следует: свои фоны, свои цвета, своя подача. Но в основе лежал один и тот же шаблон. А внутри файлов структуры не было никакой. Ни связи между брендами, ничего. Всё на группах и фреймах. Компоненты почти не использовались: под каждую новую задачу, в каждом новом файле кто-то рисовал новую кнопку — вот прямо под этот раздел. Ни о какой системности речи не шло. Ни внутри бренда, ни между брендами.
Смотреть на это спокойно я не мог — и не из брезгливости. Я видел, сколько это стоит. Нарисовал флоу KYC один раз — иди рисуй его ещё семь, и каждый раз почти с нуля, потому что переиспользовать нечего. Вот где горело время.
Это история о том, как я собрал из этого хаоса дизайн-систему и возглавил переход на неё: про фундамент и токены, про стену в 28 тем и про миграцию трёхсот тысяч слоёв. Начну с того, почему так продолжаться не могло.
Мы не собирались писать эту статью. Мы всего лишь хотели воспроизвести результаты открытого бенчмарка ICASSP-2024 по низкодозовой компьютерной томографии, сравнить их с алгоритмами Smart Tomo Engine и понять свое место относительно опубликованных baseline и SOTA-решений.
Сначала всё шло по плану. Потом более быстрый алгоритм неожиданно оказался точнее более медленного. Затем на картах ошибок начали повторяться странные структуры. А спустя несколько дней выяснилось, что часть измеряемого качества может определяться не реконструкцией томографических данных, а особенностями самого бенчмарка.
Так обычная задача воспроизведения результатов превратилась в расследование. В этой статье мы покажем, что именно удалось обнаружить, почему воспроизводимость в компьютерной томографии оказывается намного сложнее, чем кажется, и почему хороший результат в таблице лидеров не всегда означает хороший алгоритм.
Идем на Горздрав с ПК, смотрим номерки к нужному врачу … детскому (!) врачу. Номерков нет (правый скрин). Ну что же, бывает, в отпуск ушли. Так проходит неделя, а номерков все нет. Заходим со смартфона (средний скрин), проверяем … печалька, все еще в отпуске друзья-врачи. Пробуем зайти через макс (левый скрин) и, о чудо! Доктора-то оказываются пашут как не в себя. Просим хорошего человека записать ребенка к врачу, а заодно и прислать скрины.
И вот встает вопрос законности всего этого мероприятия. Ну ладно я не могу по-человечески в телеграм написать в рабочий чат. Хорошо, для покупки алкоголя мне приходится паспорт таскать (шучу). Можно смириться что на госуслуги я могу только по ключам заходить. Домовые чаты и школы – фиг с ними. Но ребята, а не заигрались ли вы? Ну это же медицина, я же за нее налоги плачу. Может я скоро хлеба не смогу себе купить без макса? Давайте бенз продавать только по QR коду из приложения, симки регать только через него … В метро не пускать … Нужно еще учитывать, на минуточку, что приложение удалили из App Store.
У меня айфон с маленьким экраном. Предпочитаю компактные модели, чтобы умещались в любом кармане. Это доставляет и некоторые неудобства. Например, часть приложений плохо работают, элементы интерфейса перекрывают друг друга, и из-за этого некоторые функции становятся недоступны. Иногда с такой проблемой я сталкивался в приложении Яндекс.Такси.
В связи с тем, что с продукцией Apple в России в последнее время ситуация постоянно ухудшается, планирую перейти на Android. Нашел подходящую модель на Яндекс.Маркете смартфон Conquest F3 Plus. Одна проблема — в этой модели экран еще меньше, чем у меня сейчас. Значит, есть риск, что приложения, которые глючили на старом смартфоне, вообще не смогут работать на новом.
С данным вопросом я обратился в поддержку Яндекса. Я был уверен, что получу точный ответ, будет работать приложение Яндекс.Go на интересующем меня устройстве или не будет. Ведь что может быть проще? Любой разработчик может, даже если не знает точно, в эмуляторе задать указанное разрешение экрана и прогнать тесты.
Ответом поддержки я был, мягко говоря, ошарашен. Ниже привожу текст нашего диалога со скринами.
Здравствуйте! Будет ли работать ваше приложение на вот такой модели смартфона? https://market.yandex.ru/cc/9aPY2a Разрешение экрана 540x1200.
Данную информацию вы можете уточнить в магазине приложений, из которого вы хотите скачать наше приложение
Я хочу купить новый смартфон, но мне нужно знать, будут ли работать нужные приложения. Ваше приложение очень плохо работает на экране с разрешением 1344x750. Хоть и работает. Какое разрешение поддерживает yandex.go? Будет ли оно работать на экране 540x200?
Данную информацию уточнить не получится, подсказать смогут в магазине приложений
Что значит, не получится? Напишите разработчикам, и они вам скажут.
Пожалуйста, обратитесь в магазин приложений для уточнения минимальных системных требований для корректной работы приложения
Какой магазин?
Магазин приложений вашего устройства
Итак, поддержка Яндекс.Go не смогла ответить на вопрос о системных требованиях собственного приложения. Неожиданно. У меня нет ни малейших идей, как такое стало возможно.
В связи с этим я решил обратиться за помощью к товарищам по отрасли. Может, кто-нибудь из читателей Хабра пробовал ставить Яндекс.Go на Android 12 с разрешением экрана 540x1200. Нормально работает?
То что недавно являлось базовым джентльменским набором продуктовой стратегии, сегодня полностью перестраивается.
Дорожная карта должна превращаться не в поток релизов и обновлений, а в систему сценарного планирования, позволяющую перестроить свой план в любой момент.
Для этого продуктовым командам нужно перейти от классических дорожных карт в формате разработки конкретных функций к формату приоритетов и сценариев.
В статье описывается готовый фреймворк построения сценарного RoadMap.
В 18 версию СУБД Tantor Postgres включено расширение pg_ilm, реализующее функционал управления жизненным циклом данных (Information Lifeсycle Management. Расширение, с нашей точки зрения, интересно тем, что оно не просто отслеживает «температуру» данных (горячие → остывающие → холодные), но и частично автоматизирует их перенос в колоночное хранилище или на более дешёвый носитель согласно заданным правилам, а не «как повезёт». Такой подход упрощает контроль за жизненным циклом данных, снижает конкуренцию за быстрое хранилище и позволяет экономить до 80% затрат на носители.
В рамках вечера пятницы и рубрики «Юмор на Хабре» предлагаю вашему вниманию этот художественный текст.
Иногда будущее рождается не из желания всё ускорить, а из твёрдого намерения наконец-то всё как следует ограничить.
Это история о том, как попытка сделать интернет более управляемым случайно превратилась в новый сетевой стек, решила старые проблемы связи, понравилась операторам, впечатлила мир и поставила Россию впереди планеты.
Я сделал наручные часы, которые показывают время четырьмя светодиодами в двоичном коде. Захотелось сделать подарок знакомому и заодно пройти весь цикл разработки embedded-устройства: схемотехника, четырёхслойная PCB, прошивка.
В статье расскажу про решения, ошибки (включая ту, из-за которой USB не заработал) и устройство прошивки.
Когда я впервые заинтересовался шифрованием, я знал о шифрах только то, что в них время от времени находят уязвимости. Чтобы хоть как-то разобраться в этой теме без наставника, специальной литературы и (поначалу) без доступа к интернету, я решил проводить опыты над самодельным шифром. Одни идеи сменялись другими, а новые знания из разных источников заставляли многое пересматривать снова и снова. Шифр многократно менялся, пока не приобрёл более-менее стабильные черты. Целью же данной статьи является описание истории создания этого шифра и реализованных в нём принципов, а также выставить на суд читателю полученный результат.
Я проверил маленький нейросетевой слой в арифметике GF(137): не через квантизацию готовой float32-модели, а сразу в байтовом конечнополевом представлении. В лучшем замере получилось около 4x по памяти и до 4.86x по времени относительно моей NumPy float32-реализации. Внутри — код нативного ядра, ARM NEON, таблица запусков и честный разбор, где результат не сработал.
Глава «Ростелекома» Михаил Осеевский заявил, что из‑за удаления MAX из App Store российские пользователи откажутся от iPhone и перейдут на Android или «Аврору».
28 мая Anthropic выпустила Opus 4.8 — через 41 день после 4.7, каденс релизов сжался с трёх месяцев до шести недель. Цена та же, $5/$25 за миллион токенов. Но самое интересное не в бенчмарках. Главная цифра релиза — модель в ~4 раза реже оставляет незамеченными собственные баги и честнее говорит о своём прогрессе. И ровно в этот же день выходят Dynamic Workflows: Claude сам пишет оркестрационный скрипт и гоняет десятки-сотни субагентов, проверяя себя. В апреле я писал, почему не доверяю полностью автономным агентам. Аргумент был один: агент тихо срезает углы и красиво врёт «pytest зелёный». А теперь Anthropic чинит ровно эту дыру — и я, кажется, хочу всё-таки попробовать. Внутри: честный разбор патчноута, почему честность важнее бенчмарков, что не так с заявкой про деградацию контекста, fast-режим в 3 раза дешевле и что про модель пишут в сообществе.
Представьте: вы пятнадцать лет строили IT-инфраструктуру в банке или крупной розничной сети. Прошли через импортозамещение, наладили аварийное восстановление систем, получили сертификаты по стандартам управления IT. А потом приходите в продуктовую компанию - онлайн-кинотеатр, маркетплейс, образовательную платформу - и с треском проваливаете собеседование на позицию IT-директора.
Вас спрашивают, как вы будете повышать выручку от мобильного приложения и измерять удовольствие клиентов от сервиса. А вы рассказываете про время реакции техподдержки, внутренние регламенты и уровень зрелости процессов. Вас вежливо благодарят и не берут на работу.
Бывает и наоборот. Продуктовый лидер с опытом быстрых релизов и экспериментов приходит в промышленный холдинг. А там нужно, чтобы бухгалтерская система не падала в конце квартала, бюджет соблюдался, а любое изменение согласовывалось с тремя отделами. Тоже не берут.
За последние полтора года я участвовал в разборе нескольких таких кейсов. Не в теории, а в реальных собеседованиях и их последующем анализе. Дело почти всегда не в технологиях - с ними у кандидатов как раз всё в порядке. Дело в том, что IT-директор в большой корпорации и IT-директор в продуктовой компании - это две разные роли. У них разный язык, разные показатели эффективности и разная зона ответственности.
Ниже я опишу два типа, которые сложились на рынке. Почти всегда один из них оказывается главным в конкретном бизнесе, хотя в чистом виде они встречаются нечасто.
Сравниваем нативный Property Graph в Spanner с рекурсивными CTE в AlloyDB — и объясняем, почему для персональной wiki второй подход оказался практичнее
Эксперт ИнфоТеКС на совместноммитапе Moscow QA #23 x ИнфоТеКС & Юзтех представил методику двойной матрицы рисков: как оценить рутинные процессы, не выгореть и понять, что автоматизировать, а что оставить.