Реальный кейс: как LLM заменяет трех технологов на металлургическом заводе — и почему «универсальный подход» не сработал.
Вначале было… 2 часа на одну карту контроля
Представьте металлургическое предприятие полного цикла: 3200 человек и 4500 тыс номенклатуры, которая все время добавляется….
Как раньше происходила подготовка к испытаниям? Технолог открывал ГОСТ (или ОСТ, или другой нормативный документ), находил таблицу, подставлял в нее параметры номенклатуры, например, диаметр поковки. Находил нужное значение контроля и записывал в карту … Дальше технолог повторял эту процедуру для 40+ параметров контроля.
Оцените масштаб: более 4500 позиций номенклатуры, свыше 200 нормативных документов (ГОСТы, ОСТы), большинство из них – отсканированные документы советской эпохи в формате pdf.
На подготовку одной карты требовалось больше двух часов. Моя задача: сократить это время
Вариант №1. Парсер
Первый вопрос: почему не реализовать задачу через шаблонный парсер?
Не получится, потому что каждый ГОСТ оформлен по-своему. В одном ГОСТе параметры находятся в строках таблицы, в другом в примечаниях, в третьем размазаны по тексту с отсылками на другие разделы.
Нужен подход, который понимает смысл, а не только структуру.
Идея: LLM как технолог
А если использовать LLM как интеллектуальный парсер. Тогда задача выглядит так:
Вход:
-
Нормативный документ (ГОСТ/ОСТ) — скан в PDF
-
Характеристики номенклатуры (марка стали, диаметр заготовки, группа)
Промт:
-
Параметр контроля №1. Название + алгоритм, как его определить
-
Параметр контроля №2. Название + алгоритм, как его определить
-
…
Выход:
-
Таблица:
Параметр контроля — Значение — Источник (раздел/таблица ГОСТа)
Я вижу цель. Дело за реализацией …
Вариант №2 Общий промт
Вторая гипотеза была проста и красива: сделать универсальный промт для всех нормативных документов.
Я начал тестировать разные модели в Рerplexity. Первый ГОСТ зашел на “ура” – Claude Sonnet 4.6 верно определил 85% параметров, GPT 5.4 – 72%. Обе модели запускались в режиме Thinking.
Но победа оказалась сильно условной. На следующих ГОСтах обе модели упрямо ошибались. Я правил промт, однако ошибки продолжались.
Что же, надежда на то, что LLM подсторится под все нормативные документы, не оправдалась. Система спотыкается на отличиях между ГОСТами – то параметр считается через вложенные таблицы, то задается константой.
Оставался один вариант: сделать промт привязанный к конкретному ГОСТу. Единственная неприятность, что на предприятие используется более 200 ГОСТов
Вариант №3 Архитектура, которая сработала
Я уточнил, что 80% номенклатуры завода описывается в 18% ГОСТов. Знакомый со студенческой скамьи принцип Парето в действии.
Для пилота было решено взять 20 наиболее используемых документов.
Структура решения
Для каждого ГОСТа я создал свой промт с правилами:
-
Название параметра: ГОСТ
-
В какой таблице/разделе ГОСТа описывается параметр
-
Как интерпретировать граничные случаи (диапазоны, «не менее», «не более»)
Процесс отладки
На вход промта я подавал параметры номенклатуры и ГОСТ в pdf формате.
На выходе получал таблицу:
Если возникали ошибки (куда без них?), то в диалог Perplexity скидывал скриншот, указывал верные параметры и просил объяснить ошибку. Получив верный результат, давал волшебную команду
Обнови Правило XX так чтобы ошибка больше не повторялась
Потребовалось 9 итераций: зато сейчас система извлекает параметры для выбранных ГОСТов без ошибок.
Потраченное время – 14 рабочих дней.
И главный результат: время подготовки карты контроля теперь составляет 3-5 минут минут. То есть в 24 раза меньше чем было
Что делаю сейчас
Добавляю в систему новые ГОСТы и строю следующий слой:
-
Все правила хранятся в Excel-таблице (а не в промте – чтобы технологи сами правили параметры).
-
На вход промта подается Excel таблица
-
На выходе — таблица для загрузки во внутреннюю информационную систему предприятия
Выводы
-
Современные ИИ справляются с обработкой pdf сканов документов. Сложные структуры, вложеннне таблицы и даже качество сканирования уже не проблема.
-
Принцип Парето вам в помощь. Не пытайтесь сразу оцифровать все документы. Найдите 20% документов, которые содержат большую часть номенклатуры и начните с них.
-
Промт под конкретный документ, а не универсальный. Это противоречит интуиции и не так красиво, однако практично.
-
Итеративная отладка. Большинство ошибок у меня было с распознованием вложенных таблиц разных ГОСТов. Я сделал единые правила для таблиц и ошибки исчезли.
-
Claude Sonnet. Лучше всего разбирает сложные документы
Кому это может быть полезно
Этот подход работает для любой отрасли, где есть:
-
Большой массив нормативных документов (ГОСТы, ОСТы, СНиПы)
-
Документы без конфиденциальной информации
-
Ручной перенос параметров из документов в информационные системы
-
Разнородное форматирование — документы разного качества и формата
Например, металлургия, машиностроение, химическая промышленность, строительство, фармацевтика, энергетика.
Если у вас похожие задачи: нормативная документация, параметры контроля, рутинное извлечение данных из регламентов, напишите в комментарии или в личку. Расскажу, с чего начать и подарю самые неочевидые грабли. Кейс живой, замечания и вопросы однозначно приветствуются.
Автор: Kudryavtsev-AiPrRocknRoll
- Запись добавлена: 02.04.2026 в 19:15
- Оставлено в
Советуем прочесть:
- Tailwind Labs сократил 75% инженерной команды из-за падения доходов
- Китайский технологический гигант заявил, что сократил расходы на AI, используя только китайские чипы
- Sony приостановила продажи карт памяти из-за дефицита
- «Яндекс» существенно сократил расходы на обучение ИИ благодаря оптимизации инфраструктуры
- Amazon научил ИИ-агентов эволюционировать: 3 строки кода и первое место на бенчмарке
- Дорси почти вдвое сократил штат Block
- Илон Маск научил ИИ вставлять рекламу прямо в фильмы без пауз
- Запоминание текста
- Smart Engines проведет открытый вебинар «Распознавание банковских карт для онбординга и интернет-эквайринга»
- Как делегирование и ИИ помогли мне выйти из операционки и начать масштабировать бизнес


