Как я пытался создать «конструктор налоговых проверок» для повышения эффективности работы ФНС. Big Data.. Big Data. llm.. Big Data. llm. АИС Налог.. Big Data. llm. АИС Налог. Алгоритмы.. Big Data. llm. АИС Налог. Алгоритмы. Анализ и проектирование систем.. Big Data. llm. АИС Налог. Алгоритмы. Анализ и проектирование систем. базы данных.. Big Data. llm. АИС Налог. Алгоритмы. Анализ и проектирование систем. базы данных. искусственный интеллект.. Big Data. llm. АИС Налог. Алгоритмы. Анализ и проектирование систем. базы данных. искусственный интеллект. Исследования и прогнозы в IT.. Big Data. llm. АИС Налог. Алгоритмы. Анализ и проектирование систем. базы данных. искусственный интеллект. Исследования и прогнозы в IT. налоговый инспектор.. Big Data. llm. АИС Налог. Алгоритмы. Анализ и проектирование систем. базы данных. искусственный интеллект. Исследования и прогнозы в IT. налоговый инспектор. Налоговый контроль.. Big Data. llm. АИС Налог. Алгоритмы. Анализ и проектирование систем. базы данных. искусственный интеллект. Исследования и прогнозы в IT. налоговый инспектор. Налоговый контроль. нейросети.. Big Data. llm. АИС Налог. Алгоритмы. Анализ и проектирование систем. базы данных. искусственный интеллект. Исследования и прогнозы в IT. налоговый инспектор. Налоговый контроль. нейросети. фнс.

Для начала – немного контекста. Я не программист и не разработчик. Последние 12 лет я проработал в Федеральной налоговой службе. Начинал с низов, занимался выездными и камеральными проверками (проводил лично и курировал). Два месяца назад я уволился, завел свой телеграм-канал и теперь работаю в налоговом консалтинге.

Эта статья – история о том, как я попытался решить огромную проблему государственной системы с помощью домашнего ноутбука и нейросетей. О том, как я переоценил свои силы, недооценил масштаб задачи, но все-таки попробовал создать инструмент, который мог бы изменить работу инспектора.

С чего все началось: линейка, карандаш и Ctrl+C

Вернемся на 12 лет назад. Когда я только пришел в ФНС, меня ждало настоящее культурное потрясение. 2014 год, мой первый рабочий день, я захожу в кабинет и вижу инспектора, который сидит за столом и чертит таблицу. Не в Excel. Он делает это на листе бумаги, используя деревянную линейку, карандаш и ручку.

Меня тогда это сильно удивило, но я выстоял и сделал свой первый «автоматизатор» – простой шаблон в Excel. С помощью него можно было копируя данные из ЭОД (основная программа работы в то время) заполнить большую часть документа, который назывался «заключение предпроверочного анализа». Инспектор просто копировал данные, вставлял их в ячейки, а формулы сами считали налоговую нагрузку и другие нужные показатели. Коллеги были в восторге.

Прошло много лет. ФНС совершила огромный скачок: появился АИС «Налог-3», мощные базы данных, аналитика. Здесь возможности АИС «Налог-3» описывать не буду, уже написал на эту тему 2 статьи: «АИС «Налог-3»: почему это одна из самых мощных государственных IT-систем России» и «Почему внедрение LLM в АИС «Налог-3» неизбежно — и что это изменит в налоговом контроле».

Возвращаемся: несмотря на цифровую эволюцию ФНС, парадокс заключается в том, что «на земле», в инспекциях, рутина практически не изменилась. Инспектор по-прежнему тратит до 30% своего рабочего времени на механическое Ctrl+C – Ctrl+V.

Данные в АИС есть, их много. Но чтобы превратить их в итоговый документ – акт проверки, заключение или аналитическую справку – нужно открыть множество окон, скопировать строчку, вставить в Word, потом вернуться, скопировать цифру, вставить в таблицу. Удобных внутренних шаблонов или алгоритмов встроенных в АИС, которые делали бы это за один клик, катастрофически не хватает.

И вот еще в начале прошлого года, я загорелся идеей: а почему бы не попробовать это исправить?

Идея: «экзоскелет» для инспектора

Я поставил перед собой, как мне казалось, понятную задачу. Я хотел создать портативную программу-надстройку. Своего рода «конструктор», который забрал бы у инспектора эту рутинную работу.

Идея делилась на три части:

  1.  Автоматический сбор. Программа должна сама «вытягивать» из выгрузок АИС всю возможную информацию (пока из выгруженных файлов, но с возможностью в режиме надстройки к АИС – самостоятельно формировать выходные формы документов по заданным параметрам).

    Так как я делал программу дома, и что называется «на коленке», я сделал шаблоны документов по такому же принципу как они выгружаются из АИС. Например, ООО «Ромашка» ИНН 2345678910. Адрес: г. Москва, Ленина 112., и т.д. Это нужно было для того, чтобы можно было на примере показать работу программы для презентации руководству. Вроде: «смотрите как может моя программа, а если сделать из нее надстройку и подключить к АИС, то вообще будет классно, круто, давайте пользоваться»

  2. Интерпретация. Алгоритм должен сам раскладывать данные по полочкам, формировать структуру нарушения (это могут быть как методологические нарушения, так и не соблюдение условий установленных статьей 54.1 НК РФ).

  3. Генерация. На выходе должен получаться готовый документ (акт, решение или аналитическая справка), который остается только немного подправить и подписать. В будущем я планировал добавить и другие документы, которые также можно было формировать через программу.

Как я вайбкодил и что из этого вышло

Отсутствие профильного IT-образования и навыков программирования я компенсировал «вайб-кодингом». В теории это звучит так: ты не знаешь синтаксиса языка, но понимаешь общую логику процесса и просто описываешь нейросети желаемый результат. Ты по сути выступаешь в роли «менеджера», а код пишет нейронная сеть.

На практике же всё несколько иначе. Если ты совсем не понимаешь основ, ты обречен наступать на одни и те же грабли и разгребать гору ошибок. Нейронную сеть нужно не просто просить что-то сделать, её нужно направлять, а для этого необходимо хоть немного разбираться в предмете. Тем не менее, на старте, пока проект был небольшим, моих логических способностей хватало. Формулировать промпты в духе «информация из этой ячейки Excel должна отображаться в этом окне выходной формы» было несложно.

Весь код писался на Python с использованием библиотеки Tkinter для интерфейса. В качестве моей команды поддержки выступали бесплатная версия Grok, Qwen и DeepSeek.

Что удалось реализовать (Версия 0.29)

Как я пытался создать «конструктор налоговых проверок» для повышения эффективности работы ФНС - 1
  • Интерфейс. Получилось вполне сносное рабочее окно. Слева – дерево документа («Общие сведения», «Анализ контрагентов»), справа – поля для данных. Интерфейс строился динамически. Если я выбирал тип нарушения «Необоснованные вычеты по НДС», программа активировала специальный блок.

  • Парсинг. Программа научилась открывать файлы .doc, .rtf, конвертировать таблицы в Excel и находить нужного налогоплательщика.

  • Логика проверки. Я прописал алгоритм для статьи 54.1 НК РФ. Можно было выбрать тип нарушения, указать количество подозрительных контрагентов, и программа создавала под каждого из них отдельный подраздел в структуре акта.

  • Генерация. По кнопке «Сформировать» программа реально собирала все введенные данные и выдавала файл по выбранному типу «Аналитическая записка», «Заключение ППА», «Акт ВНП или КНП».

Программа собирала все разрозненные данные от ОКВЭДов до анализа расчетных счетов и выдавала готовый .docx файл с заголовками и структурой.

То есть уже даже в этом виде программу можно было использовать без привязки к АИС для формирования документа (написания акта) внутри этой программы.

Сложности реализации и причины остановки

В процессе разработки я столкнулся с проблемами, которые невозможно решить одним лишь «вайб-кодингом».

  1. Проблема архитектуры и поддержки кода. Поскольку я не программист, весь код писался ситуативно. Логика парсинга держится на жестких текстовых привязках (условия вида if “сведения о” in cell_value). Это работает на тестах, но любое изменение формы выписки или сдвиг столбцов в исходных данных ломает программу. Поддерживать и масштабировать такой код без грамотной архитектуры невозможно.

  2. Ограничения контекста ИИ. По мере добавления функций код разросся. Бесплатные версии языковых моделей, которые я использовал для написания кода, имеют ограниченное контекстное окно. В какой-то момент нейросеть просто перестала «видеть» весь файл целиком. Я просил исправить ошибку в одной функции, а модель, потеряв контекст, ломала логику в другой части программы.

  3. Ресурсные ограничения У меня была идея внедрить локальную LLM (DeepSeek или Qwen) для интеллектуального анализа сканов документов через OCR. Я хотел, чтобы программа сама находила смысловые несоответствия в договорах. Однако мой ноутбук технически не тянул одновременную работу интерфейса, алгоритмов и нейросети.

  4. Масштаб задачи Я понял, что переоценил свои возможности. Создать прототип для себя – это одно. Но разработать надежный инструмент для использования в госоргане – это задача для полноценной команды разработки, а не для одного энтузиаста с чат-ботом.

Итоги

Мой «Конструктор актов» остановился на версии 0.29, но этот эксперимент нельзя назвать неудачным. Главный вывод, который я сделал – пропасть между желаниями инспектора и возможностями IT преодолима. Даже любительский скрипт, собранный «на коленке», способен кратно ускорить сбор данных, а значит, технически автоматизировать рутину в ФНС более чем реально. Вайб-кодинг в этом процессе показал себя как не плохой инструмент для быстрого прототипирования.

Однако, чтобы превратить такой макет в надежный продукт для государственного органа, одного энтузиазма мало – необходим системный подход и профессиональная архитектура. Надеюсь, мой опыт подсветит эту проблему для тех, кто занимается цифровизацией профессионально. Данные и инструменты уже есть, осталось лишь дать инспектору удобный современный «карандаш» вместо ручного заполнения таблиц.

Если у вас есть вопросы по налоговому контролю – пишите и спрашивайте в комментариях. Еще много полезной информации я размещаю с своем телеграм-канале «Налоговый Инсайдер» https://t.me/naloginsider.

 

Автор: strannik96

Источник

Rambler's Top100