- BrainTools - https://www.braintools.ru -
Думаю, пришло время рассказать широкой общественности об интересном ML проекте в нефтяной отрасли, в котором я принимал участие не только как руководитель направления DS, но и как основной исполнитель. В статье делюсь больше своими впечатлениями [1] и общим подходом в силу политики конфиденциальности, хотя были выступления на профильных конференциях. Проект начался в 2024 году и, по сути, сейчас продолжается, но основная часть уже выполнена. В первой части расскажу в целом о проекте: какую проблему мы решали, какова постановка задачи, о рабочем процессе. Во второй части уже будет больше технической информации, и подведу итоги того, что удалось нам в итоге получить. Спойлер: результаты проекта признаны успешными по итогам реальных, в прямом смысле, полевых испытаний.
Объясню простыми словами, по‑другому не смогу))
Зачастую в процессе эксплуатации нефтяной скважины возникает необходимость заменить или отремонтировать оборудование, размещенное внутри нее, или провести другие работы, требующие остановки выхода нефти и газа через скважину. Как правило, для этого в скважину закачивают соленую воду, чтобы создать противодавление пластовой жидкости (пластовая жидкость создает давление, которое измеряется, и необходимый объем соленой воды легко рассчитывается). Это и называется глушение нефтяной скважины. Однако, в России да и в других нефтедобывающих странах, существуют месторождения, сложенные пористо‑трещиноватыми коллекторами, характеризующимися аномально низким пластовым давлением. Если мы будем закачивать туда обычный солевой раствор, то он просто будет уходить в поры, трещины. Поэтому обычная методика на таких месторождениях не работает, совсем. Поэтому используют различные блокирующие и эмульсионные составы. Их разработка — это целая наука [2]. При закачке блокирующий состав достаточно жидкий, но через полчаса он превращается в очень густое желе, которое закрывает поры и трещины пласта в глубине скважины, и предотвращает выход нефти и газа.
Газ, кстати, тоже присутствует, и вот он как раз создает самую большую опасность для человека, поскольку на некоторых месторождениях газом является сероводород. Два, три вдоха и человек теряет сознание, через 5 минут может умереть. Поэтому у каждого, кто приближается к таким скважинам, должен быть с собой анализатор газов, если прибор начинает сигнализировать о детектировании сероводорода, нужно немедленно надеть противогаз. Мы выезжали смотреть вживую, как проходит процесс глушения, и особое внимание [3] было уделено как раз технике безопасности.
Итак, чтобы эффективно глушить скважины на таких месторождениях, используют разные виды блокирующих и эмульсионных составов. Процесс проходит в несколько стадий, сначала закачивается самый «жесткий» состав — блокирующий, потом эмульсионный, а затем для продавки этих составов используется соленая вода. Бывает, что достаточно только эмульсионной и соленой жидкостей.
Основной проблемой является невозможность всегда правильно рассчитать, сколько необходимо использовать составов. Эти жидкости глушения достаточно дорогие, поэтому лить их просто бесконтрольно никто в любой нефтяной компании не позволит. Поэтому мы приходим к постановке задачи: необходимо по предварительным данным о скважине и о состоянии пласта спрогнозировать необходимый для успешного глушения объем трех жидкостей.
А как на данный момент рассчитывают необходимый объем составов? На протяжении, наверное, уже лет 10 пытаются разработать подход на основе математического моделирования, используя модель двухфазной фильтрации: моделируют закачку жидкостей определенной вязкости, процесс протекания через пласт и рассчитывают необходимый объем для создания противодавления. Поскольку процесс очень сложный, и многие параметры просто невозможно оценить, то математическое моделирование показывает неудовлетворительные результаты. Поэтому сейчас используют методику на основе эмпирического опыта [4]: операторы руководствуются значениями коэффициента аномальности, ранее закачанных объемов и… своей интуицией [5]. А интуиция, кстати, очень хорошо работает, правда не всегда. Поэтому, как можем сразу заметить, таргет модели будет иметь весьма неопределенный характер.
Неопределенность таргета еще более усиливается, если попытаться оценить его в случае нескольких неуспешных глушений: в случае такого неуспешного глушения (например, закаченных жидкостей не хватило, чтобы заглушить скважину), глушения повторяются до успеха. Причем непонятно, как учитывать объемы прошедших неуспешных глушений. Мы предложили просто складывать объемы с какими-то коэффициентами, пропорциональными времени между циклами глушения (предполагается, что блок. составы со временем поглощаются в пласте полностью). Если уж заговорил про таргет, то стоит упомянуть, что где-то на третий месяц проекта мы решили преобразовывать наш таргет объема в объем, который нужно прибавить (или убавить) к объему предыдущего глушения. То есть, если ранее было закачано, условно, 5 м3 блок. состава и скважина стала аномальнее, то предполагается, что сейчас нужно использовать, например, 5 + 2 м3. Такой подход действительно помог улучшить метрики для скважин, которые часто глушатся. Для случаев новых скважин такой подход, конечно же, не работает.
Не буду долго углубляться в описание признаков, могу только сказать, что неопределенность таргета – это еще меньшая проблема. История глушения скважин была в виде эксел таблицы, с пропусками, с грязью, с малым количеством строк, в общем полный набор “проблем” данных в промышленности. Размер датасета (2000) хоть и был адекватен, но если строить модели для разных месторождений, заменять циклы неуспешных глушений на одно успешное, и возможно, хоть как-то кластеризовать скважины на проблемные и беспроблемные, чтобы улучшить качество прогноза, то данных становится маловато. Да и признаков было маловато, мы, конечно же, нагенерили дополнительных, и в процессе выполнения проекта нам были предоставлены дополнительные данные из технологического режима эксплуатации скважин. Временные ряды суточных дебитов и забойных давлений тоже были у нас в распоряжении, но в итоге они нам не пригодились. Были и координаты скважин и разломов в пласте, но такие признаки, как расстояние между скважиной и ближайшим разломом или факт пересечения скважины разломом тоже не дали прироста к качеству моделей.
Табличные данные, малый размер датасета и нелинейные зависимости сразу натолкнули нас на использование методов градиентного бустинга: catboost и xgboost. В итоге выбрали catboost из-за наличия большого набора категориальных признаков. К xgboost мы вернемся позднее. Боролись с переобучением, в основном, L2 регуляризацией.
В процессе анализа данных было замечено очевидное: проблемные глушения требуют большего объема. Тогда возникла идея построить разные модели, для проблемных и беспроблемных глушений, однако, при этом нужно было изначально по каким-то данным определять тип предстоящего глушения. Все попытки построить адекватную модель классификации проблемности глушений не увенчались успехом. Действительно, можно подбором порога увеличить реколл, но тогда пришлось бы много глушений считать проблемными и использовать значительные объемы. Поэтому гипотеза была отвергнута.
Пару слов хочу сказать, как был устроен рабочий процесс, может это интересно. Как обычно, проект был разделен на этапы. На первом этапе (3 месяца) мы вообще проверяли возможность использовать машинное обучение [6] на данных. В конце второго этапа мы должны были предоставить уже работающие модели и проверить их на отложенной выборке (глушения, которые проводились в период 1-ого и 2-ого этапа, которые мы не могли видеть). Нам была предоставлена свежая таблица истории глушения без объемов, и мы должны были ее заполнить своими расчетами. Признак «Результат глушения» (положительно/отрицательно) тоже был удален, как и признаки, указывающие какие жидкости использовались. Поэтому пришлось заполнять и эти признаки вручную исходя из данных. На третьем этапе проводилось реальное опытно‑промышленное испытание (ОПИ), параллельно мы докручивали модели (а лучше сказать, реализовали новый подход). ОПИ проходило следующим образом: появляется необходимость заглушить скважину № Х, нам передается вся необходимая информация по этой скважине, и мы в течение короткого периода времени должны прислать объемы всех жидкостей, которые планируется использовать. Глушение проходит строго с теми объемами, которые мы рассчитали. Результаты ОПИ, скорее всего опишу во второй части, но сейчас могу сказать, что мы прокачали личное качество «Ответственность» значительно)) Это первый раз, когда нашу методику использовали в решении данной проблемы. На 4-м этапе внедряли наши модели на другом новом месторождении.
Пока на этом заканчиваю, продолжение во второй части. Спасибо за внимание!
Автор: antonkozhukhov
Источник [7]
Сайт-источник BrainTools: https://www.braintools.ru
Путь до страницы источника: https://www.braintools.ru/article/31101
URLs in this post:
[1] впечатлениями: http://www.braintools.ru/article/2012
[2] наука: http://www.braintools.ru/article/7634
[3] внимание: http://www.braintools.ru/article/7595
[4] опыта: http://www.braintools.ru/article/6952
[5] интуицией: http://www.braintools.ru/article/6929
[6] обучение: http://www.braintools.ru/article/5125
[7] Источник: https://habr.com/ru/articles/1042232/?utm_campaign=1042232&utm_source=habrahabr&utm_medium=rss
Нажмите здесь для печати.