.۱ مقدمه

مهمترین روشهای تعیین لیتولوژی، استفاده از چاهنمودارهای پتروفیزیکـی، مطالعـهی مغزههـا و اسـتفاده از نمودارهـای

استاندارد تعیین لیتولوژی است. استفاده از مغزهها روشی مستقیم در شناسایی لیتولوژی بهحساب میآید، اما تهیهی مغـزه

بسیار پرهزینه است و همچنین به علت تهیهی ناپیوستهی آنها در طول یک چاه،معمولاً شرح کـاملی از سـازند را در بـر

نخواهند داشت. این در حالی است که چاهنمودارها میتوانند یک برآورد پیوسته از یک سازند را در طول چـاه مشـخص نمایند. محققانی همچون دلفینر۱، کلاویر۲ و روست۳ نشان دادند کـه پاسـخ چاهنمودارهـا ایـدهی مناسـبی جهـت تعیـین لیتولوژی است ۱] و.[۲

پــیش از پیــدایش کامپیوترهــای امــروزی متــداولترین روش تعیــین لیتولــوژی اســتفاده از نمودارهــای اســتاندارد بــود.

پرکاربردترین این نمودارها توسط شرکت شلومبرژه۴ ارائه شده است. بالغ بر ۱۰ نمودار دوبعدی بـرای تعیـین لیتولـوژی وجود دارد که هر کدام بر اساس ویژگیهای پتروفیزیکی گوناگونی نظیر چگالی حجمی، اثرفتوالکتریک و غیره قـادر بـه

تعیین کانیهای مخزنی هستند .[۳] اما این نمودارها تنها قادر به استفاده از دو ویژگی پتروفیزیکی جهت تعیین لیتولـوژی بودند و در تعیین ساختارهای لیتولوژیکی ساده کارایی داشتند. در مجمـوع در ایـن نمودارهـا، نظـر کارشناسـان اهمیـت بیشتری داشت. با پیدایش نسل جدید کامپیوترها و ارتقای برنامههای پردازشی، قدرت پردازش دادهها چند برابـر شـد و طی سه دههی اخیر استفاده از روشهای هوشمند جایگزینی مناسب برای تعیین لیتولوژی شد. مهمترین مزیت استفاده از این تکنیکها، قدرت افزایش فضای ویژگی و در نتیجه افزایش دقت پردازش اسـت. چاهنمودارهـای اثـر فوتوالکتریـک،

چگالی، اشعهی گاما و تخلخل نوترون مهمتـرین چاهنمودارهـا در تخمـین لیتولـوژی هسـتند کـه بـه عنـوان ورودی در خوشهبندی و تخمینگرها مورد استفاده قرار میگیرند. برخی محققین نظیر کودی۵ و اجبای۶ (سال (۲۰۱۲ اظهار داشـتند

که میتوان به کمک چاه نمودار اشعهی گاما، لیتولوژیهـای غالـب ماننـد ماسـه و شـیل را از یکـدیگر تفکیـک نمـود و

زونهای تراوا و متخلخل را از زونهای ناتراوا و کم تخلخل جدا کرد .[۴] محققان دیگری نظیر آکینیوکـان۷ و همکـاران

(سال (۲۰۰۹ با استفاده از چاه نمودارهای چگالی، اشعهی گاما و تخلخل نوترون و بهکارگیری روشهای شبکهی عصبی به تخمین لیتولوژی پرداختهاند و موفق به تفکیک لیتولوژیهای غالب نظیر ماسهسـنگ و شـیل شـدند، عـلاوه بـر آن بـا استفاده از این تکنیکها و بهکارگیری نمودارهای مقاومت ویژهی سازند به محتوای سیال نیز پی بردند .[۵]

با توجه به اهمیت تعیین لیتولوی در ارزیابی ذخایر هیدروکربنی و سنجش کیفیت مخـزن، هـدف ایـن مقالـه بهینهسـازی روشهای خوشهبندی در جهت تعیین جوامع غالب لیتولوژیکی و ارائهی رویکـرد خوشـهبندی-تخمـین جهـت تخمـین

لیتولوژی است. به این منظور در ابتدا به معرفی روش تحقیق، که شامل الگوریتم خوشهبندی و تخمین است پرداخته شده

است، در مرحلهی بعد دادههای مورد استفاده و ارزیابی اولیهیآنها ارائه شده است. در خاتمه نیز نتایج اعمال خوشهبندی و تخمینگر بر روی دادهها نشان داده شده است.

۱ Delfiner 2 Clavier 3 Rust

۴ Schlumberger 5 Cuddy 6 Egbai 7 Akinyokun

۳۰

ساخت نگار لیتولوژی با رویکرد خوشهبندی – تخمین …

.۲ روش تحقیق

×فرایند پژوهش حاضر شامل سه بخش ورود دادههای پتروفیزیکی، بخش پردازشی و دریافت خروجیها است (شکل .(۱

خروجی مرحلهی پردازشی دوم

مقایسه تعیین درصد کانی
تطابق اعمال
پایان نتایج با ها در هر جامعه
تخمینگر
مغزهها لیتولوژیکی

عدم تطابق

مرحلهی پردازشی اول

تعیین خوشه
جوامع
بندی
غالب

لیتولوژیکی

ورودی

دادههای

پتروفیزیک

ی

شکل :۱ نمایش گرافیکی از مراحل انجام تحقیق

بخش پردازشی خود از دو زیربخش اساسی تشکیل شده است. قسمت اول مربوط به استفاده از خوشهبندی جهت تعیین جوامع غالب لیتولوژیکی و همگن کردن فضـای داده اسـت. روش خوشـهبندی اسـتفاده شـده در ایـن مقالـه الگـوریتم گوستاوسون کسل۱ و تخمینگر مورد استفاده شبکهی پرسپترون چند لایه (MLP) است.

۱-۲الگوریتم گوستاوسون کسل

الگوریتم گوستاوسون کسل یکی از روشهای خوشهبندی فازی بهشمار میآید که در آن بر خلاف روشهای خوشهبندی

معمول نظیر الگوریتم میانگین k داده۲، برای سنجش میزان شباهت بین نمونهها، از معیار فاصلهی ماهـالانوبیس۳ اسـتفاده

میشود. مزیت این معیار، تفکیک خوشهها با توجه به ساختار دادهها است و این عمل با محاسبهی ماتریس القاگردادههـا در خوشهها صورت میگیرد همین امر سبب میشود تا الگوریتم قادر به تشخیص خوشـههای بـا سـاختارهای خطـی و
بیضوی نیز باشد .[۶] مراحل پردازشی الگوریتم به شرح زیر است :[۷]

الف- قبل از وارد کردن دادهها در الگوریتم نیاز است تا تمامی آنها در دامنهی عددی مشابهی قرار گرفته تـا بتـوان بـرای پردازشهای بعدی از آنها استفاده نمود. برای نرمال کردن دادهها از معادلهی((۱ استفاده شده است:
xi − xmin ×
x̅i = xmax − xmin
که در آن xi دادهی نرمال نشده، xmin و xmax به ترتیب کمترین و بیشترین دادهی نرمال نشده و x̅ دادهی نرمال شده است.

ب- تعیین تعداد خوشههای c، و مقدار دهی پارامتر وزنی mکه معمولاً برابر با دو درنظر گرفته میشـود و میـزان فـازی بودن دادهها را نشان میدهد.
ج- تعیین مقدار اولیه ماتریس جداسازی U0 = [uik] به صورت تصادفی.

د- محاسبهی مراکز خوشهها Vi مطابق معادلهی :(۲)
] [ ] [ k )mx ik (u ∑n
k=1
× ۱, n and k ∈ ۱, c i ∈ , Vi =
)m ik (u ∑n
k=1

۱ Gustafson Kessel
۲برای کسب اطلاعات بیشتر در ارتباط با عملکرد این الگوریتم میتوان به Statistical Pattern Recognition, Webb A.,2002 مراجعه نمود. ۳ Mahalanobis

۳۱

مجله زمین شناسی نفت ایران، سال سوم، شماره ۵، ۱۳۹۲

که در آن n تعداد دفعات محاسبهی ماتریس جداسازی و محاسبهی مرکز خوشه است.

ه- محاسبهی ماتریس کواریانس Fi که نشاندهدهی چگونگی پراکندگی دادهها در یک خوشه است و نحوهی محاسـبهی

آن برای هر خوشه مطابق با معادلهی (۳) است:
] [ − v )T k − v )(x k )m(x ik (u ∑n
i i k=1
۱, c × i ∈ , Fi =
)m ik (u ∑n
k=1

و- محاسبهی ماتریس القاگر Ai برای هر خوشه مطابق معادلهی :(۴)

, i ∈ [۱, c]× h
Ai = √ρidet(Fi)Fi−۱
که در آن h بعد فضای داده و i برابر با ۱ در نظر گرفته میشود.
ز- محاسبهی فاصلهی ماهالانوبیس برای هر نمونه xk از هر مرکز خوشه Vi مطابق با معادله توسط معادلهی :(۵)
− v ) k (x − v )TA k (x = d2
i i i ik
ح- جدید کردن ماتریس جداسازی U = [uik] برای هر نمونه و تعیین درجهی عضویت نمونهها مطابق با معادلهی :(۶)
, i ∈ [۱, c] and k ∈ [۱, n] 1 uik =

۲
m−۱ dik c
( ) ∑
dij
j=1

پس از تعیین جوامع غالب لیتولوژیکی به کمـک روشهـای خوشـهبندی، بخـش دوم پـردازش اسـتفاده از تخمینگـر MLPجهت تخمین درصد کانیهاست.

۲-۲ تخمینگر MLP

یک شبکهی عصبی مصنوعی ۱(ANN) ابزاری محاسباتی موازی برای پردازش اطلاعات است که از سیستم عصبی زیستی الهام گرفته شده و مانند مغز به پردازش اطلاعات میپردازد. عنصر کلیدی ایـن ایـده، سـاختار جدیـد سیسـتم پـردازش

اطلاعات است. یکشبکهی عصبی قادر به انجام پردازشهایی نظیر شناسایی الگوها و دستهبندی اطلاعات است ۸] و.[۹ در این مقاله هدف تعیین درصد کانیهای مخزنی در بخشهای فاقد مغزه است، لذا ابتـدا بـه کمـک دادههـای مغـزه بـه شبکهی عصبی آموزش داده میشود و سپس از آن خواسته میشود تا در بخشهای دیگر درصد کانیها را تخمین بزنـد.

عناصر در شبکههای عصبی به طرق مختلفی به یکدیگر اتصال پیدا میکنند و ساختارهای گونـاگونی را پدیـد میآورنـد.

یکی از این ساختارها، شبکهی پرسپترون چند لایه ۲(MLP) است.

۱ Artificial Neural Network 2 Multilayer Perceptron

۳۲

ساخت نگار لیتولوژی با رویکرد خوشهبندی – تخمین …

این شبکهها قادرند با انتخاب مناسب تعداد لایهها و سلولهای عصبی، یک نگاشت غیرخطی را بـا دقـت دلخـواه انجـام

دهند. شبکههای پرسپترون تک لایه از این مشکل اساسی برخوردارند که تنها توانایی حل آن دسته از مسائل طبقهبندی را داشتند، که به طور خطی از هم متمایز میشدند. برای حل این مشکل شبکههای پرسپترون چند لایه مطـرح شـد. وجـود لایهی میانی، قابلیت شبکههای پرسپترون چند لایه را در تخمین یک نگاشت افزایش میدهد. افزایش تعـداد لایـه میـانی

شبکه را قادر میسازد تا اطلاعات آماری کاملتری در مورد مسئله کسب کند .[۱۰] به عنوان مثال در شکل۲ یک شبکهی

عصبی با چهار ورودی، سه لایه و سه خروجیست. ورودیهای p1 تا p4 وارد لایه ورودی میشوند و پس از ضرب هـر

ورودی در مقدار وزن خود و محاسبهی ورودی کل، وارد تابع هر نرون میشوند. هر نرون یک خروجی تولید میکند که این خروجی به عنوان ورودی، وارد تمام نرونهای لایه بعدی میشود. بدین ترتیب، خروجیهای لایه اول، بردار ورودی

لایه دوم را تشکیل میدهند و به همین ترتیب بردار خروجی لایه دوم، ورودیهای لایه سوم را میسازند و خروجیهای لایه سوم، پاسخ واقعی شبکه را تشکیل میدهند. در نهایت خروجیهای a1 تا a3 به عنوان خروجیهـای شـبکه حاصـل

میشوند .[۱۱]

لایهی ۲ لایهی ۱ ورودی
لایهی ۳

شکل :۲ مثالی از شبکهی عصبی پرسپترون چند لایه [۱۱]

مراحل کلی در الگوریتم MLP به شرح زیر است ۱۰ ] و :[۱۲

الف- تعیین متغیرهای ورودی و خروجی مطلوب.

ب- نرمالسازی دادهها در دامنهی دلخواه که این مرحله مطابق با معادلـهی (۱) در قسـمت خوشـهبندی صـورت گرفتـه است.

ج- انتخاب تصادفی % ۷۰ و % ۳۰ دادهها به ترتیب به عنوان دادههای آموزش و دادههای آزمون.

د- تعیین تابع برای محاسبهی خروجی. توابع برانگیزش متعددی برای محاسبهی خروجی وجود دارد، که در این مقاله از تابع برانگیزش خطی مطابق معادلهی (۷) استفاده شده است که در آن خروجی بهدست آمده برابر با ورودی آن است.
a = f(n) = purelin(n) = n×

ه- شبکه مقادیر بردارهای وزن خود را در حین ارائهی دسته دادههای آموزشی و با استفاده از یک قانون یادگیری، طوری

تنظیم میکند که با کمترین خطای ممکن رابطه بین خروجیها و ورودیهای الگوهای آموزشی را تشـخیص دهـد. ایـن فرآیند را مرحله یادگیری یا آموزش شبکه مینامند.

و- با توجه به مشخص بودن خروجی، آموزش با نظارت بر روی دادهها صورت گرفتـه و از خروجـی بـه عنـوان بـردار آموزشدهنده استفاده میشود. بعد از اعمال ورودی xi به شبکه، خروجی yi به عنوان تقریبی از مقـدار حقیقـی ti سـاخته

۳۳

مجله زمین شناسی نفت ایران، سال سوم، شماره ۵، ۱۳۹۲

میشود و از خطای (yi- ti) به عنوان عاملی برای اصلاح وزنها استفاده میشود. خطای کلی شـبکه از معادلـهی (۸) بـه

دست میآید:
N 1 P
E = 2 ∑ ∑(yi − ti)2×
p=1 N=1

که درآن E خطای کلی شبکه، P تعداد الگوهای آموزشی، ti خروجی واقعی، yi خروجـی شـبکه در گـرهی i و N تعـداد

گرههای خروجی است. بر اساس خطای محاسبه شدهی وزنهای شبکه آنقدر تغییر داده میشوند تـا اخـتلاف خروجـی

شبکه و خروجی مطلوب به حداقل مورد نظر برسد.

ز- آموزش هنگامی متوقف میشود که مقادیر خروجی محاسبه شده بهترین تقریب را با مقادیر مطلوب داشته باشند. بـه

عبارت دیگر، اگر مجموع خطاهای کلیه الگوهای یادگیری به یک مقدار کوچک از پیش تعیین شـده همگـرا شـود، فـاز

یادگیری خاتمه مییابد. در غیر این صورت، انتشار پسرو انجام شده و خطای محاسبه شده به صـورت پسـرو در شـبکه

منتشر میشوند و وزنهای ارتباطی را تصحیح میکند.

.۳ دادهها

در این مقاله، به منظور بررسی میزان کارایی روشهای خوشهبندی از دو سری دادههای مصنوعی و واقعی استفاده شد. در ابتدا الگوریتمها بر روی دادههای مصنوعی اعمال و میزان کارایی و صحت پاسـخها بررسـی شـد و بـا توجـه بـه نتـایج

بهدست آمده، عملیات خوشهبندی بر روی دادههای واقعی مورد آزمایش قرار گرفت.

۱-۳ دادههای مصنوعی

یکی از راههای کنترل نحوهی عملکرد یک الگوریتم استفاده از دادههای مصنوعیسـت. یـک مجموعـه دادهی مصـنوعی همانطور که از اسم آن پیداست ساخته دست انسان است و اطلاع کامل در ارتباط با جنس داده، نوع توزیع آن، چگونگی پراکندگی و غیره در دست اسـت. اسـتفاده از دادههـای مصـنوعی در واقـع راهـی بـرای ارزیـابی یـک کـد و الگـوریتم محاسباتیست .[۱۳]

در این مقاله از یک مجموعه دادهی مصنوعی که دادههای آن از چهار دسته با ساختارهای کروی، بیضوی و خطی تشکیل شدهاند استفاده شده است. این مجموعه داده در نرم افزار متلب۱ آماده سازی شده و با انتخاب یک مـاتریس میـانگین بـا

درایههای ۱*۲ به عنوان مرکز هر خوشه و ماتریس کواریانس با درایههای ۲*۲ به عنـوان عـاملی بـرای تعیـین نحـوهی

پراکندگی دادههاو شکل هر خوشه برای هر یک از چهار خوشه، این مجموعه دادهی مصنوعی ساخته شد (شکل.(۳

۱ Matlab

۳۴

ساخت نگار لیتولوژی با رویکرد خوشهبندی – تخمین …

(الف

(ج)

(د)

(ب)

شکل :۳دادههای مصنوعی با ساختار (الف)- خطی، (ب)- بیضوی، (ج) و (د)- تودهای

۲-۳ دادههای واقعی

دادههای واقعی که در این مقاله از آن استفاده شد، دادههای مربوط به اطلاعات لاگهای پتروفیزیکی مخـزن آسـماری در چاه شمارهی ۷ واقع در یکی از میادین نفتی جنوب ایران است (شکل .(۴ نکتهی قابـل اهمیـت در انتخـاب ویژگیهـا۱، بررسی میزان اهمیت و تاثیر آنها در بهدست آوردن پاسخهای صحیح و نزدیک به واقعیت است. بـه همـین خـاطر ابتـدا

میبایست از حجم وسیع اطلاعات موجود به انتخاب ویژگی۲ پرداخت و پارامترهای تاثیر گذار بر تعیـین لیتولـوژی را از

بین آنها انتخاب نمود.

Features Feature Selection

۱

۲

۳۵

مجله زمین شناسی نفت ایران، سال سوم، شماره ۵، ۱۳۹۲

DT

GR

RHO

۲۳۷۰

۲۳۹۰

۲۴۱۰

۲۴۳۰

۲۴۵۰

۲۴۷۰

۲۴۹۰

)متر( عمق

شکل :۴ نمایی از چاهنمودارهای استفاده شده در تخمین لیتولوژی

همان طور که در شکل ۴ مشاهده میشود مهمترین ویژگیها که در این مقاله برای تعیین لیتولـوژی و درصـد کانیهـای مخزنی به کار گرفته شدهاند عبارت از نمودارهای چگالی حجمی((RHOB، اشعهی گامـا (GR) و سـرعت صـوت (DT) است. همانطور که ذکر شد در این مقاله تنها نتایج بررسی بر روی چاه شمارهی ۷ از یک میدان نفتی آورده شده است و
نمودارهای موجود در سایر چاهها و محدودهای عمقی آنها در جدول ۱ آورده شده است.