ارزیابی تکنیک‌های یادگیری عمیق ماشینی در تخمین خطر لرزه‌خیزی استان زمین‌ساختی البرز- آذربایجان

نوع مقاله : مقاله پژوهشی

نویسنده

گروه برنامه ریزی و طراحی محیط زیست، پژوهشکده علوم محیطی، دانشگاه شهید بهشتی، تهران، ایران

چکیده

سابقه و هدف: یکی از مخرب‌ترین مخاطرات محیطی، زلزله است. از اینرو پیش بینی و پیش‌یابی این مخاطره برای کاهش پیامدهای آن و بهبود امر مدیریت بحران در زمرۀ مهمترین اهداف پژوهشگران محسوب می‌شود.  با استفاده از شاخص‌های لرزه‌خیزی و بکارگیری تکنیک‌های یادگیری ماشینی، الگوهای رفتار لرزه‌خیزی در یک منطقه لرزه‌زا آشکار می‌شود. این روش‌ها توانمندی ویژه‌ای در مدل‌سازی رفتارهای غیرخطی داده‌های لرزه‌ای نشان داده‌اند. از اینرو امروزه به ابزاری برای درک پدیده‌های طبیعی تبدیل شده‌اند.

مواد و روش‌ها: در مطالعۀ حاضر کاتالوگ زلزله‌های استان زمین‌ساختی البرز-آذربایجان در بازۀ زمانی اول ژانویه 1995 تا 23 ژانویه 2024 تدوین شده است. تبدیلات بزرگای زلزله‌ها به بزرگای گشتاوری به منظور همگن نمودن کاتالوگ انجام شده است. سپس براساس تغییرات زمانی مقدار بزرگای کامل بودن، آستانۀ بزرگای مطالعه در استان زمین‌ساختی البرز-آذربایجان تعیین شده است تا در ادامه دقت لازم برای تجزیه و تحلیل‎ها فراهم گردد. سه روش یادگیری ماشینی شامل شبکه عصبی مصنوعی (Artificial Neural Network) ، جنگل تصادفی (Random Forest) و ماشین بردار پشتیبان (Support Vector Machine) برای پیش بینی زمان و بزرگای زلزله‌ها انتخاب شدند، نه شاخص معرف رفتار لرزه‌خیزی برای کاتالوگ زلزله‌های البرز- آذربایجان برآورد شد تا پس از اجرای تکنیک‌های مذکور میزان خطای برآوردها در قالب چهار نوع برآورد خطا  (F1 Score, Recall, Precision, Accuracy)محاسبه و گزارش گردد.

 نتایج و بحث: یادگیری ماشینی در این مطالعه با استفاده از 245 بردار در قالب 9 شاخص انجام شده است. برچسب "1" نشان دهنده وقوع حداقل یک زمین لرزه با بزرگی برابر یا بالاتر از آستانۀ بزرگای گشتاوری5.5 است، در حالی که برچسب "0" نشان دهنده عدم وجود فعالیت لرزه‌ای زمین لرزه‌هایی با بزرگای کمتر از 5.5 است. در این پژوهش 80 درصد از بردارهای داده برای آموزش مدل بکارگرفته می‌شود و20 % از بردارهای داده به عنوان آزمون استفاده می‌شود. یافته‌ها از مقادیر حاصل از خطای هشدارهای درست و غلط تخمین زده شده برای هریک از تکنیک‌های یادگیری ماشینی برای داده‌های لرزه‌ای البرز -آذربایجان، حاکی از موفقیت هر سه تکنیک یادگیری ماشینی در پیش بینی رویداد‌های کاتالوگ لرزه‌ای البرز- آذربایجان است. بطورکلی، دقت بالای 95% برای هر سه تکنیک حاصل شده است.

نتیجه‌گیری: یافته‌ها معرف موفقیت این تکنیک‌ها در تخمین چرخۀ انباشت تنش و رهاسازی مرتبط با فعالیت لرزه‌ای در استان زمینساختی البرز- آذربایجان است.. با اختلاف اندک برای داده‌های لرزه‌ای البرز- آذربایجان، دقت روش جنگل تصادفی(Random Forest)  ، بالاتر حاصل شده است. مقادیر دقت حاصل از بکارگیری روش‌های منتخب در این پژوهش حاکی از آن است روش بهینه در تکنیک یادگیری ماشینی به تنوع داده‌ها و تعداد آنها بستگی دارد. در مورد داده‌های مخاطرات طبیعی، به ویژه مخاطرات ژئوفیزیکی، تفاوت در سطح موفقیت روش‌های یادگیری ماشینی تابعی از ویژگی‌های تکتونیکی و زمین‌شناسی محیط است. بکارگیری تکنیک‌های یادگیری ماشینی در جهت آمادگی و کاهش پیامدهای محیطی و مدیریت بحران زلزله نوید بخش است.

کلیدواژه‌ها


عنوان مقاله [English]

Evaluation of Machine Learning Techniques: Artificial Neural Network, Random Forest, and Support Vector Machine in Prediction of Alborz-Azerbaijan Earthquakes

نویسنده [English]

  • Salma Ommi
Department of Environmental Planning and Design, Environmental Science Research Institute, Shahid Beheshti University, Tehran, Iran
چکیده [English]

Introduction: One of the most destructive environmental hazards is earthquakes. Therefore, predicting this hazard to reduce its consequences and improve crisis management is one of the most important goals for researchers. By using seismicity indices and applying machine learning techniques, researchers can reveal seismic behavior patterns in a region. These methods have proven especially effective at modeling the nonlinear behavior of seismic data and have thus become important tools for understanding natural phenomena.
 
Materials and methods: In the present study, a catalog of earthquakes from the Alborz-Azerbaijan seismotectonic province covering the period from January 1, 1995, to January 23, 2024, has been compiled. Earthquake magnitudes have been converted to torque magnitudes to homogenize the catalog. Subsequently, based on the temporal variations in the completeness magnitude, the threshold magnitude for the study in the Alborz-Azerbaijan seismotectonic province has been determined to ensure the necessary accuracy for analysis. Three machine learning methods—Artificial Neural Network, Random Forest, and Support Vector Machine—were selected to predict the time and magnitude of earthquakes. Recognizing that some machine learning methods require feature definition, nine representative indices of seismic behavior were estimated for the Alborz-Azerbaijan earthquake catalog to serve as input for the chosen methods. Following the implementation of these techniques, the estimation error rate was calculated and reported using four types of error metrics: F1 Score, Recall, Precision, and Accuracy.

Results and discussion: Machine learning in this study was conducted using 245 vectors formed by 9 indicators. These indices are stored in corresponding two-dimensional arrays, with each column representing a specific set of indices. Each data vector is associated with a binary label of 1 or 0; the label "1" indicates the occurrence of at least one earthquake with a magnitude equal to or greater than the moment magnitude threshold of 5.5, while the label "0" indicates the absence of seismic activity for earthquakes with magnitudes less than 5.5. In this research, 80% of the data vectors were used for model training, and 20% were used for testing. The findings, regarding the estimated true and false alarm error values for each of the machine learning techniques applied to the seismic data of Alborz-Azerbaijan, demonstrate the success of all three techniques in predicting events recorded in the seismic catalog of Alborz-Azerbaijan. Generally, an accuracy exceeding 95% was achieved for all three methods.

Conclusion: The findings indicate the success of these techniques in estimating the cycle of stress accumulation and release associated with seismic activity in the Alborz-Azerbaijan geotechnical province. The accuracy of all three methods shows only a small difference, reflecting the high performance of machine learning techniques. For the seismic data of Alborz-Azerbaijan, the Random Forest method exhibits slightly higher accuracy. The accuracy values obtained from the selected methods in this research suggest that the optimal machine learning method depends on the diversity and quantity of the data. In the context of natural hazard data, particularly geophysical hazards, the differences in success levels among machine learning methods are influenced by the tectonic and geological characteristics of the environment. Furthermore, the results of this study demonstrate that utilizing machine learning techniques for preparedness and mitigation of environmental consequences, as well as for earthquake crisis management, is promising.

کلیدواژه‌ها [English]

  • Artificial Neural Network
  • Random Forest
  • Support Vector Machine
  • Alborz-Azerbaijan seismotectonic province