تحلیل اثر دادههای نامتعادل بر دقت و خودهمبستگی مکانی مدلسازی کربن آلی خاک |
کد مقاله : 1252-ISSC19 |
نویسندگان |
اعظم جعفری1، فریدون سرمدیان *1، زهرا رسائی2 1عضو هیئت علمی 2پژوهشگر پسادکتری |
چکیده مقاله |
توزیع نامتعادل دادهها یکی از چالشهای مهم در مدلسازی مکانی متغیرهای خاکی، بهویژه کربن آلی خاک (SOC)، محسوب میشود. این پژوهش با هدف بررسی تأثیر متعادلسازی دادهها بر دقت مدل و ساختار مکانی باقیماندهها، در بخشی از دشت قزوین با مساحت حدود 60000 هکتار انجام شد. در این راستا، ابتدا میزانSOC در280 نمونه سطحی (عمق ۰–۳۰ سانتیمتر) اندازهگیری و مجموعهای از متغیرهای محیطی مانند پارامترهای توپوگرافی، شاخصهای پوشش گیاهی، رطوبت و اقلیم جمعآوری شد. پس از انتخاب متغیرهای مهم با استفاده از روشRFE، مدل جنگل تصادفی (RF) در دو سناریوی استفاده از دادههای نامتعادل و متعادلشده با روش SMOTE اجرا گردید. عملکرد مدلها با شاخصهای RMSE،R² و Moran’s I مورد ارزیابی قرار گرفت. نتایج نشان داد که مدل RF با دادههای متعادلشده (RMSE=0.3، R²=0.60) در مقایسه با دادههای نامتعادل (RMSE=0.4، R²=0.40) عملکرد بهتری از خود نشان داد. همچنین شاخص خودهمبستگی مکانی موران برای باقیماندهها در حالت متعادلشده از 30/0 به 03/0 کاهش یافت. بررسی کورلوگرام نیز حاکی از کاهش ساختار مکانی در خطاهای مدل پس از متعادلسازی دادهها بود. این یافتهها نشان میدهد که متعادلسازی آماری دادهها، علاوه بر بهبود دقت عددی مدل، به کاهش خودهمبستگی مکانی در خطاها و افزایش کیفیت فضایی مدل منجر میشود. |
کلیدواژه ها |
شاخص موران، SMOTE، نقشهبرداری رقومی خاک |
وضعیت: پذیرفته شده مشروط برای ارائه شفاهی |