تحلیل اثر داده‌های نامتعادل بر دقت و خودهمبستگی مکانی مدل‌سازی کربن آلی خاک
کد مقاله : 1252-ISSC19
نویسندگان
اعظم جعفری1، فریدون سرمدیان *1، زهرا رسائی2
1عضو هیئت علمی
2پژوهشگر پسادکتری
چکیده مقاله
توزیع نامتعادل داده‌ها یکی از چالش‌های مهم در مدل‌سازی مکانی متغیرهای خاکی، به‌ویژه کربن آلی خاک (SOC)، محسوب می‌شود. این پژوهش با هدف بررسی تأثیر متعادل‌سازی داده‌ها بر دقت مدل و ساختار مکانی باقیمانده‌ها، در بخشی از دشت قزوین با مساحت حدود 60000 هکتار انجام شد. در این راستا، ابتدا میزانSOC در280 نمونه سطحی (عمق ۰–۳۰ سانتی‌متر) اندازه‌گیری و مجموعه‌ای از متغیرهای محیطی مانند پارامترهای توپوگرافی، شاخص‌های پوشش گیاهی، رطوبت و اقلیم جمع‌آوری شد. پس از انتخاب متغیرهای مهم با استفاده از روشRFE، مدل جنگل تصادفی (RF) در دو سناریوی استفاده از داده‌های نامتعادل و متعادل‌شده با روش SMOTE اجرا گردید. عملکرد مدل‌ها با شاخص‌های RMSE،R² و Moran’s I مورد ارزیابی قرار گرفت. نتایج نشان داد که مدل RF با داده‌های متعادل‌شده (RMSE=0.3، R²=0.60) در مقایسه با داده‌های نامتعادل (RMSE=0.4، R²=0.40) عملکرد بهتری از خود نشان داد. همچنین شاخص خودهمبستگی مکانی موران برای باقیمانده‌ها در حالت متعادل‌شده از 30/0 به 03/0 کاهش یافت. بررسی کورلوگرام نیز حاکی از کاهش ساختار مکانی در خطاهای مدل پس از متعادل‌سازی داده‌ها بود. این یافته‌ها نشان می‌دهد که متعادل‌سازی آماری داده‌ها، علاوه بر بهبود دقت عددی مدل، به کاهش خودهمبستگی مکانی در خطاها و افزایش کیفیت فضایی مدل منجر می‌شود.
کلیدواژه ها
شاخص موران، SMOTE، نقشه‌برداری رقومی خاک
وضعیت: پذیرفته شده مشروط برای ارائه شفاهی