افزایش دقت طبقه بندی کلاس های نامتوازن خاک با استفاده از رویکرد یادگیری حساس به هزینه
کد مقاله : 1514-ISSC19
نویسندگان
مستانه رحیمی *1، محمدامیر دلاور2، محمد جمشیدی3
1موسسه تحقیقات خاک و آب کشور
2استاد گروه علوم خاک دانشکده کشاورزی، دانشگاه زنجان
3استادیار موسسه تحقیقات خاک و آب
چکیده مقاله
مدیریت بهینه خاک و توسعه پایدار کشاورزی نیازمند دسترسی به اطلاعات دقیق درباره وضعیت و طبقه‌بندی خاک است و پیش‌بینی صحیح کلاس‌های خاک و موقعیت مکانی آن‌ها نقش مهمی در این زمینه دارد. استفاده از روش‌های نوین یادگیری ماشین، به‌ویژه یادگیری حساس به هزینه، می‌تواند با در نظر گرفتن نامتوازنی توزیع کلاس‌ها، دقت و کارایی پیش‌بینی را بهبود بخشد. در این پژوهش، در اراضی جنوب غربی استان زنجان، 148 خاک‌رخ با روش شبکه‌بندی منظم و فاصله متوسط 500 متر حفر و تا سطح فامیل طبقه‌بندی شدند. متغیرهای محیطی منتخب شامل داده‌های ژئومورفولوژی، زمین‌شناسی، مدل رقومی ارتفاع و شاخص‌های استخراج‌شده از تصاویر ماهواره‌ای لندست 8 بودند. مدل‌سازی رابطه خاک و زمین‌نما با الگوریتم جنگل تصادفی و رویکرد یادگیری حساس به هزینه در در محیط نرم‌افزار "Rstudio" انجام گرفت.
نتایج نشان داد که صحت کلی و ضریب کاپا پیش از متعادل‌سازی داده‌ها به‌ترتیب 65 درصد و 0.32 و پس از متعادل سازی داده‌ها با رویکرد یادگیری حساس به هزینه به‌ترتیب 86 درصد و 0.77 به دست آمد. مقایسه شاخص‌های صحت کاربر و صحت تولید کننده نشان داد که درحالی‌که جنگل تصادفی در حالت داده‌های نامتعادل در تشخیص دو کلاس اقلیت جیپسیک هاپلوزرپتز و لیتیک زراورتنتز ناکام بود، متعادل سازی داده با رویکرد حساس به هزینه توانست با کاهش خطا، پیش‌بینی دقیقی از این کلاس های اقلیت ارائه دهد.
کلیدواژه ها
جنگل تصادفی، ضریب کاپا، متعادل سازی داده، نقشه برداری رقومی خاک
وضعیت: پذیرفته شده مشروط برای ارائه به صورت پوستر