ارائه روش تلفیقی کاهش نویز - داده کاوی برای تخمین ماده آلی خاک با طیف سنجی VNIR

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استادیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا و علوم محیطی، دانشگاه حکیم سبزواری، سبزوار، ایران

2 دانشجوی دکتری سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، ایران

3 دانشیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران، تهران، ایران

4 دانشیار گروه سنجش از دور و سیستم اطلاعات جغرافیایی، دانشکده جغرافیا، دانشگاه تهران ، تهران، ایران

5 استاد گروه خاکشناسی، دانشکده کشاورزی، دانشگاه تربیت مدرس، تهران، ایران

چکیده

کسب اطلاع از خصوصیات خاک و به طور ویژه، برآورد میزان مواد آلی خاک، در کشاورزی دارای اهمیت فراوانی است. در سه دهه اخیر طیف سنجی به عنوان ابزاری غیر مخرب در برآورد ماده آلی خاک مورد استفاده قرار گرفته است. با اینحال، روش‌های استفاده شده جهت پیش پردازش و مدلسازی ویژگی‌های خاک با داده‌های طیفی به دقت قابل قبولی نرسیده است. هدف این تحقیق، توسعه روش ابتکاری تلفیقی داده کاوی برای برقراری ارتباط ناپارامتریک بین داده‌های طیف‌سنجی و آزمایشگاهی مواد آلی خاک می‌باشد. 42 نمونه خاک از مناطق کشاورزی جنوب غربی استان تهران برداشت و ویژگی‌های فیزیکی و شیمایی آنها در آزمایشگاه اندازه گیری شد. بازتاب طیفی محدوده ۳۵۰-۲۵۰۰ نانومتر نمونه‌های خاک در شرایط هواخشک با استفاده از طیف سنج FieldSpec 3 در اتاقک تاریک اندازه گیری شد. از تبدیل موجک گسسته با ۵ سطح برای حذف نویز طیف اصلی، مشتق اول و دوم بازتاب و جذب طیفی استفاده شد. داده‌های پرت با استفاده از روش تحلیل مولفه‌های اصلی و آزمون هادلینگز شناسایی و حذف شدند. در نهایت، روش‌های رگرسیون کمترین مربعات جزیی و یادگیری ماشین درخت رگرسیون ارتقا یافته با استفاده از باندهای مستقل (روش‌های توسعه یافته تبدیل موجک-تحلیل مولفه اصلی- رگرسیون کمترین مربعات جزیی و تبدیل موجک-تحلیل مولفه اصلی- یادگیری ماشین درخت رگرسیون ارتقا یافته) به منظور تولید تابع پیوسته ماده آلی خاک اجرا گردید. بهترین دقت برای روش‌های توسعه داده شده برای روش یادگیری ماشین درخت رگرسیون ارتقا یافته و ورودی مشتق دوم بازتاب طیفی در مقایسه با سایر شرایط، بهترین نتایج (RMSE= 0.58, R2 =0.94) را ارائه داد. نتایج این تحقیق موید این مطلب است که در مناطق ناهمگن کشاورزی - شهری، می‌توان از پتانسیل مدل‌های یادگیری ماشین درخت رگرسیون ارتقا یافته برای تخمین مواد آلی خاک استفاده نمود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Integrated noise reduction-data mining method for soil organic matter prediction by VNIR spectrometry

نویسندگان [English]

  • Elahe Akbari 1
  • Saham Mirzaei 2
  • Ara Toomanian 3
  • Ali Darvishi bolorani 4
  • Hosseinali Bahrami 5
1 Assistant Professor, Department of Remote sensing and Geographic Information System, Faculty of Geography and Environmental Sciences, Hakim Sabzevari University, Sabzevar, Iran
2 PhD. Student of Remote Sensing and Geographic Information System, Faculty of Geography, University of Tehran, Iran
3 Associate Professor, Department of Remote Sensing and Geographic Information System, Faculty of Geography, University of Tehran, Iran
4 Associate Professor, Department of Remote Sensing and Geographic Information System, Faculty of Geography, University of Tehran, Iran
5 Professor, Department of Soil Science, Faculty of Agriculture, Tarbiat Modares University, Iran
چکیده [English]

Estimating soil properties like soil organic matter has a remarkable role in agriculture activities. In the last three decades, spectroscopy as a non-destructive tool in estimation of soil organic matter has been used. However, the methods used to preprocess and model soil properties with spectral data have not reached acceptable accuracy. In the present research, we have aimed to develop a kind of heuristic data mining procedure to investigate a non-parametric relationship between the spectral signature of soil samples and their measured SOM. 42 soil samples were taken from agricultural areas of southwestern Tehran province and their physical and chemical properties were measured in the laboratory. The spectral reflectance in the range of 350-2500 nm of soil samples in dry air conditions was measured using a FieldSpec 3 spectrometer in a dark room. Discrete wavelet transform (DWT) with 5 levels was used to remove the noise of the main spectrum, the first and second derivatives of reflection and spectral absorption. Outliers are removed via the Principal Component Analysis (PCA) with considering Hotelling's T2. Finally, Partial Least Squares Regression (PLSR) and Boosted Regression Tree (BRT) methods (two developed methods: Wavelet - PCA- PLSR and Wavelet - PCA- BRT) were carried out using independent bands for producing continuous functions of SOM. Experimental results show that the proposed Wavelet-PCA-BRT model with input of second derivation of reflectance is very robust against the proposed Wavelet-PCA-PLSR model, where, RMSE, and R2 in the data of the second derivative of the original spectrum are equal to 0.58, and 0.94, respectively. The results of this study confirmed that in heterogeneous agricultural-urban areas, the potential of improved regression tree machine learning models can be used to estimate soil organic matter.

کلیدواژه‌ها [English]

  • Soil spectroscopy
  • Soil organic matter
  • PLSR
  • BRT. southwest of Tehran

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 13 شهریور 1400
  • تاریخ دریافت: 01 شهریور 1400
  • تاریخ بازنگری: 12 شهریور 1400
  • تاریخ پذیرش: 13 شهریور 1400