ارزیابی عملکرد تبدیل آنالیز مؤلفه های اصلی، مستقل و کسر حداقل نویز در بهبود صحت استخراج اطلاعات از داده های ماهوارۀ سنتینل-2
محورهای موضوعی : توسعه سیستم های مکانیصیاد اصغری سراسکانرود 1 , حسن حسنی مقدم 2 , حسین فکرت 3
1 - دانشیار گروه جغرافیای طبیعی، دانشکده ادبیات و علوم انسانی، دانشگاه محقق اردبیلی، اردبیل، ایران
2 - کارشناسی ارشد سنجشازدور و سیستم اطلاعات جغرافیایی، دانشگاه خوارزمی، تهران، ایران
3 - دانشجوی کارشناسی ارشد سنجشازدور و GIS، دانشکده ادبیات و علوم انسانی، دانشگاه محقق اردبیلی، اردبیل، ایران
کلید واژه: سنتینل-2, رضوانشهر, ضریب شفیلد, حداکثر احتمال, تبدیلات,
چکیده مقاله :
پیشینه و هدف استفاده از انواع تبدیلات جهت بهبود صحت استخراج اطلاعات از تصاویر ماهواره ای به طور فزاینده ای رو به افزایش است. در این بین انتخاب تبدیل بهینه اهمیت بالایی داشته و نتایج خروجی را تحت تأثیر قرار خواهد داد. با توجه به ماهیت همبسته تصاویر سنجش از دور، استفاده از انواع تبدیلات جهت بهبود صحت استخراج اطلاعات از این تصاویر امری ضروری است. با توجه به مطالعات انجام شده هدف این تحقیق بررسی روش های مختلف تبدیلات تصویر در بهبود روند طبقه بندی تصاویر ماهواره ای و افزایش میزان صحت نقشه های کاربری اراضی است. با در نظر گرفتن این نکته که منطقه مورد مطالعه و بهصورت کلی مناطق شمالی کشور با شرایط خاص درهم تنیدگی کاربری ها روبه رو هستند، لذا به کارگیری انواع روش های تبدیلات و همچنین روش ترکیبی پیشنهادی در این پژوهش باعث افزایش صحت و دقت اطلاعات خروجی و در نهایت امکان تفکیک و بررسی های دقیق تر کاربری ها و شناسایی عوامل تغییر آن ها را جهت برنامه ریزی های آینده فراهم می کند. در این پژوهش به منظور ارزیابی عملکرد تبدیلات آنالیز مؤلفه های اصلی، آنالیز مؤلفه های مستقل و کسر حداقل نویز از تصویر ماهواره سنتینل-2 شهرستان رضوانشهر استفاده گردید.مواد و روش هادر این پژوهش به منظور ارزیابی عملکرد روش های آنالیز مؤلفه های اصلی، آنالیز مؤلفه های مستقل و روش کسر حداقل نویز از تصاویر ماهواره سنتینل-2 شهرستان رضوانشهر استفاده گردید. از الگوریتم گرام اشمیت (Gram-Schmit) بهمنظور ادغام این داده ها با یکدیگر و رسیدن به قدرت تفکیک 10 متر استفاده شد. بعد از اعمال پیش پردازش های لازم و ادغام تصاویر با یکدیگر هر سه تبدیل روی تصویر اعمال و همچنین ترکیبی از مؤلفه های این سه روش تولید گردید. در ادامه نتایج حاصل از تبدیلات با استفاده از الگوریتم حداکثر احتمال در 8 کلاس کاربری طبقه بندی گردید. با استفاده از ضریب شفیلد و محاسبات آماری بین مؤلفه های به دست آمده، ترکیب مؤلفه های اول آنالیز مؤلفه های اصلی، اول کسر حداقل نویز و مؤلفه دوم آنالیز مؤلفههای مستقل، بهعنوان ترکیب بهینه انتخاب گردید. شناخت کلی از منطقه و مطابق آن تفسیر بصری خروجی ها و همچنین برداشت 120 نقطۀ زمینی توسط GPS مبنای ارزیابی صحت نقشه های خروجی بوده است.نتایج و بحث بعد از اعمال پیش پردازش های مورد نیاز و ادغام تصاویر با یکدیگر، هرکدام از این الگوریتم ها بر روی تصویر اعمال گردید و خروجی هر کدام با استفاده از الگوریتم حداکثر احتمال و در 8 کلاس کاربری طبقه بندی گردیدند. نتایج نقشه های خروجی نشان داد که تبدیل آنالیز مؤلفه های اصلی با توجه به اینکه برای متغیرها توزیع گوسی در نظر میگیرد و سعی بر غیر همبسته کردن مؤلفه های استخراج شده دارد، در نمونه هایی با توزیع غیر گوسی دارای ضعف بوده و عملکرد پایینی از خود نشان می دهد. الگوریتم کسر حداقل نویز مشابه الگوریتم آنالیز مؤلفه های اصلی عمل می کند با این تفاوت که نویزها را بهتر مؤلفه بندی می کند. این الگوریتم در جداسازی کلاس ها خطای کمتری داشته و همین عامل باعث عملکرد بهتر و دقت بالاتر نسبت به دو تبدیل دیگر شده است. در الگوریتم آنالیز مؤلفه های مستقل باندهای همبسته تصویر منطقه مورد مطالعه به مؤلفههای مستقل تبدیلشده و اطلاعات جدیدی از منطقه استخراج کرده است. تفسیر بصری دقت بالای نتیجه طبقه بندی را نشان می دهد و برای کمی کردن دقت تصویر طبقه بندی شده از ماتریس خطا (کانفیوژن) استفاده شده است. نتایج حاصل از ارزیابی دقت کلی و ضریب کاپا نشان داد که طبقه بندی تصویر اصلی بدون اعمال تبدیلات و با همان نمونه های تعلیمی خروجی با دقت کلی 76 درصد و ضریب کاپای 0.78 بیشترین خطا را داشته است. همچنین نتایج سایر خروجی ها به ترتیب برای طبقه بندی حاصل از تبدیل آنالیز مؤلفه های اصلی، دقت کلی 80 درصد و ضریب کاپا 0.83، برای طبقه بندی حاصل از تبدیل کسر حداقل نویز، دقت کلی 85 درصد و ضریب کاپا 0.88 و برای طبقه بندی حاصل از تبدیل آنالیز مؤلفههای مستقل، دقت کلی برابر با 77 درصد و ضریب کاپا معادل 0.80 به دست آمد. بعد از انتخاب ترکیب بهینه از مؤلفه های روش های آنالیز مؤلفه های اصلی، آنالیز مؤلفه های مستقل و روش کسر حداقل نویز و انتخاب مؤلفه های اول الگوریتم های آنالیز مؤلفه های اصلی و کسر حداقل نویز و مؤلفه دوم آنالیز مؤلفه های مستقل، دقت کلی به 92 درصد و ضریب کاپا 0.94 افزایشیافت.نتیجه گیری در این تحقیق بعد از ارزیابی عملکرد تبدیل آنالیز مؤلفه های اصلی، آنالیز مؤلفه های مستقل و روش کسر حداقل نویز، یک روش ترکیب بهینه از مؤلفه های این تبدیلات پیشنهاد گردید. نتایج تحقیق نشان داد طبقه بندی تصویر اصلی بدون اعمال تبدیلات و با همان نمونه های تعلیمی دقت کلی و ضریب کاپای پایینی داشته است. بنابراین لزوم اعمال تبدیلات جهت کاهش همبستگی باندها و مجزا سازی اجزای تصاویر احساس می شود. همان طور که نتایج تحقیق نشان داد طبقه بندی تصویر اصلی بدون اعمال تبدیلات و با همان نمونه های تعلیمی دقت کلی و ضریب کاپای پایینی داشته است. نتایج تحقیق بیانگر عملکرد نزدیک این روش ها به یکدیگر است که نشان از وجود هر دو نوع توزیع گوسی و غیر گوسی متغیرها دارد. تبدیل کسر حداقل نویز، میزان نویز دادهها را به حداقل رسانده و در خروجی نتایج بهتری از دو تبدیل آنالیز مؤلفه های مستقل و آنالیز مؤلفه های اصلی داشته است. با توجه به اینکه این تبدیلات به تنهایی قادر به استخراج تمامی اجزای تصویر نیستند، لذا ترکیبی از مؤلفه های این تبدیلات بر اساس ضریب شفیلد جهت مفروض بودن توزیع گوسی و غیر گوسی متغیرها با حداقل نویز ممکن انتخاب گردید.
Background and ObjectiveProblem The use of various transformations to improve the accuracy of data extraction from satellite images is increasing sharply. In the meantime, the choice of optimal conversion is very important and will affect the output results. Due to the correlated nature of remote sensing images, the use of various transformations to improve the accuracy of information extraction from these images is essential. According to the studies, the purpose of this study is to investigate different methods of image conversion in improving the process of classification of satellite images and increasing the accuracy of land use maps. Considering that the study area and in general the northern regions of Iran are facing special conditions of entanglement of land uses, so the use of various conversion methods as well as the combined method proposed in this study increases the accuracy and the accuracy of the output information and finally the possibility of more detailed separation and review of uses and identification of factors changing them for future planning.Materials and Methods In this study, in order to evaluate the performance of principal component analysis methods, independent component analysis, and minimum noise fraction method, Sentinel-2 satellite images of Rezvanshahr city were used. Gram-Schmit algorithm was used to integrate this data with each other and achieve a resolution of 10 meters. After applying the necessary pre-processing and merging the images together, all three transformations were applied to the image, as well as a combination of the components of these three methods. Then, the results of the transformations were classified into 8 user classes using the maximum likelihood algorithm. Using Sheffield coefficient and statistical calculations between the obtained components, the combination of the first components of principal component analysis, the first component of minimum noise fraction, and the second component of independent component analysis were selected as the optimal combination. General knowledge of the area and accordingly the visual interpretation of the outputs, as well as the perception of 120 ground points by GPS, has been the basis for assessing the accuracy of the output maps.Results and Discussion After applying the required preprocessors, each of these algorithms was applied to the image, and the output of each was classified into 8 user classes using the Maximum Likelihood algorithm. The results of output maps showed that the conversion of principal component analysis, considering that it considers Gaussian distribution for variables and tries to decompose the extracted components, is weak in samples with non-Gaussian distribution and shows low performance. The minimum noise fraction algorithm works similarly to the principal component analysis algorithm, except that it classifies the noise better. This algorithm has less error in separating classes and this factor has resulted in better performance and higher accuracy than the other two conversions. In the independent component analysis algorithm, the image correlated bands of the study area have been converted to independent components and new information has been extracted from the area. The visual interpretation shows the high accuracy of the classification result and an error matrix (confusion) is used to quantify the accuracy of the classified image. The results of the evaluation of overall accuracy and kappa coefficient showed that the classification of the original image without applying transformations and with the same training samples of output with an overall accuracy of 76% and kappa coefficient of 0.78 had the highest error. Also, the results of other outputs for classification resulting from principal component analysis conversion are 80% overall accuracy and kappa coefficient of 0.83, respectively, for classification resulting from minimum noise fraction conversion, total accuracy of 85% and kappa coefficient of 0.88 and for the classification obtained from the analysis of independent component analysis, the overall accuracy was 77% and the kappa coefficient was 0.80. After selecting the optimal combination of components of principal components analysis methods, independent component analysis and minimum noise fraction method and selecting the first components of principal component analysis algorithms and minimum noise fraction and the second component of total component analysis to 92% independent coefficient and Kappa increased 0.94.Conclusion In this study, after evaluating the conversion performance of principal component analysis, independent component analysis, and minimum noise fraction method, an optimal combination of components of these transformations was proposed. As the results of the research showed, the classification of the original image without conversions and with the same training samples had low overall accuracy and kappa coefficient. The results show the close performance of these transformations to each other, which indicates the existence of both Gaussian and non-Gaussian distributions of variables. MNF conversion has minimized the amount of data noise and results in better output than ICA and PCA conversion. Since these transformations alone are not able to extract all the components of the image, so a combination of the components of these transformations based on the Sheffield coefficient was chosen to assume the Gaussian and non-Gaussian distributions of the variables with the least possible noise.
Al-Ahmadi F, Al-Hames A. 2009. Comparison of four classification methods to extract land use and land cover from raw satellite images for some remote arid areas, Kingdom of Saudi Arabia. Earth Sciences, 20(1): 167-119.
Alikhah-Asl M, Elham F, Mohammad N. 2014. Evaluation of different enhancement remote sensing techniques. International Journal of Agriculture Innovations and Research, 3(1): 33-37.
Anderson JR. 1971. Land-use classification schemes. Photogrammetric Engineering, 37(4): 379-387. https://trid.trb.org/view/93641.
Arslan O, Akyürek Ö, Kaya Ş. 2017. A comparative analysis of classification methods for hyperspectral images generated with conventional dimension reduction methods. Turkish Journal of Electrical Engineering & Computer Sciences, 25(1): 58-72. doi:https://doi.org/10.3906/elk-1503-167.
Barzegari Dehaj V, Zare M, Mokhtari MH, Ekhtesasi MR. 2018. Evaluation of different satellite image enhancement techniques in separating of geological units. Journal of RS and GIS for Natural Resources, 9(1): 1-23. http://girs.iaubushehr.ac.ir/article_540405_en.html. (In Persian).
Bellvert J, Jofre-Ĉekalović C, Pelechá A, Mata M, Nieto H. 2020. Feasibility of using the two-source energy balance model (TSEB) with Sentinel-2 and Sentinel-3 images to analyze the spatio-temporal variability of vine water status in a vineyard. Remote Sensing, 12(14): 2299. doi:https://doi.org/10.3390/rs12142299.
Congalton RG, Green K. 2019. Assessing the accuracy of remotely sensed data: principles and practices. CRC press. 139 p.
Dabiri Z, Lang S. 2018. Comparison of independent component analysis, principal component analysis, and minimum noise fraction transformation for tree species classification using APEX hyperspectral imagery. ISPRS International Journal of Geo-Information, 7(12): 488. doi:https://doi.org/10.3390/ijgi7120488.
ESA. 2017. (Standard Document), SENTINEL-2 User Handbook, 2.
ESA. 2018. SNAP-Sen2Cor, Available online: http://step.esa.int/main/third-party-plugins-2/sen2cor.
Estornell J, Martí-Gavilá JM, Sebastiá MT, Mengual J. 2013. Principal component analysis applied to remote sensing. Modelling in Science Education and Learning, 6: 83-89. doi:https://doi.org/10.4995/msel.2013.1905.
Green AA, Berman M, Switzer P, Craig MD. 1988. A transformation for ordering multispectral data in terms of image quality with implications for noise removal. IEEE Transactions on geoscience and remote sensing, 26(1): 65-74. doi:https://doi.org/10.1109/36.3001.
Guan H, Liu H, Meng X, Luo C, Bao Y, Ma Y, Yu Z, Zhang X. 2020. A quantitative monitoring method for determining Maize lodging in different growth stages. Remote Sensing, 12(19): 3149. doi:https://doi.org/10.3390/rs12193149.
Hyvärinen A, Oja E. 1997. A fast fixed-point algorithm for independent component analysis. Neural computation, 9(7): 1483-1492. doi:https://doi.org/10.1162/neco.1997.9.7.1483.
Ibarrola-Ulzurrun E, Marcello J, Gonzalo-Martin C. 2017. Assessment of component selection strategies in hyperspectral imagery. Entropy, 19(12): 666. doi:https://doi.org/10.3390/e19120666.
Javan F, Hasani Moghaddam H. 2017. Deforestation detection of Hyrcania forest using satellite imagery and Support Vector Machine (Case study: Rezvanshahr county). Forest Strategical Approchment Journal, 2(5): 1-13. https://www.magiran.com/paper/1706792. (In Persian).
Li X, Chen W, Cheng X, Liao Y, Chen G. 2017. Comparison and integration of feature reduction methods for land cover classification with RapidEye imagery. Multimedia Tools and Applications, 76(21): 23041-23057. doi:https://doi.org/10.1007/s11042-016-4311-4.
Luo G, Chen G, Tian L, Qin K, Qian S-E. 2016. Minimum noise fraction versus principal component analysis as a preprocessing step for hyperspectral imagery denoising. Canadian Journal of Remote Sensing, 42(2): 106-116. doi:https://doi.org/10.1080/07038992.2016.1160772.
Manly BF, Alberto JAN. 2016. Multivariate statistical methods: a primer. Chapman and Hall/CRC. 269 p. https://doi.org/10.1201/9781315382135.
Matkan AA, Nohegar A, Mirbagheri B, Torkchin N. 2014. Assessment relations of land use in heat islands using time series ASTER sensor data (Case study: Bandar Abbas city). Journal of RS and GIS for Natural Resources, 5(4): 1-14. http://girs.iaubushehr.ac.ir/m/article_516652.html?lang=en. (In Persian).
Nascimento JM, Dias JM. 2005. Vertex component analysis: A fast algorithm to unmix hyperspectral data. IEEE transactions on Geoscience and Remote Sensing, 43(4): 898-910. doi:https://doi.org/10.1109/TGRS.2005.844293.
Pohl C, Van Genderen J. 2016. Remote sensing image fusion: A practical guide. Crc Press. 288 p. https://doi.org/10.1201/9781315370101.
Pu R. 2017. Hyperspectral remote sensing: fundamentals and practices. CRC Press. 575 p.
Richards JA, Richards J. 2013. Remote sensing digital image analysis. Springer, Edition Number 5, XIX, 494 p. https://doi.org/10.1007/978-3-642-30062-2.
Sheffield C. 1985. Selecting Band Combinations from Multi Spectral Data. Photogrammetric Engineering and Remote Sensing, 58(6): 681-687. https://ci.nii.ac.jp/naid/80002491091.
Strîmbu VF, Strîmbu BM. 2015. A graph-based segmentation algorithm for tree crown extraction using airborne LiDAR data. ISPRS Journal of Photogrammetry and Remote Sensing, 104: 30-43. doi:https://doi.org/10.1016/j.isprsjprs.2015.01.018.
Vidhyavathi R. 2017. Principal component analysis (PCA) in medical image processing using digital imaging and communications in medicine (DICOM) medical images. International Journal of Pharma and Biol Sciences, 8(2): 598-606. doi:http://dx.doi.org/10.22376/ijpbs.2017.8.2.b.598-606.
Wang L, Zhang J, Liu P, Choo K-KR, Huang F. 2017. Spectral–spatial multi-feature-based deep learning for hyperspectral remote sensing image classification. Soft Computing, 21(1): 213-221. doi:https://doi.org/10.1007/s00500-016-2246-3.
Yang M-D, Huang K-H, Tsai H-P. 2020. Integrating MNF and HHT transformations into artificial neural networks for hyperspectral image classification. Remote Sensing, 12(14): 2327. doi:https://doi.org/10.3390/rs12142327.
Zhang X, Chen CH. 2002. New independent component analysis method using higher order statistics with application to remote sensing images. Optical Engineering, 41: 1717-1728. doi:https://doi.org/10.1117/1.1482722.
Zhang Y, Zhang J, Yang W. 2020. Quantifying Information Content in Multispectral Remote-Sensing Images Based on Image Transforms and Geostatistical Modelling. Remote Sensing, 12(5): 880. doi:https://doi.org/10.3390/rs12050880.
_||_Al-Ahmadi F, Al-Hames A. 2009. Comparison of four classification methods to extract land use and land cover from raw satellite images for some remote arid areas, Kingdom of Saudi Arabia. Earth Sciences, 20(1): 167-119.
Alikhah-Asl M, Elham F, Mohammad N. 2014. Evaluation of different enhancement remote sensing techniques. International Journal of Agriculture Innovations and Research, 3(1): 33-37.
Anderson JR. 1971. Land-use classification schemes. Photogrammetric Engineering, 37(4): 379-387. https://trid.trb.org/view/93641.
Arslan O, Akyürek Ö, Kaya Ş. 2017. A comparative analysis of classification methods for hyperspectral images generated with conventional dimension reduction methods. Turkish Journal of Electrical Engineering & Computer Sciences, 25(1): 58-72. doi:https://doi.org/10.3906/elk-1503-167.
Barzegari Dehaj V, Zare M, Mokhtari MH, Ekhtesasi MR. 2018. Evaluation of different satellite image enhancement techniques in separating of geological units. Journal of RS and GIS for Natural Resources, 9(1): 1-23. http://girs.iaubushehr.ac.ir/article_540405_en.html. (In Persian).
Bellvert J, Jofre-Ĉekalović C, Pelechá A, Mata M, Nieto H. 2020. Feasibility of using the two-source energy balance model (TSEB) with Sentinel-2 and Sentinel-3 images to analyze the spatio-temporal variability of vine water status in a vineyard. Remote Sensing, 12(14): 2299. doi:https://doi.org/10.3390/rs12142299.
Congalton RG, Green K. 2019. Assessing the accuracy of remotely sensed data: principles and practices. CRC press. 139 p.
Dabiri Z, Lang S. 2018. Comparison of independent component analysis, principal component analysis, and minimum noise fraction transformation for tree species classification using APEX hyperspectral imagery. ISPRS International Journal of Geo-Information, 7(12): 488. doi:https://doi.org/10.3390/ijgi7120488.
ESA. 2017. (Standard Document), SENTINEL-2 User Handbook, 2.
ESA. 2018. SNAP-Sen2Cor, Available online: http://step.esa.int/main/third-party-plugins-2/sen2cor.
Estornell J, Martí-Gavilá JM, Sebastiá MT, Mengual J. 2013. Principal component analysis applied to remote sensing. Modelling in Science Education and Learning, 6: 83-89. doi:https://doi.org/10.4995/msel.2013.1905.
Green AA, Berman M, Switzer P, Craig MD. 1988. A transformation for ordering multispectral data in terms of image quality with implications for noise removal. IEEE Transactions on geoscience and remote sensing, 26(1): 65-74. doi:https://doi.org/10.1109/36.3001.
Guan H, Liu H, Meng X, Luo C, Bao Y, Ma Y, Yu Z, Zhang X. 2020. A quantitative monitoring method for determining Maize lodging in different growth stages. Remote Sensing, 12(19): 3149. doi:https://doi.org/10.3390/rs12193149.
Hyvärinen A, Oja E. 1997. A fast fixed-point algorithm for independent component analysis. Neural computation, 9(7): 1483-1492. doi:https://doi.org/10.1162/neco.1997.9.7.1483.
Ibarrola-Ulzurrun E, Marcello J, Gonzalo-Martin C. 2017. Assessment of component selection strategies in hyperspectral imagery. Entropy, 19(12): 666. doi:https://doi.org/10.3390/e19120666.
Javan F, Hasani Moghaddam H. 2017. Deforestation detection of Hyrcania forest using satellite imagery and Support Vector Machine (Case study: Rezvanshahr county). Forest Strategical Approchment Journal, 2(5): 1-13. https://www.magiran.com/paper/1706792. (In Persian).
Li X, Chen W, Cheng X, Liao Y, Chen G. 2017. Comparison and integration of feature reduction methods for land cover classification with RapidEye imagery. Multimedia Tools and Applications, 76(21): 23041-23057. doi:https://doi.org/10.1007/s11042-016-4311-4.
Luo G, Chen G, Tian L, Qin K, Qian S-E. 2016. Minimum noise fraction versus principal component analysis as a preprocessing step for hyperspectral imagery denoising. Canadian Journal of Remote Sensing, 42(2): 106-116. doi:https://doi.org/10.1080/07038992.2016.1160772.
Manly BF, Alberto JAN. 2016. Multivariate statistical methods: a primer. Chapman and Hall/CRC. 269 p. https://doi.org/10.1201/9781315382135.
Matkan AA, Nohegar A, Mirbagheri B, Torkchin N. 2014. Assessment relations of land use in heat islands using time series ASTER sensor data (Case study: Bandar Abbas city). Journal of RS and GIS for Natural Resources, 5(4): 1-14. http://girs.iaubushehr.ac.ir/m/article_516652.html?lang=en. (In Persian).
Nascimento JM, Dias JM. 2005. Vertex component analysis: A fast algorithm to unmix hyperspectral data. IEEE transactions on Geoscience and Remote Sensing, 43(4): 898-910. doi:https://doi.org/10.1109/TGRS.2005.844293.
Pohl C, Van Genderen J. 2016. Remote sensing image fusion: A practical guide. Crc Press. 288 p. https://doi.org/10.1201/9781315370101.
Pu R. 2017. Hyperspectral remote sensing: fundamentals and practices. CRC Press. 575 p.
Richards JA, Richards J. 2013. Remote sensing digital image analysis. Springer, Edition Number 5, XIX, 494 p. https://doi.org/10.1007/978-3-642-30062-2.
Sheffield C. 1985. Selecting Band Combinations from Multi Spectral Data. Photogrammetric Engineering and Remote Sensing, 58(6): 681-687. https://ci.nii.ac.jp/naid/80002491091.
Strîmbu VF, Strîmbu BM. 2015. A graph-based segmentation algorithm for tree crown extraction using airborne LiDAR data. ISPRS Journal of Photogrammetry and Remote Sensing, 104: 30-43. doi:https://doi.org/10.1016/j.isprsjprs.2015.01.018.
Vidhyavathi R. 2017. Principal component analysis (PCA) in medical image processing using digital imaging and communications in medicine (DICOM) medical images. International Journal of Pharma and Biol Sciences, 8(2): 598-606. doi:http://dx.doi.org/10.22376/ijpbs.2017.8.2.b.598-606.
Wang L, Zhang J, Liu P, Choo K-KR, Huang F. 2017. Spectral–spatial multi-feature-based deep learning for hyperspectral remote sensing image classification. Soft Computing, 21(1): 213-221. doi:https://doi.org/10.1007/s00500-016-2246-3.
Yang M-D, Huang K-H, Tsai H-P. 2020. Integrating MNF and HHT transformations into artificial neural networks for hyperspectral image classification. Remote Sensing, 12(14): 2327. doi:https://doi.org/10.3390/rs12142327.
Zhang X, Chen CH. 2002. New independent component analysis method using higher order statistics with application to remote sensing images. Optical Engineering, 41: 1717-1728. doi:https://doi.org/10.1117/1.1482722.
Zhang Y, Zhang J, Yang W. 2020. Quantifying Information Content in Multispectral Remote-Sensing Images Based on Image Transforms and Geostatistical Modelling. Remote Sensing, 12(5): 880. doi:https://doi.org/10.3390/rs12050880.
ارزیابی عملکرد تبدیل آنالیز مؤلفههای اصلی، مستقل و کسر حداقل نویز
در بهبود صحت استخراج اطلاعات از دادههای ماهوارهی سنتینل-2
چکیده
با توجه به ماهیت همبسته تصاویر سنجش از دوری، استفاده از انواع تبدیلات جهت بهبود صحت استخراج اطلاعات از این تصاویر امری ضروری است. در این بین انتخاب تبدیل بهینه اهمیت بالایی داشته و نتایج خروجی را تحت تأثیر قرار خواهد داد. برای این منظور تصویری از ماهوارهی سنتینل-2 برای شهرستان رضوانشهر در تاریخ 30/06/2017 انتخاب و بعد از اعمال پیش پردازشهای لازم، باندهای تصویر با یکدیگر به روش گرام اشمیت ادغام گردیدند. تبدیل آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و کسر حداقل نویز بر روی تصاویر اعمال و خروجی هرکدام جهت ارزیابی با استفاده از الگوریتم حداکثر احتمال طبقهبندی گردید. در ادامه به منظور یافتن ترکیب بهینه از مجموع مؤلفههای این تبدیلات، با استفاده از ضریب شفیلد ترکیب مؤلفههای اول آنالیز مؤلفههای اصلی و کسر حداقل نویز و مؤلفه دوم آنالیز مؤلفههای مستقل انتخاب و طبقهبندی گردید. بهمنظور ارزیابی عملکرد هر روش از صحت کلی و ضریب کاپا استفاده گردید. نتایج تحقیق نشان داد که طبقهبندی تصویر بدون اعمال تبدیلات صحت کلی 76 درصد و ضریب کاپا 78/0 را داشته است، درحالیکه بعد از اعمال تبدیل آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و کسر حداقل نویز ضریب کاپا به ترتیب 83/0، 80/ 0 و 88/0 و صحت کلی 80/0، 77/0 و 85/0 بدست آمد. همچنین نتایج حاصل از طبقهبندی ترکیب مؤلفههای بهینه دارای صحت کلی 92 درصد و ضریب کاپا 94/0 بوده است که نشان از عملکرد مطلوب ترکیب بهینه در فرآیند طبقه بندی دارد.
واژههای کلیدی: رضوانشهر، سنتینل-2، ضریب شفیلد، تبدیلات، حداکثر احتمال.
مقدمه
سنجش از دور به عنوان یکی از مهمترین و عمدهترین منابع دادههای مکانی و موضوعی قلمداد میشود. این فناوری با توجه به وسعت مناطق مورد مطالعه، اطلاعات طیفهای متعدد و مشاهده تقریباً ثابت، میتواند یک جایگزین مناسب برای روشهای سنتی باشد (19). روشهای مختلفی جهت استخراج اطلاعات از تصاویر ماهوارهای وجود دارد، از جمله این روشها میتوان انواع تبدیلات جهت افزایش میزان صحت استخراج اطلاعات از تصاویر، طبقهبندی، ادغام تصاویر و بهبود قدرت تفکیک مکانی و طیفی تصاویر را نام برد (15). دادههای سنجش از دوری بخصوص تصاویر با وضوح بالا معمولاّ دارای حجم زیاد، اطلاعات فرآوان و در بعضی موارد اطلاعات اضافی هستند و این اطلاعات اضافی باعث افزایش زمان پردازش و کاهش دقت فرایند طبقهبندی میشود (27). از جمله روشهایی که تاثیر آن روی دقت طبفهبندی اثبات شده است، الگوریتمهای کاهش ابعاد داده است که با استفاده از آنها ابعاد ذاتی دادهها مشخص میشود (4). روشهای متعددی برای کاهش تعداد متغیرهای ورودی و افزایش حجم اطلاعات خروجی از تصاویر پیشنهاد شده است که از آن جمله میتوان به آنالیز مؤلفههای اصلی (6)، آنالیز مؤلفههای مستقل (31) و کسر حداقل نویز (29) اشاره کرد. روش آنالیز مؤلفههای اصلی با حذف اثر هم خطی، چارچوبی منطقی را برای مطالعه اثر متغیرهای مؤثر با همبستگی متقابل فراهم میآورد. هدف اصلی این آنالیز فشردهسازی اطلاعات موجود در متغیرهای اصلی است. آنالیز مؤلفههای اصلی تعداد متغیرها را به متغیرهای جدید غیر همبسته بهعنوان مؤلفههای اصلی دربرگیرنده واریانس کل مجموعه دادهها کاهش میدهد (18). روش آنالیز مؤلفههای مستقل يک روش گسترش يافته آناليز مولفههاي اصلي است که به منظور جداسازي منابع مستقل از ترکيب خطي آنها به کار میرود. ایده اصلی این روش این است که داده ها بصورت خطی توسط مجموعه از منابع جداگانه مستقل ترکیب شدهاند (30). اساس الگوریتم آنالیز مؤلفههای مستقل، استقلال میان منابع ترکیب شده و غیر گوسی بودن تابع توزیع احتمالی منابع مستقل هست (20). یکی دیگر از روشها که جهت بهبود استخراج اطلاعات از تصاویر ماهوارهای بهکاربرده میشود تبدیل کسر حداقل نویز است. این الگوریتم از دادهها یک تبدیل خطی ارائه میدهد به طوری که مقادیر نویز دادهها در تبدیل اولیه کمتر و رفتهرفته مقدار نویز افزایش مییابد. مهمترین ویژگی این الگوریتم برآورد دقیق ماتریس کواریانس است که یک گام اساسی در فرآیند کاهش ابعاد دادهها و بهبود فرآیند پردازش دادهها محسوب میشود (8). لذا این تبدیل به صورت گسترده در پردازشهای سنجش از دوری به عنوان یک روش کاهش ابعاد داده مورد استفاده قرار میگیرد. مطالعات متعددی هم راستا با موضوع این پژوهش صورت گرفته و با توجه شرایط منطقه، نوع داده و روشهای مورد استفاده، نتایج متفاوتی در پی داشته است. از جمله میتوان به تحقیقات ذیل اشاره کرد:
ویداواتی (26)، در تحقیقی به کاربرد آنالیز مؤلفههای اصلی در تصویر برداری دیجیتالی و ارتباطات پزشکی پرداخته است. در این تحقیق ابتدا به تشریح الگوریتم آنالیز مؤلفههای اصلی پرداخته و در ادامه نقش آن در پردازش تصاویر پزشکی و فشردهسازی تصویر بررسی شده است. نتایج تحقیق وی نشاندهنده کارآیی و قدرت بالای این الگوریتم در بهبود پردازش تصاویر پزشکی میباشد. لو و همکاران (17)، تحقیقی با عنوان مقایسه آنالیز مؤلفه اصلی و تبدیل کسر حداقل نویز به عنوان یک روش پیش پردازش جهت حذف نویز از تصاویر فراطیفی انجام دادهاند. در این تحقیق آنها به مقایسه این دو روش پرداخته و نقاط ضعف و قوت هر الگوریتم را مورد بررسی قرار دادهاند. نتایج کار آنها بیانگر برتری الگوریتم تبدیل کسر حداقل نویز در بهبود نسبت سیگنال به نویز در تصاویر فراطیفی بوده در حالی که روش آنالیز مؤلفه اصلی در حذف نویزهای با توزیع گوسی عملکرد بهتری داشته است. برزگری و همکاران (5) با استفاده از روش های مختلف بارزسازی تصاویر ماهوارهای اقدام به جداسازی واحدهای زمین شناسی از همدیگر کردند. نتایج پژوهش آنها نشان داد که روش کسر حداقل نویز نسبت به دو روش آنالیز مؤلفههای اصلی و ترکیب رنگ کاذب (FCC) دقت بیشتری در تفکیک واحدهای زمین شناسی داشته است. علیخاه اصل و همکاران (2)، به ارزیابی روشهای مختلف بهبود استخراج اطلاعات از دادههای سنجش از دوری پرداختهاند. آنها در این تحقیق روشهای آنالیز مؤلفه مستقل، تسلدکپ، شاخص نرمال شده تفاضل پوشش گیاهی و طبقهبندی نظارتشده را با یکدیگر مقایسه کردند. نتایج کار آنها نشان داد که استفاده از الگوریتم آنالیز مؤلفه مستقل موجب افزایش صحت نقشههای خروجی میشود. احمدی و هامس (1) به ارزیابی قابلیت الگوریتمهای طبقهبندی نظارت نشده و نظارت شده (حداكثر احتمال، حداقل فاصله از ميانگين و فاصله ماهالانويي) در تهیه نقشه کاربری اراضی پرداختهاند. نتايج پژوهش آنها نشان داد که روش حداكثر احتمال از بیشترین دقت نسبت به سایر روشها برخوردار بوده است.
با توجه به مطالعات انجام شده هدف این تحقیق بررسی روشهای مختلف تبدیلات تصویر در بهبود روند طبقهبندی تصاویر ماهوارهای و افزایش میزان صحت نقشههای کاربری اراضی میباشد. با در نظر گرفتن این نکته که منطقه مورد مطالعه و به صورت کلی مناطق شمالی کشور با شرایط خاص در هم تنیدگی کاربریها روبهرو هستند، لذا بهکارگیری انواع روشهای تبدیلات و همچنین روش ترکیبی پیشنهادی در این پژوهش باعث افزایش صحت و دقت اطلاعات خروجی و در نهایت امکان تفکیک و بررسیهای دقیقتر کاربریها و شناسایی عوامل تغییر آنها را جهت برنامه ریزیهای آینده فراهم میکند.
روش تحقیق
منطقه مورد مطالعه
شهرستان رضوانشهر در شمال غرب استان گیلان واقع گردیده و از لحاظ موقعیت جغرافیایی بین عرضهای 37 درجه و 25 دقیقه و 22 ثانیه تا 37 درجه و 40 دقیقه و 34 ثانیه شمالی و طول جغرافیایی 48 درجه و 40 دقیقه و 21 ثانیه تا 49 درجه 13 دقیقه و 7 ثانیه شرقی قرارگرفته است (شکل 1). این شهرستان از نظر جهات جغرافیایی از طرف شمال به دریای خزر و شهرستان تالش، از سمت شرق به دریای خزر، شهرستانهای بندر انزلی و صومعهسرا و از سوی جنوب و جنوب شرقی به شهرستان ماسال و از طرف غرب به شهرستان خلخال در استان اردبیل محدود میگردد.
شکل1. موقعیت منطقه موردمطالعه بهصورت ترکیب رنگ کاذب (باندهای 5، 4 و 3)
Fig 1. Location of the study area area as a false color composite (bands 5, 4 and 3)
دادههای مورداستفاده
بهمنظور ارزیابی عملکرد تبدیل آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و کسر حداقل نویز از تصویر ماهواره سنتینل-2 به تاریخ 30/06/2017 استفاده گردید (جدول 1). روند کلی مراحل انجام پژوهش نیز در شکل 2 ارائه شده است.
جدول1. مشخصات باندهای ماهواره سنتینل-2 (9)
Table 1. Specifications of Sentinel-2 satellite bands
شماره باند | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 |
طولموج (میکرومتر) رزولوشن مکانی(متر) | 43/0
60 | 49/0
10 | 56/0
10 | 65/0
10 | 70/0
20 | 74/0
20 | 78/0
20 | 84/0
10 | 86/0
20 | 94/0
60 | 37/1
60 | 61/1
20 | 19/2
20 |
شکل2. نمودار روند پژوهش
Fig 2. Flow chart of research methodology
پیشپردازش دادهها
تصاویر ماهواره سنتینل-2 از ابتدا به لحاظ هندسی تصحیحشده هستند، با این وجود تصویر از لحاظ دقت هندسی به صورت بصری مورد بررسی قرار گرفت. بهمنظور اعمال تصحیحات اتمسفری از ابزار تصحیح جوی سنتینل2 (Sen2Cor) در محیط نرمافزار اِسنپ (SNAP) استفاده گردید. این پردازنده منحصراً برای تصاویر ماهواره سنتینل -2 سطح A طراحی شده است و با استفاده از یک مدل انتقال تابشی، تصحیح جوی و زمینی را انجام میدهد. روش کار آن بر اساس رویکرد تراکم پوشش گیاهی تیره است و نسبت بین بازتاب پایین جو در طول موجهای مختلف در آن ثابت است. این الگوریتم برای مطابقت با پوشش گیاهی تیره به برخی از پیکسلهای تصویر نیاز دارد و پس از مشخص شدن وجود چنین پیکسلهایی ، الگوریتم به طور خودکار این پیکسلها را انتخاب میکند و تصویر را تصحیح میکند (10).
با توجه به اینکه باندهای تصاویر ماهواره سنتینل-2 دارای قدرت تفکیک مکانی متفاوتی هستند، از الگوریتم گرام اشمیت (Gram-Schmit) بهمنظور ادغام این دادهها با یکدیگر و رسیدن به قدرت تفکیک 10 متر استفاده گردید. الگوریتم گرام اشمیت، یک الگوریتم آماری است که با استفاده از کوواریانس باندها، آنها را غیر همبسته میکند. روش انجام این الگوریتم به این صورت است که ابتدا یک باند پانکروماتیک با استفاده از ترکیب n باند از دادههای چند طیفی ورودی شبیهسازی میشود. در ادامه، این تبدیل بر روی باندهای تصویر چند طیفی و باند پانکروماتیک شبیهسازی شده ارائه میگردد. سپس باند پانکروماتیک جایگزین اولین باند گرام اشمیت شده و معکوس تبدیل اعمال میشود (21). در نهایت تصویر ادغامشده بهصورت یک ماتریس خروجی برآورد میگردد.
استخراج اطلاعات از تصویر
جهت بهبود صحت استخراج اطلاعات از روشهای آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و کسر حداقل نویز و همچنین ترکیبی از مؤلفههای بهینه این سه روش استفاده گردید که به شرح زیر است:
روش آنالیز مؤلفههای اصلی(PCA)
در آنالیز مؤلفههای اصلی، دادهها از فضایی با ابعاد بالا به فضایی با ابعاد پایین تبدیل میشود. اساس این روش بر این پایه استوار است که یک تبدیل خطیϕ بهگونهای ایجاد میشود که بردار ویژگیهای h- بعدی را به بردارهای ویژگی d- بعدی (که h<d)، تبدیل میکند و هدف از اعمال این تبدیل دستیابی به کمترین مقدار خطای مربعات است (11). بعد از اعمال روش آنالیز مؤلفههای اصلی روی تصویر، مقادیر بهینه که نشان دهندهی وجود بیشترین اطلاعات در هر باند بود، روی باندهای 1 و 2 متراکم گردید و اطلاعات اضافی حذف و تعداد باندها کمتر شدند. در حالی که قبل از اعمال الگوریتم، پراکندگی اطلاعات در همهی باندها دیده میشد. در مقایسهی باندهای 1 و 2 نیز باند 1 دارای بیشترین اطلاعات ممکن بود که در روند کار مورد استفاده قرار گرفت. این الگوریتم با استفاده از رابطه زیر حاصل میشود:
[1]
در رابطهی 1، T تبدیل خطی که کمترین خطای مربعات را نشان میدهد، X ماتریس کوواریانس دادههایی با میانگین صفر و P معرف مؤلفههاست.
روش آنالیز مؤلفههای مستقل(ICA)
در الگوریتم آنالیز مؤلفههای مستقل فرض براین است که تعداد m متغیر اندازهگیری شده میتواند به صورت ترکیب خطی از d متغیر ناشناخته مستقل نمایش داده شود (14). با اعمال این تبدیل، مؤلفههای باندهای همبسته تصویر منطقه مورد مطالعه به مولفههای مستقل تبدیل شده و اطلاعات جدیدی از منطقه استخراج گردید. اگر چه کاهش ابعاد داده نیز از ویژگیهای این تبدیل میباشد، اما در این مطالعه از این ویژگی استفاده نشده و تاکید بر روی قابلیت استخراج عوارض بوده است. این تبدیل با استفاده از رابطهی 2 بدست میآید:
[2]
در رابطهی 2، X ماتریس دادهها و A ماتریس ترکیب ناشناخته و S ماتریس مؤلفههای مستقل است. در این تبدیل متغیرهای اندازهگیری شده میانگین صفر دارند.
روش کسر حداقل نویز (MNF)
معمولاً باندهای موجود در دادههای فراطیفی دارای نویزهای متنوعی میباشند، لذا یک تبدیل استاندارد مؤلفههای اساسی نمیتواند مؤلفههایی تولید کند که مقادیر نویز بهصورت افزایشی رتبهبندی شده باشند و این امر باعث میشود که در انتخاب یک حد آستانه مطمئن دچار مشکل شویم. برای به دست آوردن چنین مجموعهای از مؤلفهها که بهصورت افزایشی در مقادیر نویز (کاهشی در نسبت سیگنال به نویز) رتبهبندی شده باشند، تبدیل کسر حداقل نویز توسط گرین و همکاران (12) در سال 1998 معرفی گردید. این الگوریتم از دادهها یک تبدیل خطی ارائه میدهد و فضای دادهها را به دو بخش تقسیم میکند: بخش اول که شامل مقادیر زیاد و منسجم هستند و بخش دوم شامل مقادیر غیر منسجم و نویز است. این تبدیل مقدار کمینه جهات متعامد کسر نویز (یا بیشینه نسبت سیگنال به نویز) را پیدا میکند (28). الگوریتم کسر حداقل نویز دارای ویژگیهای کاهش ابعاد داده و تشخیص عوارض میباشد که در این مطالعه ویژگی دوم مد نظر بوده است. جهت مولفهبندی بهتر نویزها روی تصویر منطقه مورد مطالعه، الگوریتم اعمال و مقادیر نویز دادهها در خروجیهای اولیه کمتر و رفتهرفته مقدار نویز افزایش یافت و در نهایت مولفه اول که کمترین نویز را داشت انتخاب و مورد استفاده قرار گرفت. این الگوریتم با استفاده از روابط 3 و 4 حاصل میشود:
[3]
در رابطهی 3، X نشاندهنده ماتریس n×d دادهها، Xi نشاندهندهی i امین اسپکتروم بهصورت یک بردار d×1 و Xj بردار n مشاهده در j امین باند است. لذا هر اسپکتروم را میتوان بهصورت جمع سیگنال و نویز با استفاده از رابطهی زیر بدست آورد:
[4]
در رابطهی 4، Si مقدار کل و i ɛ نویز را نشان میدهد.
بهمنظور استفاده توأمان از قابلیت روشهای آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و کسر حداقل نویز استفاده ترکیبی از مؤلفههای این روشها پیشنهاد گردید. در این روش ابتدا باندهای 10 متری ماهواره سنتینل-2 با یکدیگر ترکیب شده و یک باند 10 متری از مجموع آنها تولید میشود که حاوی اطلاعات همه این باندها است. سپس این باند با سایر باندها ادغام میشود. هر یک از روشهای تبدیل بالا بر روی تصویر اعمال شده و سپس مؤلفههای برتر هر تبدیل که دارای واریانس بیشتر و نویز کمتری هستند با یکدیگر ترکیب میشوند. با استفاده از رابطهی 5 (23) و محاسبات آماری بین مؤلفههای بهدستآمده، ترکیب مؤلفههای اول آنالیز مؤلفههای اصلی، دوم آنالیز مؤلفههای مستقل و اول روش کسر حداقل نویز ، بهعنوان ترکیب بهینه انتخاب گردید.
[5]
در رابطهی 5، P بیانگر ماتریس کوواریانس در ابعاد P است.
الگوریتم حداکثر احتمال
این الگوریتم بصورت یک تابع غیر خطی عمل میکند و در آن میانگین ماتریس بردار و کوواریانس پیکسلهای ناشناخته در هر کلاس محاسبه می شود. سپس احتمال تعلق هر پیکسل به کلاس خود مورد تجزیه و تحلیل قرار میگیرد و در آخر با حداکثر احتمال پیشبینی میشود پیکسل متعلق به کدام کلاس است (13). جهت اعمال طبقهبندی ابتدا 8 کلاس اراضی جنگلی، اراضی مرتعی غنی، اراضی کشاورزی، اراضی مرتعی فقیر، اراضی مشجر، مناطق مسکونی، اراضی بایر و مناطق آبی تعیین و نمونههای تعلیمی با توجه به شناخت کلی از منطقه، تفسیر بصری و اعمال تبدیلات از کاربریهای مختلف اخذ گردید و در نهایت خروجی حاصل از تبدیلات با الگوریتم حداکثر احتمال که با استفاده از روابط 6 و 7 بدست میآید طبقهبندی گردید.
[6]
در رابطهی 6، x بردار مقادیر طیفی پیکسل مورد نظر، wi کلاس طیفی i و P(wi|x) احتمال تعلق پیکسل x به کلاس wi میباشد. برای محاسبه احتمالP(wi|x) که یک احتمال ثانویه است از قانون بیز کمک گرفته میشود. بدین منظور ابتدا احتمال عکس P(x|wi) با فرض اینکه توزیع احتمال کلاسها بهصورت توزیع نرمال چندبعدی است در نظر گرفته میشود و بهصورت زیر محاسبه میشود:
[7]
در رابطهی 7، mi بردار میانگین، i∑ ماتریس کوواریانس دادههای کلاس Wi و f تعداد باندها است. سپس احتمال اولیه درصد کلی حضور کلاس طیفی wi در تصویر P(wi) با توجه به اطلاعات کلی موجود در رابطه با منطقه محاسبه میشود.
جهت ارزیابی تفکیک پذیری نمونههای تعلیمی از آزمون جفریس ماتوسیتا استفاده شده است (23) که معادله شاخص آن به شرح زیر است:
[8]
[9]
در رابطه 8 و 9، mj و mi به ترتیب بردارهاي میانگین براي کلاسهای j و i بوده و ∑i و ∑j ماتریسهای کواریانس براي کلاس i و j هستند.
صحت سنجی
جهت ارزیابی صحت نقشههای خروجی از پارامترهای آماری دقت کلی و ضریب کاپا استفاده شد که با استفاده از روابط 10 و 11 بدست میآید (24). برای ارزیابی دقت نقشههای طبقهبندی شده نیز از 120 نقطهی زمینی که توسط GPS از کلاسهای مختلف اخذ گردید، استفاده شد.
[10]
[11]
در رابطهی 10، OA دقت کلی، N تعداد پیکسلهای آزمایشی و Pii عناصر قطر اصلی ماتریس خطا و در رابطهی 11، N تعداد کل پیکسلهای تصویر، Xii عناصر قطر اصلی ماتریس، Xi عناصر سطر i ام و X+i عناصر ستون i ام را نشان میدهد.
نتایج
بهمنظور ارزیابی عملکرد تبدیل آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و کسر حداقل نویز از تصویر ماهواره سنتینل-2 شهرستان رضوانشهر استفاده گردید. بعد از اعمال پیشپردازشهای لازم و ادغام تصاویر با یکدیگر، هرکدام از این الگوریتمها بر روی تصویر اعمال گردید و خروجی هرکدام با استفاده از الگوریتم حداکثر احتمال و در 8 کلاس کاربری (اراضی جنگلی، اراضی مرتعی غنی، اراضی کشاورزی، اراضی مرتعی فقیر، اراضی مشجر، اراضی مسکونی، اراضی بایر و آب)، طبقهبندی گردیدند. انتخاب کلاسها به منظور طبقهبندی بر اساس معیار اندرسون انجام گرفته است (3). بر اساس این معیار و با توجه به کاربریهای موجود در منطقه، دو نوع مرتع انتخاب شد. نوع اول مرتع غنی بود که کاملا سطح زمین پوشیده از پوشش گیاهی بوده و خاک لخت در آن مشاهده نمیشود و دیگری مرتع فقیر بود که با وجود داشتن پوشش گیاهی تنک، در مناطقی در تداخل با خاک لخت قرار داشت. جداسازی اراضی جنگلی و اراضی مشجر بر اساس انبوهی و یکنواختی درختان در مناطق جنگلی بوده است. از سویی دیگر مناطق جنگلی کاملاً یک دست بوده و کاربریهای با شباهت بالا در آن وجود ندارد. در حالی که عمده درختان اراضی مشجر در داخل شهر و در اختلاط با کاربری مسکونی بوده است. کلاس اراضی بایر با توجه به وجود قسمتهایی از زمین منطقه که به صورت کاملا لخت و فاقد پوشش گیاهی بوده و مساحت بالایی هم دارد انتخاب گردید. اراضی کشاورزی نیز که عمده کاربری منطقه را شامل میشود بیشتر شامل شالیزارهای برنج بوده و با توجه به پهنه وسیع و اهمیت بالای این مناطق به عنوان یک کاربری مجزا در نظر گرفته شده و طبقهبندی گردید. مناطق مسکونی که عمدتا با کاربریهای اراضی مشجر و کشاورزی در هم تنیده شده است نیز به عنوان کاربری مستقل در نظر گرفته شده است تا این کاربری از کاربریهای مجاور کاملا جدا گردد و صحت نتایج خروجی افزایش یابد. همچنین کلاس آب که عمدتاً به صورت رودخانه و آب بند در منطقه موجود میباشد، به عنوان یک کاربری در نظر گرفته شد تا مورد طبقهبندی قرار گیرد. در نهایت ترکیبی بهینه از مؤلفههای این تبدیلها نیز انتخاب و طبقهبندی گردید تا مورد ارزیابی قرار گیرد. شکلهای 3-7 نتایج حاصل از طبقهبندی بر رویدادهها را نشان میدهد.
شکل3. نتایج حاصل از طبقهبندی تصویر اصلی بدون اعمال تبدیلات با 8 کلاس کاربری
Fig 3. Results of original image classification without transformation with 8 classes
شکل4. نتایج حاصل از طبقهبندی خروجی تبدیل آنالیز مؤلفههای اصلی با 8 کلاس کاربری
Fig 4. Results of PCA transformation output classification with 8 classes
تبدیل آنالیز مؤلفههای اصلی با توجه به اینکه برای متغیرها توزیع گوسی در نظر میگیرد و سعی بر غیر همبسته کردن مؤلفههای استخراجشده دارد، در نمونههایی با توزیع غیر گوسی دارای ضعف بوده و عملکرد پایینی از خود نشان میدهد. این روش در جداسازی دو نوع مرتع غنی و فقیر از یکدیگر مشکل داشته و تعداد 87 پیکسل بین این دو کاربری با اختلاط رو به رو بوده است. همچنین کلاس جنگل با مرتع فقیر 14 پیکسل و با مرتع غنی 15 پیکسل جابه جایی پیکسلی داشته که این موارد منجر به پایین آمدن صحت خروجی آن شده است.
شکل5. نتایج حاصل از طبقهبندی خروجی تبدیل آنالیز مؤلفههای مستقل با 8 کلاس کاربری
Fig 5. Results of ICA transformation output classification with 8 classes
تفسیر بصری دقت بالای نتیجه طبقهبندی را نشان میدهد و برای کمّی کردن دقت تصویر طبقهبندی شده از ماتریس خطا (کانفیوژن) استفاده شده است. نتایج نشان از جابه جایی 50 پیکسلی دو کلاس مرتع فقیر و آب داشته است که تا حدی دقت کمتر در تفکیک این دو کلاس را میتوان به فاصله بیشتر این دادهها از توزیع غیرگوسی ارتباط داد.
شکل6. نتایج حاصل از طبقهبندی خروجی تبدیل کسر حداقل نویز با 8 کلاس کاربری
Fig 6. Results of MNF transformation output classification with 8 classes
الگوریتم کسر حداقل نویز مشابه الگوریتم آنالیز مؤلفههای اصلی عمل میکند با این تفاوت که نویزها را بهتر مولفهبندی میکند. مولفهها به گونهای مرتب میشوند که معمولا مولفه اول کمترین نویز را دارد. این الگوریتم در جداسازی کلاسها خطای کمتری داشته و همین عامل باعث عملکرد بهتر و دقت بالاتر نسبت به دو تبدیل آنالیز مؤلفههای اصلی و آنالیز مؤلفههای مستقل شده است.
شکل7. نتایج حاصل از طبقهبندی ترکیب بهینه مؤلفههای آنالیز مؤلفههای اصلی، مستقل و کسر حداقل نویز با 8 کلاس کاربری
Fig 7. Results of classifying the optimal combination of PCA, ICA and MNF components with 8 classes
با استفاده از آزمون جفریس ماتوسیتا، تفکیک پذیری نمونههای تعلیمی مورد بررسی قرار گرفته که نتایج آن در جدول 2 نشان داده شده است. شناخت کلی از منطقه و مطابق آن تفسیر بصری خروجیها و همچنین برداشت 120 نقطهی زمینی توسط GPS مبنای ارزیابی صحت نقشههای خروجی بوده است. جدول 3 صحت کلی و ضریب کاپا مربوط به خروجیهای تحقیق را نشان میدهد. نتایج حاصل از ارزیابی صحت کلی و ضریب کاپا نشان از دقت بالاتر ترکیب بهینه نسبت به تبدیلهای دیگر دارد.
جدول2. نتایج حاصل از اعمال آزمون جفریس ماتوسیتا بر روی نمونه های تعلیمی
Table 2. Results of Jeffris Matusita test on training samples
کلاس ها | آب | بایر | مسکونی | مشجر | مرتعی فقیر | کشاورزی | مرتعی | جنگلی | نمونههای تعلیمی |
جنگلی مرتعی غنی کشاورزی | 2 99/1 99/1 | 2 99/1 99/1 | 99/1 99/1 99/1 | 2 99/1 99/1 | 99/1 99/1 99/1 | 99/1 99/1 - | 99/1 - 99/1 | - 99/1 99/1 | 428 110 173 |
مرتعی فقیر اراضی مشجر | 86/1 2 | 83/1 2 | 92/1 99/1 | 99/1 - | - 2 | 99/1 99/1 | 99/1 99/1 | 99/1 2 | 363 167 |
مسکونی بایر | 84/1 93/1 | 92/1 - | - 90/1 | 99/1 2 | 91/1 80/1 | 99/1 99/1 | 99/1 99/1 | 99/1 2 | 83 178 |
آب | - | 93/1 | 87/1 | 2 | 83/1 | 99/1 | 2 | 2 | 95 |
با توجه به جدول 2 و همچنین معیار رتبهبندی میزان همبستگی جفریس ماتوسیتا، نمونههایی با میزان بالای 80/1 دارای میزان جداسازی خوبی بوده و به راحتی از کلاسهای دیگر جدا میشود که نتایج به دست آمده نشانگر جداسازی خوب کلاسها از یکدیگر بوده و صحت نتایج خروجی را کاهش نمیدهد.
جدول3. صحت کلی و ضریب کاپا خروجیهای تحقیق
Table 2. Overall accuracy and kappa coefficient of research outputs
| ترکیب تبدیلها | آنالیز مؤلفههای مستقل | آنالیز مؤلفههای اصلی | کسر حداقل نویز | تصویر اصلی |
صحت کلی ضریب کاپا | 92 94/0 | 77 80/0 | 80 83/0 | 85 88/0 | 76 78/0 |
بحث و نتیجهگیری
امروزه استفاده از انواع تبدیلات جهت بهبود صحت استخراج اطلاعات از تصاویر ماهوارهای رو به افزایش است. در این بین انتخاب نوع تبدیل بستگی به ماهیت تصویر و هدف پردازشی آن دارد و استفاده هرکدام از تبدیلات منجر به نتایج خروجی متفاوتی میشوند. در این تحقیق بعد از ارزیابی عملکرد الگوریتمهای آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و روش کسر حداقل نویز یک روش ترکیب بهینه مؤلفههای این تبدیلات پیشنهاد گردید. طبق نتایج، طبقهبندی تصویر اصلی بدون اعمال تبدیلات و با همان نمونههای تعلیمی با صحت کلی 76 درصد و ضریب کاپای 78/0 پایین ترین دقت را نسبت به سایر خروجیها داشته است. با توجه به این موضوع لزوم اعمال تبدیلات جهت کاهش همبستگی باندها، مجزا سازی اجزای تصاویر و به دنبال آن افزایش دقت طبقهبندی در این پژوهش نمایان شد. بررسی ماتریس خطای خروجی حاصل از تبدیل آنالیز مؤلفههای اصلی نشان از تداخل پیکسلی بالای دو کلاس مرتع غنی و فقیر میدهد، همچنین این تبدیل در تفکیک جنگل با مراتع نیز با خطاهایی مواجه بوده است. مقدار صحت کلی برای این تبدیل 80 درصد و ضریب کاپا 83/0 بوده است. تبدیل کسر حداقل نویز، میزان نویز دادهها را به حداقل رسانده و در خروجی نتایج بهتری از دو تبدیل آنالیز مؤلفههای اصلی و آنالیز مؤلفههای مستقل داشته است. این الگوریتم در جداسازی جنگل و مرتع غنی خطای 22 پیکسلی داشته که با توجه به ماهیت این روش و شرایط محیطی منطقه خطای اندکی به حساب میآید. بر اساس نتایج صحت سنجی نیز تبدیل کسر حداقل نویز با صحت کلی 85 درصد و ضریب کاپا 88/0 دقت بالاتر و عملکرد بهتری نسبت به روشهای آنالیز مؤلفههای مستقل و آنالیز مؤلفههای اصلی داشته است. تبدیل آنالیز مؤلفههای مستقل با فرض غیر گوسی بودن توزیع متغیرها سعی بر مستقل کردن اجزای تصویر از یکدیگر دارد. با توجه به ماهیت این روش، جداسازی بین کاربری شهر و مرتع به دلیل در هم تنیدگی این دو کاربری با خطای 14 پیکسلی رو به رو بوده و همچنین در جداسازی دو نوع مرتع خطای 35 پیکسلی در این روش وجود دارد. مقایسه نتایج خروجیها بیانگر عملکرد نزدیک این روشها به یکدیگر است که نشان از وجود هر دو نوع توزیع گوسی و غیر گوسی متغیرها دارد. با توجه به اینکه این تبدیلات به تنهایی قادر به استخراج تمامی اجزای تصویر نیستند، لذا ترکیبی از مؤلفههای آنها بر اساس ضریب شفیلد جهت مفروض بودن توزیع گوسی و غیر گوسی متغیرها با حداقل نویز ممکن انتخاب گردید. با توجه به معیار کنگولتون و گرین (7) که ضریب کاپا بالای 85/0 را مطلوب اعلام کردهاند، نتایج تحقیق نشانگر صحت کلی 92 درصد و ضریب کاپا 94/0 در ترکیب پیشنهادی است. این ترکیب خطای جداسازی بین دو نوع مرتع را به صفر رسانده و در جداسازی اکثر طبقات از یکدیگر دارای بیشترین صحت بوده و تنها در جداسازی کاربری مرتع غنی از جنگل خطای 16 پیکسلی داشته که منجر به عملکرد بهتر و صحت بسیار بالا شده است. همان طور که ذکر گردید روشهای مورد استفاده در جداسازی کلاسهای درهم تنیده و کلاسهای با نزدیکی طیفی بالا مشکل دارند که منجر به کاهش صحت خروجیهای آنها شده است. استفاده ترکیبی از این تبدیلات منجر به کاهش خطای خروجیها و افزایش صحت نقشههای نهایی شده است. همسو با موضوع این پژوهش، تحقیقات دیگری نیز صورت گرفته که نتایج متفاوتی به همراه داشته است، از جمله:
لی و همکاران (16)، جهت تهیه نقشه کاربری اراضی از سه روش آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و کسر حداقل نویز استفاده کردند. نتایج پژوهش آنها بصورت کلی نشان داد که هر سه روش کاهش ابعاد داده باعث بهبود دقت طبقه بندی شدند و همچنین از بین سه روش، الگوریتم کسر حداقل نویز از دقت بیشتری برخوردار بوده است. البته لازم به ذکر است که شرایط و ویژگیهای منطقه مورد مطالعه مانند شرایط طبیعی و نحوه توزیع متغیرها از لحاظ گوسی و غیرگوسی بودن، نتایج متفاوتی به دنبال دارد. همچنان که در تحقیق دیگر از دبیری و لانگ (8) در مقایسه سه الگوریتم، تبدیل آنالیز مؤلفههای مستقل نتیجه بهتری نسبت به الگوریتمهای آنالیز مؤلفههای اصلی و کسر حداقل نویز داشته است و یا در پژوهشی دیگر از ارسلان و همکاران (4) جهت افزایش دقت نقشه طبقهبندی از تبدیلات کاهش ابعاد داده استفاده شد که تبدیل آنالیز مؤلفههای اصلی از نتیجه بهتر و دقت بالاتری نسبت به روشهای آنالیز مؤلفههای مستقل و کسر حداقل نویز برخوردار بوده است. اولزوروم و همکاران (25) در پژوهشی با هدف ارزیابی استراتژیهای انتخاب مؤلفه روی تصاویر فراطیفی، سه تکنیک سنتی کاهش ابعاد داده را مورد مقایسه قرار دادند که به ترتیب تبدیلات کسر حداقل نویز، آنالیز مؤلفههای اصلی و آنالیز مؤلفههای مستقل از بیشترین دقت برخوردار بودند. نتایج آماری مطلوب و ارزیابی و مقایسه آن با مشاهدات میدانی از منطقه مورد مطالعه و نقاط کنترل زمینی با استفاده از GPS، حاکی از دقت قابل قبول خروجیهای این پژوهش دارد که این امکان را فراهم میکند تا در مطالعات بعدی با استفاده از تصاویر سالهای قبل و مقایسه آن با این پژوهش، میزان تغییرات را در کاربریهای مختلف در طول بازه زمانی مشخص نمایان ساخت. همچنین پیشنهاد میشود در تحقیقات بعدی جهت بالا بردن صحت و دقت طبقهبندی و نتایج نهایی، از تصاویر ماهوارههایی مانند Worldview و Quickbird که توان تفکیک بالاتری دارند بهره برد.
منابع مورد استفاده
Al-Ahmadi F, Hames A. 2009. Comparison of four classification methods to extract land use and land cover from raw satellite images for some remote arid areas, kingdom of Saudi Arabia Journal. Earth, 20(1): 167-191.
Alikhahasl M., Frootan E, Namdar M. 2014. Evaluation of different enhancement remote sensing techniques. Agriculture innovation and research, 3(1): 33-37.
Anderson J R. 1971. Land-use classification schemes. Photogrammetric Engineering.
Arsalan O, Akyurek O, Kaya S. 2017. A comparative analysis of classication methods for hyperspectral imagesgenerated with conventional dimension reduction methods. Turkish Journal of Electrical Engineering & Computer Sciences, 2(25): 58-72. https://doi.org/10.3906/elk-1503-167.
Barzegari DV, Zare M, Mokhtari MH, Ekhtesasi ZR. 2018. Evaluation of different satellite image enhancement techniques in separating of geological units. RS & GIS for Natural Resources, 9:1. (In Persian).
Bellvert J, Cekalovic CJ, Mata M, Pelechá A, Nieto H. 2020. Feasibility of Using the Two-Source Energy Balance Model (TSEB) with Sentinel-2 and Sentinel-3 Images to Analyze the Spatio-Temporal Variability of Vine Water Status in a Vineyard. Remote Sens, 12(14). https://doi.org/10.3390/rs12142299.
Congolton RG, Green K. 2018. Assessing the accuracy of remotely sensed data: principles and practices. Crc press, Florida, 139.
Dabiri Z, Long S. 2018. Comparison of Independent Component Analysis, Principal Component Analysis and Minimum Noise Fraction Transformation for Tree SpeciesClassification Using APEX Hyperspectral Imagery. International Journal of Geo-Information, (7): 1-26. https://doi.org/10.3390/ijgi7120488.
Esa(european space agency). 2017. SENTINEL-2 User Handbook, 2.
ESA. 2018. SNAP-Sen2Cor. Available online: http://step.esa.int/main/third-party-plugins-2/sen2cor.
Estornell J, Mart-Gavila M, Sebastia MT, Mengual J. 2013. Principal component analysis applied to remote sensing. Modelling in Science Education and Learning, 6 (7):83-89. https://doi.org/10.4995/msel.2013.1905.
Green AA, Berman M, Switzer P, Craig M.D. 1988.A transformation for ordering multispectral data in terms of image quality with implications for noise removal. Transactions on Geoscience and Remote Sensing, 26(1):65 - 74. https://doi.org/10.1109/36.3001.
Guan HX, Liu HJ, Meng XT, Luo C, Bao Y, Ma YY, Yu ZY, Zhang XL. 2020. A Quantitative Monitoring Method for Determining Maize Lodging in Different Growth Stages. Remote Sens, 12(19), 3149. https://doi.org/10.3390/rs12193149 - 25.
Hyvarinen A, Oja E. 1977. A Fast Fixed Point Algorithm for Independent Component Analysis. Neural Comput, 25:425-429.
Javan F, Hasani Moghaddam H. 2017. Deforestation Detection of Hyrcania forest using satellite imagery and Support Vector Machine (Case study: Rezvanshahr County). Forest strategical approchment journal, 2:5 (In Persian).
Li X, Chen W, Cheng X, Liao Y, Chen G. 2017. Comparison and integration of feature reduction methodsfor land cover classification with RapidEye imagery. Multimed Tools And Aplication journal, (2)1: 1380-7501. https://doi.org/10.1007/s11042-016-4311-4.
Lou G, Chen G, Tian L, Qian Sh. 2016. Minimum noise fraction versus Principal component analysis as a preprocessing step for hyperspectral imagery denoising. Canadian journal of remote sensing, 42(2). https://doi.org/10.1080/07038992.2016.1160772.
Manly BFJ. 1994. Multivariate statistical methods (2th ed), Chapman and Hall.
Matkan AA, Nohegar A, Mirbagheri B, Torkchin N. 2014. Assessment relations of land use in heat islands using time series ASTER sensor data (Case study: Bandar Abbas city) RS & GIS for Natural Resources, 5:4. (In Persian).
Nascimento JMP, Dias JMB. 2015. Vertex component analysis: A fast algorithm to unmix hyperspectral data. Transactions on Geoscience and Remote Sensing, 43, 898–910. https://doi.org/ 10.1109/TGRS.2005.844293.
Pohl C, Van G J. 2016. Remote sensing image fusion: A practical guide, Crc Press.
Richards J A. 1999. Remote Sensing Digital Image Analysis, Springer-Verlag, Berlin.
Sheffield C. 1985. Selecting band combinations from multispectral data. Photogrammetric Engineering and Remote Sensing, 11:14.
Strimbu VF, Strimbu BM. 2015. A graph-based segmentation algorithm for tree crown extraction using airborne LiDAR data. Journal of Photogrammetry and Remote Sensing, 104:30-43. https://doi.org/10.1016/j.isprsjprs.2015.01.018.
Ulzurrun EI, Marcello J, Martin CG. 2017. Assessment of Component Selection Strategies in Hyperspectral Imagery. Remote sensing, 19:666. https://doi.org/10.3390/e19120666.
Vidhyavayhi D. 2017. Principal component analysis (PCA) in medical image processing using digital image and communications (DICOM) in medicine medical image. International Journal, 975-6299. https://doi.org/10.22376/ijpbs.2017.8.2.b.598-606.
Wang L. Zhang J, Liu P, Choo KKR, Huang F. 2016. Spectral–spatial multi-feature-based deep learning for hyperspectral remote sensing image classification. Soft Comput 21:213–221. https://doi.org/10.1007/s00500-016-2246-3.
Weng Q. 2017. Hyperspectral remote ensing fundamental and practice. Crc press, United states.
Yung MD, Huang KH, Tasi HP. 2020. Integrating MNF and HHT Transformations into Artificial Neural Networks for Hyperspectral Image Classification Remote Sens, 12(14), 2327. https://doi.org/10.3390/rs12142327.
Zhang X, Chen CH. 2002. New independent component analysis method using higher order statistics with applications to remote sensing images. Optical Engineering 41(7):1717-1728. https://doi.org/10.1117/1.1482722.
Zhang Y, Zhang J, Yang W. 2020. Quantifying Information Content in Multispectral Remote-Sensing Images Based on Image Transforms and Geostatistical Modelling. Remote Sens, 2020, 12(5). https://doi.org/10.3390/rs12050880.
Performance evaluation of PCA, ICA and MNF in increasing the information extracting accuracy of Sentinel-2 satellite data
Abstract
Due to the correlated nature of remote sensing images the use of various transformations to improve the accuracy of information extraction from these images is essential. In this regard, selecting the optimal transformation method is important and will affect the outcomes result. For this purpose, an image from Sentinel-2 satellite for Rezvanshahr city on 06/30/2017 was selected and after applying the required preprocessing, the image bands were fused with the Gram-Schmit algorithm. The PCA, ICA, and MNF transforms were applied and the output of each was classified for evaluation using the maximum likelihood algorithm. In order to find the optimal combination of the components of these transformations, the Sheffied coefficient were used, and the combination of the first components of PCA, MNF and the second component of the ICA, was selected and classified. In order to evaluate the performance of each method, overall accuracy and Kappa coefficient were used. The results of the study showed that the image classification without transformation has an overall accuracy of 76% and a kappa of 0.78, while after applying PCA, ICA and MNF conversions, the Kappa coefficient was obtained 0.83- 0.80- 0.88 and overall accuracy 0.80- 0.77 and 0.85 respectively. Also, the results of combining optimal components composition have an overall accuracy of 92% and a Kappa coefficient of 0.94, which indicates the optimal performance of the optimal composition in the classification process.
Keywords: Rezvanshahr, Sentinel-2, Sheffield Transformation, Maximum Likelihood.
ارزیابی عملکرد تبدیل آنالیز مؤلفههای اصلی، مستقل و کسر حداقل نویز
در بهبود صحت استخراج اطلاعات از دادههای ماهوارهی سنتینل-2
چکیده مبسوط
در این پژوهش بهمنظور ارزیابی عملکرد روشهای آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و روش کسر حداقل نویز از تصاویر ماهواره سنتینل-2 شهرستان رضوانشهر به تاریخ 30/06/2017 استفاده گردید. از الگوریتم گرام اشمیت (Gram-Schmit) بهمنظور ادغام این دادهها با یکدیگر و رسیدن به قدرت تفکیک 10 متر استفاده شد. بعد از اعمال پیشپردازشهای لازم و ادغام تصاویر با یکدیگر هر سه تبدیل روی تصویر اعمال و همچنین ترکیبی از مؤلفههای این سه روش تولید گردید. در ادامه نتایج حاصل از تبدیلات با استفاده از الگوریتم حداکثر احتمال در 8 کلاس کاربری طبقهبندی گردید. با استفاده از ضریب شفیلد و محاسبات آماری بین مؤلفههای بهدستآمده، ترکیب مؤلفههای اول آنالیز مؤلفههای اصلی، اول کسر حداقل نویز و مؤلفه دوم آنالیز مؤلفههای مستقل، بهعنوان ترکیب بهینه انتخاب گردید. شناخت کلی از منطقه و مطابق آن تفسیر بصری خروجیها و همچنین برداشت 120 نقطهی زمینی توسط GPS مبنای ارزیابی صحت نقشههای خروجی بوده است. نتایج حاصل از ارزیابی صحت کلی و ضریب کاپا نشان داد که طبقهبندی تصویر اصلی بدون اعمال تبدیلات و با همان نمونههای تعلیمی خروجی با صحت کلی 76 درصد و ضریب کاپای 78/0 بیشترین خطا را داشته است. همچنین نتایج سایر خروجیها به ترتیب برای طبقهبندی حاصل از تبدیل آنالیز مؤلفههای اصلی، صحت کلی 80 درصد و ضریب کاپا 83/0، برای طبقهبندی حاصل از تبدیل کسر حداقل نویز، صحت کلی 85 درصد و ضریب کاپا 88/0 و برای طبقهبندی حاصل از تبدیل آنالیز مؤلفههای مستقل، صحت کلی برابر با 77 درصد و ضریب کاپا معادل 80/0 به دست آمد. بعد از انتخاب ترکیب بهینه از مؤلفههای روشهای آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و روش کسر حداقل نویز و انتخاب مؤلفههای اول الگوریتمهای آنالیز مؤلفههای اصلی و کسر حداقل نویز و مؤلفه دوم آنالیز مؤلفههای مستقل، صحت کلی به 92 درصد و ضریب کاپا 94/0 افزایشیافت.
طرح مسئله: استفاده از انواع تبدیلات جهت بهبود صحت استخراج اطلاعات از تصاویر ماهوارهای به طور فزایندهای رو به افزایش است. در این بین انتخاب تبدیل بهینه اهمیت بالایی داشته و نتایج خروجی را تحت تأثیر قرار خواهد داد. با توجه به ماهیت همبسته تصاویر سنجشاز دوری، استفاده از انواع تبدیلات جهت بهبود صحت استخراج اطلاعات از این تصاویر امری ضروری است. در این تحقیق بعد از ارزیابی عملکرد تبدیل آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و روش کسر حداقل نویز، یک روش ترکیب بهینه از مؤلفههای این تبدیلات پیشنهاد گردید. نتایج تحقیق نشان داد طبقهبندی تصویر اصلی بدون اعمال تبدیلات و با همان نمونههای تعلیمی صحت کلی و ضریب کاپای پایینی داشته است. بنابراین لزوم اعمال تبدیلات جهت کاهش همبستگی باندها و مجزا سازی اجزای تصاویر احساس میشود.
هدف: با توجه به مطالعات انجام شده هدف این تحقیق بررسی روشهای مختلف تبدیلات تصویر در بهبود روند طبقهبندی تصاویر ماهوارهای و افزایش میزان صحت نقشههای کاربری اراضی میباشد. با در نظر گرفتن این نکته که منطقه مورد مطالعه و به صورت کلی مناطق شمالی کشور با شرایط خاص درهم تنیدگی کاربریها روبه رو هستند، لذا بهکارگیری انواع روشهای تبدیلات و همچنین روش ترکیبی پیشنهادی در این پژوهش باعث افزایش صحت و دقت اطلاعات خروجی و در نهایت امکان تفکیک و بررسیهای دقیقتر کاربریها و شناسایی عوامل تغییر آنها را جهت برنامهریزیهای آینده فراهم میکند.
روش تحقیق: در این پژوهش بهمنظور ارزیابی عملکرد تبدیلات آنالیز مؤلفههای اصلی، آنالیز مؤلفههای مستقل و کسر حداقل نویز از تصویر ماهواره سنتینل-2 شهرستان رضوانشهر به تاریخ 30/06/2017 استفاده گردید. جهت تعیین روش بهینه و بهبود صحت استخراج اطلاعات، سه الگوریتم روی تصویر اعمال و ترکیبی از مؤلفههای برتر این سه روش استخراج گردید. در ادامه نتایج حاصل از اعمال این روش و ترکیب بهینه بر روی تصویر با استفاده از الگوریتم حداکثر احتمال طبقهبندی شد.
نتایج و بحث: بعد از اعمال پیشپردازشهای موردنیاز و ادغام تصاویر با یکدیگر، هرکدام از این الگوریتمها بر روی تصویر اعمال گردید و خروجی هرکدام با استفاده از الگوریتم حداکثر احتمال و در 8 کلاس کاربری طبقهبندی گردیدند. نتایج نقشههای خروجی نشان داد که تبدیل آنالیز مؤلفههای اصلی با توجه به اینکه برای متغیرها توزیع گوسی در نظر میگیرد و سعی بر غیر همبسته کردن مؤلفههای استخراج شده دارد، در نمونههایی با توزیع غیر گوسی دارای ضعف بوده و عملکرد پایینی از خود نشان میدهد. الگوریتم کسر حداقل نویز مشابه الگوریتم آنالیز مؤلفههای اصلی عمل میکند با این تفاوت که نویزها را بهتر مولفهبندی میکند. این الگوریتم در جداسازی کلاسها خطای کمتری داشته و همین عامل باعث عملکرد بهتر و دقت بالاتر نسبت به دو تبدیل دیگر شده است. در الگوریتم آنالیز مؤلفههای مستقل باندهای همبسته تصویر منطقه مورد مطالعه به مولفههای مستقل تبدیل شده و اطلاعات جدیدی از منطقه استخراج کرده است. تفسیر بصری دقت بالای نتیجه طبقهبندی را نشان میدهد و برای کمی کردن دقت تصویر طبقهبندی شده از ماتریس خطا (کانفیوژن) استفاده شده است.
نتیجهگیری:. همانطور که نتایج تحقیق نشان داد طبقهبندی تصویر اصلی بدون اعمال تبدیلات و با همان نمونههای تعلیمی صحت کلی و ضریب کاپای پایینی داشته است. نتایج تحقیق بیانگر عملکرد نزدیک این روشها به یکدیگر است که نشان از وجود هر دو نوع توزیع گوسی و غیر گوسی متغیرها دارد. تبدیل کسر حداقل نویز، میزان نویز دادهها را به حداقل رسانده و در خروجی نتایج بهتری از دو تبدیل آنالیز مؤلفههای مستقل و آنالیز مؤلفههای اصلی داشته است. با توجه به اینکه این تبدیلات بهتنهایی قادر به استخراج تمامی اجزای تصویر نیستند، لذا ترکیبی از مؤلفههای این تبدیلات بر اساس ضریب شفیلد جهت مفروض بودن توزیع گوسی و غیر گوسی متغیرها با حداقل نویز ممکن انتخاب گردید. نتایج تحقیق نشانگر صحت کلی 92 درصد و ضریب کاپا 94/0 در ترکیب پیشنهادی است.
واژههای کلیدی: رضوانشهر، سنتینل-2، ضریب شفیلد، تبدیلات، حداکثر احتمال.
Performance evaluation of PCA, MNF and ICA in increasing the information extracting accuracy of Sentinel-2 satellite data
Abstract In this study, in order to evaluate the performance of principal component analysis methods, independent component analysis and minimum noise fraction method, Sentinel-2 satellite images of Rezvanshahr city on 06/30/2017 were used. Gram-Schmit algorithm was used to integrate this data with each other and achieve a resolution of 10 meters. After applying the necessary pre-processing and merging the images together, all three transformations were applied to the image, as well as a combination of the components of these three methods. Then, the results of the transformations were classified into 8 user classes using the maximum likelihood algorithm. Using Sheffield coefficient and statistical calculations between the obtained components, the combination of the first components of principal component analysis, the first component of minimum noise fraction and the second component of independent component analysis were selected as the optimal combination. A general knowledge of the area and accordingly the visual interpretation of the outputs as well as the perception of 120 ground points by GPS has been the basis for assessing the accuracy of the output maps. The results of the evaluation of overall accuracy and kappa coefficient showed that the classification of the original image without applying transformations and with the same training samples of output with overall accuracy of 76% and kappa coefficient of 0.78 had the highest error. Also, the results of other outputs for classification resulting from principal component analysis conversion are 80% overall accuracy and kappa coefficient of 0.83, respectively, for classification resulting from minimum noise fraction conversion, total accuracy of 85% and kappa coefficient of 0.88 and for the classification obtained from the analysis of independent component analysis, the overall accuracy was 77% and the kappa coefficient was 0.80. After selecting the optimal combination of components of principal components analysis methods, independent component analysis and minimum noise fraction method and selecting the first components of principal component analysis algorithms and minimum noise fraction and the second component of total component analysis to 92% independent coefficient and Kappa increased 0.94.
Problem The use of various transformations to improve the accuracy of data extraction from satellite images is increasing sharply. In the meantime, the choice of optimal conversion is very important and will affect the output results. Due to the correlated nature of remote sensing images, the use of various transformations to improve the accuracy of information extraction from these images is essential. In this study, after evaluating the conversion performance of principal component analysis, independent component analysis and minimum noise fraction method, an optimal combination of components of these transformations was proposed.
Objective According to the studies, the purpose of this study is to investigate different methods of image conversion in improving the process of classification of satellite images and increasing the accuracy of land use maps. Considering that the study area and in general the northern regions of the Iran are facing special conditions of entanglement of land uses, so the use of various conversion methods as well as the combined method proposed in this study increases the accuracy and the accuracy of the output information and finally the possibility of more detailed separation and review of uses and identification of factors changing them for future planning.
Methods In this study, in order to evaluate the conversion performance of principal component analysis, independent component analysis and minimum noise fraction, the image of Sentinel-2 satellite of Rezvanshahr city on 30/06/2017 was used. In order to determine the optimal method and improve the accuracy of information extraction, three algorithms were applied to the image and a combination of the superior components of these three methods were extracted. Then, the results of applying this method and the optimal combination on the image were classified using the Maximum Likelihood algorithm.
Results and Discussion After applying the required preprocessors, each of these algorithms was applied to the image and the output of each was classified into 8 user classes using the Maximum Likelihood algorithm. The results of output maps showed that the conversion of principal component analysis, considering that it considers Gaussian distribution for variables and tries to decompose the extracted components, is weak in samples with non-Gaussian distribution and shows low performance. The minimum noise fraction algorithm works similar to the principal component analysis algorithm, except that it classifies the noise better. This algorithm has less error in separating classes and this factor has resulted in better performance and higher accuracy than the other two conversions. In the independent component analysis algorithm, the image correlated bands of the study area have been converted to independent components and new information has been extracted from the area. Visual interpretation shows the high accuracy of the classification result and an error matrix (confusion) is used to quantify the accuracy of the classified image.
Conclusion As the results of the research showed, the classification of the original image without conversions and with the same training samples had low overall accuracy and kappa coefficient. The results show the close performance of these transformations to each other, which indicates the existence of both Gaussian and non-Gaussian distributions of variables. MNF conversion has minimized the amount of data noise and results in better output than ICA and PCA conversion. Since these transformations alone are not able to extract all the components of the image, so a combination of the components of these transformations based on the Sheffield coefficient was chosen to assume the Gaussian and non-Gaussian distributions of the variables with the least possible noise. the research results show an overall accuracy of 92% and a kappa coefficient of 0.94 in the proposed composition.
Keywords: Rezvanshahr, Sentinel-2, Sheffield, Transformation, Maximum Likelihood.