رقم المقالة : JCE-2309-1224 (R3) زيارة : 341 الصفحة: 33 - 44

نوع المخطوط: ابحاث

بهینه‌سازی پیش‌بینی تابش خورشیدی بر اساس بستر اینترنت اشیاء در نیروگاه فوتولتائیک

الموضوعات :

ندا اشرفی خوزانی ¹ , مریم محمودی ² , شبنم نصر اصفهانی ³

1 - دانشکده مهندسی کامپیوتر، واحد میمه، دانشگاه آزاد اسلامی، میمه، ایران
2 - دانشکده مهندسی کامپیوتر، واحد میمه، دانشگاه آزاد اسلامی، میمه، ایران
3 - دانشکده مهندسی برق، واحد میمه، دانشگاه آزاد اسلامی، میمه، ایران

تاريخ الإرسال : 01 السبت , ربيع الأول, 1445 تاريخ التأكيد : 09 الجمعة , جمادى الثانية, 1445 تاريخ الإصدار : 14 السبت , محرم, 1446

الکلمات المفتاحية: الگوریتم خفاش, اينترنت اشياء, درخت تصميم, نيروگاه‌هاي فتوولتائيک, يادگيري ماشين,

ملخص المقالة :

ارامتر مقدار تابش خورشيدي يکي از مهم‌ترين پارامترها در تعيين مقدار توان خروجي پنل‌هاي فتوولتائيک است. پيش¬بيني دقيق اين پارامتر براي برنامه¬ريزي در واحدهاي دیسپچینگ(Dispatching ) و مديريت بار از اهميت ويژه‌اي برخوردار است. عدم قطعيت در ميزان تابش خورشيدي و سختي پيش‌بيني آن، طراحان را با چالش‌هاي اقتصادي و مديريتي مواجه مي‌کند. در اين پژوهش يک روش پيش‌بيني با دقت بالا با استفاده از روش‌هاي مبتني بر درخت و بهبود عملکرد اين روش‌ها به کمک الگوريتم‌هاي فرا ابتکاري ارائه مي‌شود. تأکید اصلي در روش پيشنهادي عدم بيش-برازش و قابليت اتکاي بالا و قابليت به‌کارگيري در سيستم‌هاي اينترنت اشياء است. بنابراین، الگوريتم‌هاي فراابتکاري در بهينه‌سازي روش‌هاي مبتني بر درخت و همینطور در انتخاب ويژگي و انتخاب نمونه‌ها نيز دخيل شده‌اند. لذا استفاده از روش‌هاي فراابتکاري به عنوان جنبه‌ي نوآوري اصلي اين پژوهش، نه ‌تنها استفاده براي به دست آوردن تنظيمات بهينه‌ي مدل‌هاي يادگيري ماشين بلکه در کاهش اثر نويزها، داده‌هاي پرت(Outlier) و ورودي‌هاي کم‌اثر نيز به بهبود کيفيت خروجي نهايي کمک کرده است. به علاوه مناسب‌سازي نتايج پيش‌بيني براي استفاده عملي در محيط‌ نيروگاه‌هاي فتوولتائيک موضوع پراهميتي است. اين موضوع که از طريق تابع برازش نوآورانه اين پژوهش در بهينه‌سازي مدل‌ها انجام پذيرفته است، باعث مي‌شود که خروجي نهايي علاوه بر دقت بالا از نظر سهولت پياده‌سازي در محيط‌هاي واقعي نيروگاه‌هاي فتوولتائيک نيز بهينه باشد. خروجي نهايي، يک مدل قوي است که با معيار مربع-R داراي امتياز95/0 است و از نظر سادگي تا حد زيادي بهينه است.

highlight:

Accurate prediction of the amount of solar radiation as an important parameter in determining the amount of output power of photovoltaic panels.

Optimization of tree-based models by meta-heuristic algorithms for modeling the amount of solar radiation parameter.

Maintaining the balance between the accuracy of the model and its simplicity and ability to be implemented in Internet of Things devices has been optimized.

In the end, a strong model that has a score of 0.95 with the R-square criterion was obtained in this research.

The final model can be implemented in the environment of power plants based on the Internet of Things.

المصادر:

[1] N. M. Kumar, K. Atluri and S. Palaparthi, “Internet of Things (IoT) in Photovoltaic Systems,” National Power Engineering Conference (NPEC), 2018, pp. 1-4, doi: 10.1109/NPEC.2018.8476807.
[2] A. Mellit, M. Menghanem and M. Bendekhis, “Artificial neural network model for prediction solar radiation data: application for sizing stand-alone photovoltaic power system,” IEEE Power Engineering Society General Meeting, 2005, San Francisco, CA, USA, 2005, pp. 40-44 Vol. 1, doi: 10.1109/PES.2005.1489526.
[3] A. Angstrom, “Solar and terrestrial radiation: Report to the international commission for solar research on actinometric investigations of solar and atmospheric radiation,” Quarterly Journal of the Royal Meteorological Society, 1924, pp. 121-126,1924, doi:10.1002/qj.49705021008.
[4] J. Prescott, “Evaporation from a water surface in relation to solar radiation,” Transactions of the Royal Society of South Australia, vol. 64, pp 114-118, 1940, doi: 10.4236/epe.2017.912045.
[5] A. A. Trabea and M.M. Shaltout, “Correlation of global solar radiation with meteorological parameters over Egypt,” Renewable Energy, vol. 21, pp. 297-308, Oct. 2000, doi:10.1016/S0960-1481(99)00127-5.
[6] D.Yeboah-Amankwah and K.Agyeman, “Differential Ångstrom model for predicting insolation from hours of sunshine,” Solar Energy, vol. 45, pp. 371-377, 1990, doi:10.1016/0038-092X(90)90158-9.
[7] H. Ninomiya, “Study on application of amedas meteorological data to the simulation of building heat environment,” University of Tokyo, 1994.
[8] J. C . Cao and S. H. Cao, “Study of forecasting solar irradiance using neural networks with preprocessing sample data by wavelet analysis,” Energy, vol. 31, pp. 3435-3445, Dec. 2006, doi: 10.1016/j.energy.2006.04.001.
[9] X. Qing and Y. Niu, “Hourly day-ahead solar irradiance prediction using weather forecasts by LSTM,” Energy, vol. 148, pp. 461-468, Apr. 2018, doi: 10.1016/j.energy.2018.01.177.
[10] D. Pothineni, M. R. Oswald, J. Poland and M. Pollefeys,“KloudNet: Deep Learning for Sky Image Analysis and Irradiance Forecasting,” German Conference on Pattern Recognition, 2018, pp. 535-551, doi:10.1007/978-3-030-12939-2_37.
[11] J. Lago, K. D. Brabandere, F. D. Ridder and B. D. Schuttera, “Short-term forecasting of solar irradiance without local telemetry: A generalized model using satellite data,” SolarEnergy, vol. 173, pp. 566-577, Oct. 2018, doi: 10.1016/j.solener.2018.07.050.
[12] N. Dong, J. F. Chang, A. G. Wu and Z. K. Gao, “A novel convolutional neural network framework based solar irradiance prediction method,” International Journal of Electrical Power & Energy Systems, vol. 114, pp. 1-19, Jan. 2020, doi: 10.1016/j.ijepes.2019.105411.
[13] N. Sharma, P. Sharma, D. Irwin and P. Shenoy, “Predicting solar generation from weather forecasts using machine learning,” IEEE International Conference on Smart Grid Communications (SmartGridComm), 2011, pp. 528-533, doi: 10.1109/SmartGridComm.2011.6102379.
[14] P. J. M. Ali and R. H. Faraj, “Data normalization and standardization: a technical report,” Mach. Learn. Tech. Rep., vol. 1, no. 1, pp. 1-6, 2014, doi: 10.13140/RG.2.2.28948.04489.
[15] Y.-Y. Song and L. Ying, “Decision tree methods: applications for classification and prediction,” Shanghai archives of psychiatry, vol. 27, no. 2, pp. 130-135, Apr. 2015, doi: 10.11919/j.issn.1002-0829.215044.
[16] N. Bhargava, G. Sharma, R. Bhargava and M. Mathuria, “Decision tree analysis on j48 algorithm for data mining,” Intrenational Journal of Advanced Research in Computer Science and Software Engineering, vol. 3, no. 6, 2013.
[17] D. Borup, B.J. Christensen, N.S. Mühlbach and M.S. Nielsen, “Targeting predictors in random forest regression,” International Journal of Forecasting, vol. 39, pp. 841–868, 2023, doi:10.1016/j.ijforecast.2022.02.010.
[18] Y. Li et al., “Random forest regression for online capacity estimation of lithium-ion batteries,” Applied energy, vol. 232, pp. 197-210, Dec. 2018, doi: 10.1016/j.apenergy.2018.09.182.
[19] R. Seyghaly, J. Garcia, X. Masip-Bruin and M. M. Varnamkhasti, “Interference Recognition for Fog Enabled IoT Architecture using a Novel Tree-based Method,” IEEE International Conference on Omni-layer Intelligent Systems (COINS), 2022, pp. 1-6, doi: 10.1109/COINS54846.2022.9854944.
[20] G. Sembina, “Building a scoring model using the ADABOOST ensemble model,” International Conference on Smart Information Systems and Technologies (SIST), 2022, doi:10.1109/sist54437.2022.9945713.
[21] D. P. Solomatine and D. L. Shrestha, “AdaBoost.RT: a boosting algorithm for regression problems,” IEEE International Joint Conference on Neural Networks (IEEE Cat. No.04CH37541), Budapest, Hungary, 2004, pp. 1163-1168 vol.2, doi: 10.1109/IJCNN.2004.1380102.
[22] X. S. Yang, “A New Metaheuristic Bat-Inspired Algorithm,” Nature Inspired Cooperative Strategies for Optimization (NICSO 2010), vol. 284, pp. 65–74, 2010, doi: 10.1007/978-3-642-12538-6_6.
[23] M.Banerjee, “Cook's distance in linear longitudinal models,” Communications in Statistics-Theory and Methods, vol. 27, pp. 2973-2983, 1998, doi: 10.1080/03610929808832267.
[24] J. Carmona, I. Lopez, J. Mateo, L. Jimenez and E. Aldana, “A distance-based method for outlier detection on high dimensional datasets,” IEEE Latin America Transactions, vol. 18, pp. 589–597, 2020, doi:10.1109/tla.2020.9082731.
[25] E. -S. M. El-Kenawy et al., “Advanced Ensemble Model for Solar Radiation Forecasting Using Sine Cosine Algorithm and Newton’s Laws,” in IEEE Access, vol. 9, pp. 115750-115765, 2021, doi: 10.1109/ACCESS.2021.3106233.

نص كامل:

13 بهينهسازي پيشبيني تابش خورشيدي بر اساس بستر اينترنت اشياء در نيروگاه فوتولتائيک

مقاله پژوهشی

بهينهسازي پيشبيني تابش خورشيدي بر اساس بستر اينترنت اشياء در نيروگاه فوتولتائيک

چکیده:

تاریخ دریافت:

تاریخ بازنگری:

تاریخ پذیرش:

پارامتر مقدار تابش خورشيدي يکي از مهم‌ترين پارامترها در تعيين مقدار توان خروجي پنل‌هاي فتوولتائيک است. پيشبيني دقيق اين پارامتر براي برنامهريزي در واحدهاي ديسپچينگ و مديريت بار از اهميت ويژه‌اي برخوردار است. عدم قطعيت در ميزان تابش خورشيدي و سختي پيش‌بيني کوتاه مدت آن، مديران و طراحان را با چالش‌هاي اقتصادي و مديريتي مواجه مي‌کند. در اين پژوهش يک روش پيش‌بيني با دقت و عموميت بالا با استفاده از روش‌هاي مبتني بر درخت و بهبود عملکرد اين روش‌ها به کمک الگوريتم‌هاي فرا ابتکاري ارائه مي‌شود. تاکيد اصلي در روش پيشنهادي عدم بيش-برازش و قابليت اتکاي بالا و همچنين قابليت به‌کارگيري در سيستم‌هاي اينترنت اشياء است. به اين منظور، الگوريتم‌هاي فراابتکاري نه تنها در بهينه‌سازي روش‌هاي مبتني بر درخت استفاده شده‌اند بلکه در انتخاب ويژگي و انتخاب نمونه‌ها نيز دخيل شده‌اند. لذا استفاده از روش‌هاي فراابتکاري به عنوان جنبه‌ي نوآوري اصلي اين پژوهش، نه ‌تنها استفاده براي به دست آوردن تنظيمات بهينه‌ي مدل‌هاي يادگيري ماشين بلکه در کاهش اثر نويزها، داده‌هاي پرت و ورودي‌هاي کم‌اثر نيز به بهبود کيفيت خروجي نهايي کمک کرده است. به علاوه مناسب‌سازي نتايج پيش‌بيني براي استفاده عملي در محيط‌ نيروگاه‌هاي فتوولتائيک موضوع پراهميتي است. اين موضوع که از طريق تابع برازش نوآورانه اين پژوهش در بهينه‌سازي مدل‌ها انجام پذيرفته است، باعث مي‌شود که خروجي نهايي علاوه بر دقت بالا از نظر سهولت پياده‌سازي در محيط‌هاي واقعي نيروگاه‌هاي فتوولتائيک نيز بهينه باشد. خروجي نهايي، به يک مدل قوي است که با معيار مربع-R داراي امتياز 95/0 است و از نظر سادگي مدل حدود زيادي بهينه است.

کلید واژه‌ها: اينترنت اشياء، درخت تصميم، يادگيري ماشين، الگوريتم

خفاش، نيروگاه‌هاي فتوولتائيک

https://doi.org/...

1-مقدمه

به طور کلي، سيستم‌هاي فوتوولتائيک به سيستم‌هايي اطلاق مي‌شود که از نور خورشيد براي توليد برق استفاده مي‌کنند. اين سيستم‌ها شامل مجموعه‌اي از ماژول‌هاي فوتوولتائيک(سلول‌هاي خورشيدي) هستند که نور خورشيد را به انرژي الکتريکي تبديل مي‌کنند. استفاده از سيستم‌هاي فوتوولتائيک به عنوان يکي از انواع منابع توليد انرژي پاک، در سال‌هاي اخير به طور چشمگيري در بسياري از کشورها افزايش يافته است. اما اين سيستم‌ها داراي عدم قطعيت در توليد انرژي هستند که مي‌تواند براي شبکه‌هاي برق مشکلاتي ايجاد کند. براي مثال، افزايش توليد انرژي در سيستم‌هاي فوتوولتائيک در روزهاي آفتابي باعث افزايش ولتاژ در شبکه مي‌شود و در صورت عدم مديريت مناسب مي‌تواند باعث اتلاف انرژي، خرابي تجهيزات و حتي ايجاد نقص در شبکه شود. بنابراين، براي جلوگيري از اين مشکلات، مديريت دقيق توليد انرژي سيستم‌هاي فوتوولتائيک و پيش‌بيني دقيق عدم قطعيت در توليد انرژي اين سيستم‌ها براي شبکه‌هاي برق بسيار مهم و ضروري است.

اينترنت اشياء¹ امروزه نقشي حياتي در جنبه‌هاي مختلف زندگي انسان‌ها از کشاورزي و صنعت تا پزشکي و شهرهاي هوشمند بازي مي‌کند. ﺑﻪ ﺻﻮرت ﺧﻼﺻﻪ اﯾﻨﺘﺮﻧﺖ اﺷﯿﺎء ﻓﻨﺎوري نويني اﺳﺖﮐﻪ در آن ﺑﺮاي ﻫﺮ ﻣﻮﺟﻮديتي(اعم از اﻧﺴﺎن و ﯾﺎ اﺷﯿﺎء) ﻗﺎﺑﻠﯿﺖ دريافت و ارﺳﺎل داده از ﻃﺮﯾﻖ ﺷﺒﮑﻪي اﯾﻨﺘﺮنت يا اﯾﻨﺘﺮاﻧﺖ، ﻓﺮاﻫﻢ ﻣﯽﮔﺮدد. اينترنت اشياء در واقع زيرساختي از شبکه پوياي خود تنظيم شونده با پروتکل‌هاي ارتباطي استاندارد و يکپارچه است که در آن اشياء فيزيکي و مجازي، داراي هويت، ويژگي‌هاي فيزيکي و شخصيتهاي مجازي هستند و به صورت يکپارچه درون زيرساخت اطلاعاتي تجميع شدهاند. نيروگاه‌هاي خورشيدي فتوولتائيک2 نيز از اين موضوع مستثني نيستند و سيستم‌هاي اينترنت اشياء با هدف پايش لحظه‌اي و جلوگيري از بروز خطاهاي احتمالي در اين نيروگاه‌ها مورد توجه قرار گرفته‌اند.

به عنوان نمونه، يک سيستم کنترل نيروگاه فتوولتائيک در سال 2018 در [1] پيشنهاد شدهاست که داراي سه لايه مختلف است. لايه‌ي اول شامل تجهيزات محيطي در مکان نيروگاه اعم از پنل‌هاي فتوولتائيک، سنسور‌ها، سوئيچ‌ها و غيره است. لايه‎ي دوم شامل سرور مرکزي و روتر براي اتصال امن به شبکه است و آخرين لايه شامل اينترنت و پايگاه‌هاي داده است که کنترل و پايش اين سيستم را به عهده دارد. معماري کلي اين سيستم در شکل 1 نمايش داده شدهاست. در این معماری، لایه اول شامل محیط طراحی سیستم فتوولتائيک است، که در آن تمام اجزا مطابق با تنظیمات مورد نیاز برای تکمیل کامل نیازهای کاربر به هم متصل شدند. لایه دوم که به عنوان اتصال بین طراحی های سخت افزاری سیستم فتوولتائيک به وب سرور از طریق یک روتر با گزینه فایروال اینترنتی عمل می‌کند. اطلاعات از سرور به لایه سوم که لایه نظارت و کنترل از راه دور است داده می شود. در اینجا سرور اطلاعات جمع آوری شده در مورد سیستم فتوولتائيک را به دستگاه‌های ذخیره سازی که می‌توان از آنها گزارش های دوره ای تولید کرد، تحویل می‌دهد.

از آنجایی که با توجه به این معماری و روش‌های مشابه، کنترل سیستم‌های فتوولتائيک به کمک اینترنت اشیا مورد توجه قرار گرفته‌است، نیاز به توسعه مدل‌های متناسب با اینترنت اشیا که پارامتر‌های مهم را به منظور کنترل دقیق‌تر این نیروگاه‌ها پیش‌بینی می‌کند از اهمیت ویژه‌ای برخوردار است.

شکل 1: معماري اينترنت اشيا براي کنترل نيروگاه فتوولتائيک[1]

پارامتر مقدار تابش خورشيدي يکي از مهم‌ترين پارامترها در تعيين مقدار توان خروجي پنل‌هاي فتوولتائيک است. این پارامتر که به شدت یا توان تابشی خورشید نیز شناخته می‌شود، با میزان انرژش تولیدی در نیروگاه‌های فتوولتائيک رابطه مستقیم دارد و آن را با W/m2 نشان می‌دهند. اگر شدت تابش را در پارامتر زمان ضرب کنیم به انرژی تابشی خورشید می‌رسیم و واحد آنرا با Wh/m2 یا Kwh/m2 نشان می‌دهند. پيش بيني دقيق اين پارامتر براي برنامه‌ريزي در واحدهاي ديسپچينگ و مديريت بار از اهميت ويژه‌اي برخوردار است. اين پارامتر همچنين در حفظ پايداري ولتاژ و فرکانس شبکه و آماده‌سازي نيروگاه‌هاي پشتيبان نيز حائز اهميت است. عدم قطعيت در ميزان تابش خورشيدي و سختي پيش‌بيني کوتاه مدت آن، مديران و طراحان سيستم‌هايي که از انرژي خورشيدي بهره مي‌گيرند را با چالش‌هاي اقتصادي و مديريتي مواجه مي‌کند. از اين رو يک چارچوب دقيق و داراي عموميت بالا که بتواند در سيستم‌هاي اينترنت اشيايي که محيط‌هاي اين نيروگاه‌ها را کنترل مي‌کنند به خوبي اجرا شود، مي‌تواند کمک شاياني در اين زمينه داشته باشد [2]. در اين پژوهش، يک چارچوب پيش‌بيني تابش خورشيدي با ويژگي‌هاي زير ارائه مي‌شود:

§ قابليت پياده‌سازي در سيستم‌هاي اينترنت اشيا با مصرف بهينه منابع

§ دقت و عموميت بالا

§ عدم وجود مشکل بيش برازش²

اهميت قابل‌توجه تحليل تابش خورشيدي حتي پيش از اينکه مدل‌هاي يادگيري ماشين در حوزه‌هاي مختلف علمي و مهندسي به طور گسترده به‌کار گرفته شوند، دانشمندان را بر آن داشت که مدل‎‌هايي براي تحليل اين پديده ارائه کنند. مدل انگستروم [3] و حالت ارتقا يافته‌ي آن يعني مدل انگستروم-پرسکات [4] را مي‌توان اولين تلاش‌ها در اين زمينه دانست. در طي ساليان متمادي، روش‌هاي متعدد ديگري بر مبناي همين پژوهش‌ها ارائه شد که برخي از آنها در منابع [5-7] قابل مشاهده هستند. اما آنچه براي ما به عنوان پيشينه اين پژوهش از اهميت بيشتري برخوردار است استفاده از روش‌هاي يادگيري ماشين در اين زمينه است که در ادامه به برخي از آن‌ها مي‌پردازيم. شبکه‌هاي عصبي مصنوعي و ساير روش‌‎هاي مبتني بر آن، پايه بسياري از پژوهش‌ها در اين زمينه قرار گرفتهاند. از جمله مليت و همکارانش در [2] يک مدل شبکه عصبي براي مدل‌سازي داده‌هاي تابش خورشيدي با کاربد سايزينگ سيستم فتوولتائيک ارائه کردهاند. همچنين، کائو و همکارانش در [8]، يک روش ترکيبي با استفاده از شبكه‌هاي عصبي مصنوعي و تحليل موجک را براي پيش‌بيني تابش خورشيدي در يک شبانه‌روز را توسعه‌ داده‌اند. داده‌هاي استفاده شده در اين تحقيق ديتاي تاريخي روزانه مقدار تابش است. در [9] نيز مدل شبكه‌هاي عصبي نوع ³LSTM براي پيش‌بيني اين پارامتر استفاده شده است با اين تفاوت که داده‌هاي مورد استفاده در آن داده‌هاي هواشناسي مانند دما، رطوبت و غيره است. روش متفاوتي در [10] براي پيش‌بيني نوسانات تابش ارائه شدهاست که بر تصويربرداري از آسمان مبتني است. بازه زماني پيش‌بيني در اين تحقيق 5 تا 10 دقيقه است و بر همين اساس، پيش‌بيني کوتاه مدت به شمار مي‌آيد. تكنيک يادگيري ماشيني که در اين تحقيق به كار رفته است، شبكه‌هاي عصبي کانولوشني عميق است. همچنين در [11] مدلي را براي پيش‌بيني تابش خورشيدي در بازه‌هاي کوتاه مدت معرفي شده است که مي‌تواند براي هر موقعيت جغرافيايي مورد استفاده قرار بگيرد، بدون اينكه به اندازه‌گيري‌هاي ميداني نياز داشته باشد. اين روش به جاي اينکه استفاده از اطلاعات ماهواره‌اي کند پيش‌بيني‌هاي هواشناسي را در قالب شبكه‌هاي عصبي عميق استفاده کردهاست. همچنين در رويکردي که در [12] پيشنهاد شده است، مدلي براي پيش‌بيني تابش با استفاده از شبكه‌هاي عصبي نوع کانولوشني ارائه شده است. داده‎هاي ورودي به صورت 15 حالت هواشناسي شامل ابري، نيمه‌ابري، صاف و غيره است که از داده‌هاي ايستگاه هواشناسي نمونه‌برداري مي‌شوند. به منظور بهينه‌سازي‌هاي ابرپارامترهاي شبكه‌ي عصبي پيشنهادي، از الگوريتم ترکيبي ⁴PSO/GA استفاده شدهاست که از اين جنبه شباهت بيشتري به پژوهش موجود دارد. ماشين بردار پشتيبان نيز در [13] به منظور مدل‌سازي و پيش‌بيني تابش در بازه‌هاي زماني 3 ساعته به کار گرفته شدهاست. اين پژوهش به طور خاص براي خانه‌هاي هوشمند که از انرژي خورشيدي استفاده مي‌کنند طراحي شده است و پارامتر‎هايي همچون دما، روز، سال، سرعت باد، پوشش ابر و غيره براي انجام پيش‌بيني مورد استفاده قرار گرفته‌اند.

در پژوهش‌هاي مشابه انجام شده که به مهم‌ترين آنها اشاره شد، عموما به دست آوردن يک مدل پيش‌بيني تابش خورشيدي با دقت بالا هدف قرار گرفته‌است. به همين دليل، هرچند مدل‌هاي دقيقي براي پيش‌بيني تابش خورشيدي به دست آمده است در بسياري از موارد فاقد تحليل‌هاي مربوط به عموميت مدل‌ها(بيش-برازش) هستند. از طرفي امکان عملي استفاده از مدل‌ها در سيستم‌هاي اينترنت اشياي در محيط نيروگاه‌هاي فتوولتائيک در مدلسازي در نظر گرفته نشده است. لذا در اين پژوهش سعي شده است که با انتخاب مدل مناسب و روش مناسب براي بهينه‌سازي مدل به دست آمده داراي سرعت و سهولت پياده‌سازي کافي براي استفاده در اين نوع محيط‌ها مدنظر قرار داده شود. به طور خلاصه در اين پژوهش، استفاده از روش‌هاي فرا ابتکاري به عنوان جنبه اصلي نوآوري، نه‌تنها براي به‌دست‌آوردن تنظيمات بهينه مدل‌هاي يادگيري ماشين بلکه به منظور کاهش اثر نويزها، داده‌هاي پرت و ورودي‌هاي کم‌اثر نيز به بهبود کيفيت خروجي نهايي مورد استفاده قرار گرفته است. علاوه بر اين، مناسب‌سازي نتايج پيش‌بيني براي استفاده عملي در محيط‌هاي نيروگاه‌هاي فتوولتائيک، که در اين پژوهش مورد توجه قرار گرفته است، جنبه‌ي نوآوري پراهميتي است. با استفاده از تابع برازش نوآورانه مورد استفاده در اين پژوهش براي بهينه‌سازي مدل‌ها، خروجي نهايي علاوه بر داشتن دقت بالا، از نظر سهولت پياده‌سازي در محيط‌هاي واقعي نيروگاه‌هاي فتوولتائيک نيز بهبود يافته است.

2-روش پیشنهادی

در اين پژوهش، هدف اصلي توسعه‌ي يک مدل دقيق براي پيش‌بيني تابش خورشيدي است که قابليت استفاده در اينترنت اشيا را دارد. لذا مدل‌هاي گروهي(تجميعي) مبتني بر درخت تصميم به عنوان پايه‌ي اصلي مدلسازي انتخاب شدند. دليل اين انتخاب تفسيرپذير بودن ذاتي روش‌هاي مبتني بر درخت است. اين روش‌ها در واقع از تعدادي درخت تصميم مختلف که در کنار يکديگر، يک مدل قوي‌تر را مي‌سازند، تشکيل مي‌شوند. در اين بخش ابتدا به معرفي بلوک‌هاي سازنده چارچوب اين پژوهش پرداخته مي‌شود و در پايان روش پيشنهادي ارائه مي‌شود.

2-1-پيش پردازش

پيش‌پردازش داده‌ها يک مرحله مهم در فرآيند يادگيري ماشين است که شامل تبديل و تهيه داده‌ها قبل از ورود به مدل يادگيري مي‌شود. دو فعاليت مهم اين مراحل مهم شامل حذف داده‌هاي پرت و نرمالسازي هستند. حذف داده‌هاي پرت به منظور حذف داده‌هاي نامناسب، نادرست يا غيرعادي استفاده مي‌شود. اين داده‌ها ممکن است ناقص يا با مقادير غيرمنطقي باشند و ممکن است تحت تأثير خطاهاي اندازه‌گيري، نويزهاي تصادفي يا خطاهاي ديگر قرار گرفته باشند. حذف اين داده‌ها مي‌تواند باعث بهبود کيفيت داده‌ها و دقت مدل يادگيري شود، زيرا داده‌هاي پرت ممکن است در تصميم‌گيري مدل تأثير منفي داشته باشند [8].

نرمالسازي داده‌ها به منظور قرار دادن داده‌ها در يک مقياس يکسان و قابل مقايسه استفاده مي‌شود. اين فرآيند معمولاً با استفاده از روش‌هاي مختلف مانند مقياس‌بندي، زيرگروه‌بندي يا تبديلات رياضي انجام مي‌شود. با نرمالسازي داده‌ها، واحدهاي مختلف و مقياس‌هاي متفاوت داده‌ها به يک مقياس مشترک تبديل مي‌شوند. اين موضوع باعث مي‌شود که مدل‌هاي يادگيري ماشين بتوانند به‌خوبي الگوها و روابط بين داده‌ها را درک کنند و عملکرد بهتري در پيش‌بيني و تصميم‌گيري داشته باشند [14].

2-2-درخت تصميم

مدل درخت تصميم يک الگوريتم يادگيري ماشين است که براي مسائل طبقه‌بندي و پيش‌بيني استفاده مي‌شود. اين مدل بر اساس يک ساختار درختي تصميم‌گيري ساخته مي‌شود و به صورت سلسله مراتبي قواعد و شرايط را بررسي مي‌کند تا به تصميمات نهايي برسد. در مدل درخت تصميم، هر گره از درخت نمايانگر يک ويژگي است که به‌ عنوان يک شرط بر روي داده‌ها بررسي مي‌شود. با توجه به مقدار ويژگي در داده‌ها، درخت به شاخه‌هاي مختلف تقسيم مي‌شود [15]هر شاخه از درخت نمايانگر يک مقدار ممکن براي ويژگي و يا يک مجموعه از مقادير است. در نهايت، برگ‌ها (گره‌هاي پاياني درخت که فاقد گره‌هاي فرزند هستند) نمايانگر کلاس‌هاي طبقه‌بندي شده يا مقدار پيوسته پيش‌بيني شده براي داده‌ها هستند. مزيت اصلي مدل درخت تصميم اين است که آن راحت قابل فهم و تفسير است و همچنين مي‌تواند به صورت مجموعه‌اي از قوانين بيان شود. به علاوه، درخت تصميم قابليت کاربرد در داده‌هاي عددي و دسته‌اي را دارد و به خوبي با داده‌هاي کم‌کاربرد يا ناقص سازگاري دارد. در کل، مدل درخت تصميم به عنوان يک ابزار قوي در يادگيري ماشين مورد استفاده قرار مي‌گيرد که قابليت طبقه‌بندي و پيش‌بيني دقيق را در مسائل مختلف ارائه مي‌دهد [16].

2-3-جنگل تصادفي

مدل جنگل تصادفي يک الگوريتم يادگيري ماشين است که بر پايه ترکيب چندين درخت تصميم ساخته مي‌شود. اين مدل از ترکيب تصميم‌هاي گوناگون چندين درخت تصميم بهره مي‌برد تا بهترين و تصميم‌هاي قابل اطمينان‌تري را در مورد داده‌ها ارائه دهد. در مدل جنگل تصادفي، هر درخت تصميم به صورت مستقل ساخته مي‌شود. اين درخت‌ها بر اساس تصادفي‌سازي در فرآيند ساخت شاخه‌بندي مورد استفاده قرار مي‌گيرند. به عبارت ديگر، در هر مرحله از ساخت درخت، فقط يک زيرمجموعه تصادفي از ويژگي‌ها براي تقسيم داده‌ها استفاده مي‌شود. اين عمل تصادفي باعث ايجاد تنوع در درخت‌ها مي‌شود و از بيش‌برازش جلوگيري مي‌کند. در نهايت، تصميم نهايي مدل جنگل تصادفي بر اساس آرايه‌اي از تصميم‌هاي هر درخت تصميم درخت مي‌شود. با ترکيب نتايج چندين درخت، مدل جنگل تصادفي قادر است به صورت همزمان بر روي داده‌هاي آموزش و داده‌هاي تست پيش‌بيني دقيقي ارائه دهد.

مزيت اصلي مدل جنگل تصادفي اين است که از توانايي کاهش واريانس و بيش‌برازش در مدل‌هاي تصميم‌گيري تک درخت استفاده مي‌کند. همچنين، اين مدل قابليت مقابله با داده‌هاي پرت، توانايي برخورد با داده‌هاي بزرگ، و قابليت استخراج اهميت ويژگي‌ها را داراست [17].

2-4-ادابوست

مدل ادابوست يک الگوريتم يادگيري ماشين مبتني بر مجموعه‌هاي ضعيف است که با استفاده از ترکيب آن‌ها يک مدل قوي‌تر و دقيق‌تر را ايجاد مي‌کند. ايده اصلي اين الگوريتم اين است که ترکيب چندين تصميم‌گيري ضعيف به وسيله وزن‌دهي به هر يک از آن‌ها، منجر به ساخت يک تصميم‌گيري قوي مي‌شود [18]. در مدل ادابوست، درخت‌هاي تصميم به عنوان تصميم‌گيري‌هاي ضعيف مورد استفاده قرار مي‌گيرند. ابتدا هر درخت تصميم با استفاده از مجموعه داده‌هاي آموزش ساخته مي‌شود. سپس به هر داده‌ي آموزشي وزني اختصاص داده مي‌شود و درخت با استفاده از اين وزن‌ها آموزش داده مي‌شود. در اين مرحله، تمرکز بر داده‌هايي که به درستي تشخيص داده نشده‌اند، بيشتر مي‌شود. سپس درخت تصميم نهايي با توجه به وزن‌هاي داده‌ها ساخته مي‌شود. درخت‌هايي که توانستند داده‌هاي نادرست را به خوبي تشخيص دهند، وزن بيشتري در ادامه فرآيند اختصاص مي‌دهند. اين روند تکرار مي‌شود و در هر مرحله، درختي جديد با توجه به وزن‌هاي جديد ساخته مي‌شود. در نهايت، تمام درخت‌هاي ساخته شده با استفاده از روش اجماع ترکيب مي‌شوند تا مدل نهايي ادابوست به دست آيد. اين مدل، با توجه به وزن‌هاي اختصاص داده شده به هر درخت، تصميماتي را اتخاذ مي‌کند که به دقت بيشتري در پيش‌بيني و تصميم‌گيري مي‌انجامد. در واقع، اين وزن‌ها به مدل اجازه مي‌دهند تا در تصميم‌گيري بيشترين تأثير را داشته باشند. به عبارت ديگر، درخت‌هايي که در تشخيص داده‌هاي پيچيده و دشوار موفقيت بيشتري دارند، نقش مهمتري در تصميم‌گيري نهايي دارند.

مزيت اصلي مدل ادابوست اين است که با ترکيب چندين درخت تصميم ضعيف، يک مدل قوي‌تر و مقاوم‌تر در برابر بيش‌برازش ايجاد مي‌کند. همچنين، با تمرکز بر داده‌هايي که توسط درخت‌هاي قبلي اشتباه تشخيص داده شده‌اند، مدل توانايي بهبود دقت و عملکرد خود را افزايش مي‌دهد. اين الگوريتم قابليت استفاده در مسائل دسته‌بندي و رگرسيون را دارد و در بسياري از موارد با عملکرد برتر نسبت به الگوريتم‌هاي تک درخت مانند درخت تصميم استفاده مي شود [19].

2-5-روش پيشنهادي

در اينجا از دو روش جنگل تصادفي(که در آن تعدادي درخت تصميم به صورت مستقل از هم پيش‌بيني را انجام مي‌دهند و در مدل نهايي نتايج آن‌ها با هم ترکيب مي‌شود) و ادابوست (که در آن هر مدل درخت تصميم بر اساس داده‌هايي که در مراحل قبل با خطاي بالا پيش بيني شدهاست توسعه مي‌يابد) استفاده مي‌کنيم. اما از آنجايي که اين مدل‌ها خود داراي ابر-پارامترهايي هستند که مقدار آن‌ها تاثير مستقيمي در نتيجه نهايي دارد، انتخاب اين پارامترهاي حياتي و همچنين انتخاب ويژگي‌ها (ورودي‌ها) و نمونه‌‌هاي مورد استفاده در مرحله‌ي آموزش از اهميت خاصي برخوردار است. به عنوان جنبه‌ي اصلي نوآوري، در اين پژوهش بر مبناي ايده‌ي مطرح شده در [18] براي بهينه‌سازي اين موارد از الگوريتم فراابتکاري خفاش [20] استفاده شده است که همانند الگوريتم ژنتيک يک الگوريتم الهام گرفته شده از طبيعت است و براي مسائل بهينه‌سازي بسيار پرکاربرد است. در ادامه به توضيح جزئيات روش پيشنهادي که معماري کلي آن در شکل 2 نمايش داده شده است، مي‌پردازيم.

يکي از اولين اقدامات در هر مساله يادگيري نظارت‌شده، پيش‌پردازش است. در اينجا در مرحله پيش‌پردازش ابتدا داده‌هاي پرت شناسايي و حذف مي‌شوند. به اين منظور از روش فاصله‌ي کوک [21] استفاده مي‌شود. به علاوه در اين مرحله عمل نرمالسازي داده‌ها نيز انجام مي‌شود، عدم نرمالسازي ورودي‌ها مي‌تواند باعث شود که ويژگي‌هايي که بازه‌ي تغيير گسترده‌تري دارند تاثير زيادي در مدل‌نهايي به صورت غير عادي ايفا کرده و از دقت مدل بکاهد. لذا مقادير همه ورودي‌ها در اين مرحله نرمالسازي مي‌شوند. در آخرين فعاليت از مراحل پيش‌پردازش، داده‌ها به دو زير مجموعه داده‌هاي آموزش و داده‌هاي تست تقسيم مي‌شوند. از آنجايي که داده‌هاي تست براي آزمايش و محاسبه‌ي معيارهاي مختلف در مدل‌هاي توليد شده مورد استفاده قرار مي‌گيرند و در مرحله آموزش نقشي ندارد، تعداد اين داده‌ها بايد محدود و بسيار کوچکتر از داده‌هاي آموزش باشد. لذا اين تقسيم با نسبت 9 به 1 انجام مي‌پذيرد و صرفا 10 درصد از داده‌ها به صورت تصادفي به عنوان داده‌هاي تست انتخاب مي‌شوند.

شکل 2: معماري کلي روش پيشنهادي

پس از پيش‌پردازش، نوبت به فعاليت‌هاي سه‌گانه‌اي مي‌رسد که تحت عنوان کلي انتخاب مدل شناخته مي‌شوند. اما اين فعاليت‌ها صرفا شامل انتخاب يک الگوريتم براي انجام مدلسازي نيستند. در اين پژوهش انتخاب الگوريتم مورد استفاده (يکي از دو الگوريتم جنگل تصادفي و ادابوست که پيش‌تر ذکر شد)، انتخاب مقادير ابرپارامترها و انتخاب نمونه‌ها و ويژگي‌هاي مورد استفاده در اين مرحله انجام مي‌پذيرد. در واقع اگر هر ترکيب از مواردي که ذکر شد را به عنوان يک راه‌حل در نظر بگيريم اين راه‌حل يک آرايه عددي است که اولين عنصر آن الگوريتم مورد استفاده را به صورت 0 و 1 مشخص مي‌کند. سپس 5 عنصر بعدي مقادير ابرپارامترها را مشخص مي‌کند. اين ابرپارامترها عبارتند از:

§ تعداد درخت تصميم(مدل‌هاي پايه)

§ حداکثر عمق درخت تصميم

§ حداکثر تعداد ويژگي مورد بررسي در هر گره از درخت تصميم

§ تعداد نمونه لازم براي تشکيل يک انشعاب در درخت تصميم

§ نرخ يادگيري(براي ادابوست)

ساير عناصر يک راه‎حل نيز حضور/عدم حضور ويژگي‌ها و نمونه‌هاي موجود در مجموعه ‌داده هاي آموزش را براي الگوريتم مشخص مي‌کند. بنابراين با هر يک راه‌حل که در بالا توضيح داده شد مي‌توانيم يک مدل کامل بسازيم که بر اساس مقادير موجود در آرايه ذکر شده پيکره‌بندي شدهاست. با اين توضيحات در واقع ما يک مساله بهينه‌سازي داريم که با روش‌هاي تکاملي و فراابتکاري قابل حل است. در اينجا ما الگوريتم خفاش را انتخاب کرده‌ايم. انگيزه‌ي اين انتخاب همگرايي سريع اين الگوريتم است.

از آنجايي که در مدل نهايي به دست آمده از اين پژوهش بايد علاوه بر دقت پيش‌بيني بالا، تا جاي ممکن از پيچيدگي کمي برخوردار باشد. لذا در مقايسه ترکيب‌هاي مختلف با يکديگر علاوه بر پارامتر دقت مدل بايد تعداد درخت تصميم و حدکثر عمق درخت را نيز مورد بررسي قرار دهيم. به دست آوردن نوعي تعادل بين دقت مدل و پيچيدگي آن باعث مي‌شود مدل نهايي از نظر مصرف منابع محاسباتي در زمان پياده‌سازي در اين اينترنت اشياء بهينگي بيشتري داشته باشد. به بيان ديگر، داشتن مدلي که علاوه بر دقت بالا داراي پيچيدگي بهينه نيز باشد هدف قابليت پيادهسازي در سيستم‌هاي کنترلي مبتني بر اينترنت اشيا را تامين مي‌کند. بر همين اساس، تابع برازش را با استفاده از امتياز R2 که نمايانگر دقت مدل است و تعداد درخت تصميم و حداکثر عمق که پيچيدگي مدل را نشان مي‌دهند، اينگونه تعريف مي‌کنيم:

(1)

(2)

در معادلات فوق n تعداد کل نقاط داده را مشخص مي‌کند، t مقدار اندازه‌گيري شده (مقدار مورد انتظار) را نشان مي‌دهد و o مقدار پيش‌بيني شده توسط مدل را مشخص مي‌کند.

پس از انجام بهينه‌سازي، يک مدل نهايي به‌دست مي‌آيد که بهترين و دقيق‌ترين پيش‌بيني را از ميان راه‌حل ‌هاي مختلف توليد شده انجام مي‌دهد. در اين مرحله با توجه به اينکه هر درخت تصميم (مدل پايه‌ي روش‌هاي مورد استفاده) مي‌تواند به صورت مجموعه‌اي از قوانين بيان شود، مي‌توانيم قوانين همه‌ي درخت‌هاي توليد شده توسط مدل نهايي را استخراج کرده و مجموعه‌ قوانين از پيش تعيين شدهاي را براي استفاده در محيط اينترنت اشياء داشته باشيم. اين قوانين با توجه به اينکه ثابت بوده و نيازي به تغيير منظم و مدلسازي در سمت گره‌هاي اينترنت اشيا نيست. بنابراين سربار اضافي نيز براي پيش بيني تابش خورشيد اعمال نمي‌شود.

با توجه به امکان استخراج قوانين در روش پيشنهادي، اين مدل به صورت خودکار براي تشخيص آفلاين تابش به کار مي‌رود و مي‌تواند در برابر شکست بستر مخابراتي و قطعي ارتباطات کمک کننده باشد. در واقع با اين روش، قوانين پيشبيني‌کننده مي‌تواند جايگزين توسعه تکراري مدل‌ها شده و اين مي‌تواند به بهبود قابل توجه ارتباطات و کاهش ريسک ناشي از قطعي ارتباطات در برابر شکست بستر مخابراتي منجر شود.

2-6-مجموعه داده ها و روش ارزيابي

به منظور آزمايش روش ‌پيشنهادي که در بخش قبل بيان شد، مجموعه ‌داده‌هاي ارائه شده در يکي از چالش‌هاي ناسا در پيش‌بيني شدت تابش در نظر گرفته شده است که در تعدادي از کارهاي مشابه مانند [22] استفاده شده است. اين مجموعه ‌داده‌ها مشتمل بر بيش از 30 هزار بردار داده است که داراي 11 ستون (ويژگي) مختلف است و در اکثر پژوهش‌هاي اخير به عنوان يک مجموعه‌ دادهاي استاندارد به منظور مقايسه روش‌ها استفاده شده است. در اين پژوهش ويژگي‌هاي مربوط به تاريخ و زمان ثبت رکورد مربوط حذف شده‌اند تا مدلسازي صرفا بر اساس پارامترهاي آب و هوايي ديگر انجام شود. در نهايت خروجي هدف مقدار تابش و ورودي‌هاي مدلسازي عبارتند از:

§ دما

§ فشار

§ رطوبت هوا

§ جهت باد

§ سرعت باد

تحليل ضرايب همبستگي پيرسون پارامترهاي ورودي و خروجي در شکل 3 نمايش داده شده است. از اين نمودار مي‌توانيم نتيجه بگيريم که هيچ رابطه کاملا خطي بين مقادير پارامترها وجود ندارد. لذا با توجه به اينکه تعداد پارامترها به نسبت کم است، مي‌توانيم نيازي به حذف هيچکدام از ورودي‌ها احساس نمي‌شود. هرچند در ادامه در فعاليت انتخاب ويژگي ممکن است بعضي از اين ويژگي‌ها حذف شوند اما در اينجا از هيچيک از ورودي‌ها صرف نظر نمي‌کنيم.

شکل 3: تحليل همبستگي پيرسون

شکل 4: تحليل دادههاي پرت با روش فاصله کوک

3-نتایج‌ شبیه سازی

در اين بخش نتايج روش پيشنهادي که به کمک زبان برنامه‌نويسي پايتون پيادهسازي شده است بررسي مي‌کنيم. در مرحله پيش‌پردازش تحليل کوک همانطور که در بخش روش پيشنهادي گفته شد انجام شده که نتايج آن در شکل 4 نمايش داده شده است. بر اين اساس 2/7 درصد از داده‌ها به عنوان داده پرت تشخيص داده شد و از مرحله آموزش مدل‌ها کنار گذاشته شد.

بعد از حذف داده‌هاي پرت، بر مبناي آنچه در روش پيشنهادي بيان شد با اجراي تکرارهاي الگوريتم خفاش، بهترين پيکره‌بندي براي پيش‌بيني شدت تابش به دست آمد. خروجي نهايي اين بهينه‌سازي مدل جنگل تصادفي با ابرپارامترهاي نمايش داده شده در جدول 1 است.

جدول 1: پارامترهاي مدل نهايي

نمونه لازم براي انشعاب	حداکثر تعداد ويژگي	حداکثر عمق	تعداد درخت تصميم	ابر پارامتر
32	4	25	89	مقدار

مدل نهايي به دست آمده داراي امتياز R2 معادل 956/0 در مرحله آموزش و 948/0 براي داده‌هاي تست است که نشان‌دهنده‌ي يک دقت قابل قبول براي پيش‌بيني شدت تابش است. لازم به ذکر است که در تکرارهاي الگوريتم بهينه‌سازي تعدادي از مدل‌هاي کانديد دقت بالاتري نيز از خود نشان دادند اما با توجه به اينکه فاصله دقت آموزش و تست در آنها قابل توجه بود(بيش برازش) و يا مدل پيچيدگي بالايي داشت(تعداد بالاي درخت تصميم)، اين مدل‌ها با توجه به تابع برازشي که در اين پژوهش تعريف کرده‌ايم به عنوان خروجي نهايي بهينه‌سازي انتخاب نشدند.

مدل نهايي جنگل تصادفي به دست آمده در اين پژوهش داراي حداکثر عمق 25 و تعداد درخت 89 است، بنابراين استخراج همه‌ي قوانين براي پيش‌بيني شدت تابش به تعداد محدودي قانون منجر شده و مي‌تواند به صورت آفلاين و مستقر در حافظه در دستگاه‌‎هاي اينترنت اشياء مورد استفاده قرار گيرد.

همچنين به منظور اعتبارسنجي مدل نهايي از روش k-fold استفاده شد. این روش به کمک تقسيم داده‌ها به k بخش، هر بار يکي از بخش‌ها را به عنوان داده‌هاي اعتبارسنجي و بقيه بخش‌ها را به عنوان داده‌هاي آموزش استفاده کرده و مدل را با استفاده از داده‌هاي آموزش آموزش داده و عملکرد آن را با داده‌هاي اعتبارسنجي ارزيابي مي‌کند. اين فرايند را k بار (در اینجا k=10) تکرار مي‌کند و در هر مرحله، بخش‌هاي ديگر را به عنوان داده‌هاي آموزش و اعتبارسنجي استفاده مي‌کند. سپس عملکرد مدل در هر بار تکرار، ميانگين شده و به عنوان عملکرد نهايي مدل گزارش مي‌شود. اين روش اعتبارسنجي مدل را بهبود مي‌بخشد و به دقت و استنباط قوي‌تري از عملکرد مدل در مواجهه با داده‌هاي تست مي‌انجامد. نتيجه اين الگوريتم اعتبارسنجي در مدل نهايي نشان دهنده انحراف معيار 00148/0 در شاخص R2 است. اين عدد نشان مي‌دهد که مدل به دست آمده از عموميت بالايي برخوردار است.

جدول 2: مقايسه با روش‌هاي موجود

انحراف معیار R2 در 10 تکرار	ميانگين امتياز R2 در 10 تکرار	روش
00148/0	956/0	روش پيشنهادي
00942/0	948/0	شبكه‌هاي عصبي مصنوعي [2]
01240/0	893/0	شبكه‌هاي عصبي مصنوعي و تحليل موجک [3]
01107/0	941/0	LSTM [9]
09849/0	971/0	شبكه‌هاي عصبي کانولوشني [11]
00144/0	939/0	شبكه‌ي عصبي و الگوريتم ترکيبي PSO/GA [12]
00166/0	921/0	ماشين بردار پشتيبان [13]

همچنين برخي ديگر از روش‌هاي ارائه شده بر روي داده‌هاي مشابه مورد آزمايش قرار گرفتند که مقايسه آن‌ها با روش پيشنهادي در جدول 2 نمايش داده شده و نشان‌دهنده اين واقعيت است که روش پيشنهادي علي‌رغم بهينه‌سازي براي حفظ سادگي مدل نهايي در بدترين حالت مشابه روش‌هاي موجود عمل کرده و در بسياري از موارد از اين روش‌ها دقيق تر است.

در این مقایسه، تنها در یک مورد امتیاز روش پیشنهادی از سایر روش‌ها بر روی مجموعه‌داده مشابه کمتر است که با توجه انحراف معیار کمتر و همچنین سادگی بیشتر مدل بهینگی روش پیشنهادی قابل توجیه است.

لازم به ذکر است که با توجه به يکسان نبودن مجموعه داده‌ها و همچنين معيارهاي ارزيابي گزارش شده در پژوهش‌هاي موجود، اين روش‌ها مجددا بر اساس پارامترهاي موجود در مقالات مربوط پياده‌سازي شده و نتايج بر مجموعه داده‌هاي مشابه در اين جدول گزارش شده است.

4-نتیجهگیری

در اين پژوهش، يک روش مبتني بر درخت تصميم به منظور پيش‌بيني شدت تابش ارائه شدهاست. روش پيش‌بيني با استفاده از الگوريتم فرا ابتکاري خفاش با منظور حفظ تعادل ميان دقت مدل و سادگي و قابليت پياده‌سازي آن در دستگاه‌هاي اينترنت اشياء بهينه‌سازي شدهاست. در نهايت به يک مدل قوي که با معيار مربع-R داراي امتياز 95/0 است و همچنين از نظر سادگي مدل گروهي تا حدود زيادي بهينه است، به دست آمد. لذا از روش پيشنهادي مي‌توان به منظور ساختن مدل‌هاي آفلاين در محيط هاي نيروگاه‌هاي فتوولتائيک که با اينترنت اشياء مديريت مي‌شوند استفاده کرد. آنچه به‌عنوان آينده‌ي اين روش پيشنهادي به منظور بهبود و گسترش نتايج آن مي‌توان بيان نمود عبارتند از: ارائه يک معماري جامع اينترنت اشياء براي نيروگاه‌هاي فتوولتائيک بر مبناي مدل ارائه شده در اين پژوهش، ارائه يک مکانيزم هرس و بهينه‌سازي براي قوانين استخراج شده از مدل‌هاي مبتني بر درخت و توسعه يک مجموعه‌ داده‌هاي بومي از پارامترهاي هواشناسي داخلي به منظور استفاده به عنوان ورودي روش پيشنهادي که مي‌تواند کارآيي مدل را براي نيروگاه‌هاي داخلي افزايش دهد.

مراجع

[1] N. M. Kumar, K. Atluri and S. Palaparthi, “Internet of Things (IoT) in Photovoltaic Systems,”2018 National Power Engineering Conference (NPEC), 2018, pp. 1-4, doi: 10.1109/NPEC.2018.8476807.

[2] A. Mellit, M. Menghanem and M. Bendekhis, “Artificial neural network model for prediction solar radiation data: application for sizing stand-alone photovoltaic power system,” IEEE Power Engineering Society General Meeting, 2005, San Francisco, CA, USA, 2005, pp. 40-44 Vol. 1, doi: 10.1109/PES.2005.1489526.

[3] A.Angstrom, “Solar and terrestrial radiation: Report to the international commission for solar research on actinometric investigations of solar and atmospheric radiation,” Quarterly Journal of the Royal Meteorological Society, 1924, pp. 121-126, doi:10.1002/qj.49705021008.

[4] J.Prescott,“Evaporation from a water surface in relation to solar radiation,”Transactions of the Royal Society of South Australia,vol. 64, pp 114-118, 1940, doi: 10.4236/epe.2017.912045.

[5] A. A. Trabea and M.M. Shaltout, “Correlation of global solar radiation with meteorological parameters over Egypt,”Renewable Energy, vol. 21, pp. 297-308, Oct. 2000, doi:10.1016/S0960-1481(99)00127-5.

[6] D.Yeboah-Amankwah and K.Agyeman, “Differential Ångstrom model for predicting insolation from hours of sunshine,”Solar Energy, vol. 45, pp. 371-377, 1990, doi:10.1016/0038-092X(90)90158-9.

[7] H.Ninomiya, “Study on application of amedas meteorological data to the simulation of building heat environment,” University of Tokyo, 1994.

[8] J.C.Cao and S.H.Cao, “Study of forecasting solar irradiance using neural networks with preprocessing sample data by wavelet analysis,” Energy, vol. 31, pp. 3435-3445, Dec. 2006, doi: 10.1016/j.energy.2006.04.001.

[9] X. Qing and Y. Niu, “Hourly day-ahead solar irradiance prediction using weather forecasts by LSTM,”Energy, vol. 148, pp. 461-468, Apr. 2018, doi: 10.1016/j.energy.2018.01.177.

[10] D.Pothineni, M.R.Oswald, J.Poland and M. Pollefeys,“KloudNet: Deep Learning for Sky Image Analysis and Irradiance Forecasting,”In: Brox, T., Bruhn, A., Fritz, M. (eds) Pattern Recognition. GCPR 2018. Lecture Notes in Computer Science(2019)-Springer, vol. 11269, doi:10.1007/978-3-030-12939-2_37.

[11] J. Lago, K. D. Brabandere, F. D. Ridder and B. D. Schuttera, “Short-term forecasting of solar irradiance without local telemetry: A generalized model using satellite data,” SolarEnergy, vol. 173, pp. 566-577, Oct. 2018, doi: 10.1016/j.solener.2018.07.050.

[12] N. Dong, J.F.Chang, A. G. Wu and Z. K. Gao, “A novel convolutional neural network framework based solar irradiance prediction method,” International Journal of Electrical Power & Energy Systems, vol. 114, pp. 1-19, Jan. 2020, doi: 10.1016/j.ijepes.2019.105411.

[13] N. Sharma, P. Sharma, D. Irwin and P. Shenoy, “Predicting solar generation from weather forecasts using machine learning,”2011 IEEE International Conference on Smart Grid Communications (SmartGridComm), 2011, pp. 528-533, doi: 10.1109/SmartGridComm.2011.6102379.

[14] P. J. M. Ali, and R. H. Faraj, “Data normalization and standardization: a technical report,” Mach. Learn. Tech. Rep., vol. 1, no. 1, pp. 1-6, 2014, doi: 10.13140/RG.2.2.28948.04489.

[15] Y.-Y. Song and L. Ying, “Decision tree methods: applications for classification and prediction,” Shanghai archives of psychiatry, vol. 27, no. 2, pp. 130-135, Apr. 2015, doi: 10.11919/j.issn.1002-0829.215044.

[16] N. Bhargava, G. Sharma, R. Bhargava, and M. Mathuria, “Decision tree analysis on j48 algorithm for data mining,” Intrenational Journal of Advanced Research in Computer Science and Software Engineering, vol. 3, no. 6, 2013.

[17] Y. Li et al., “Random forest regression for online capacity estimation of lithium-ion batteries,” Applied energy, vol. 232, pp. 197-210, Dec. 2018, doi: 10.1016/j.apenergy.2018.09.182.

[18] R. Seyghaly, J. Garcia, X. Masip-Bruin and M. M. Varnamkhasti, “Interference Recognition for Fog Enabled IoT Architecture using a Novel Tree-based Method,”2022 IEEE International Conference on Omni-layer Intelligent Systems (COINS), 2022, pp. 1-6, doi: 10.1109/COINS54846.2022.9854944.

[19] D. P. Solomatine and D. L. Shrestha, “AdaBoost.RT: a boosting algorithm for regression problems,” 2004 IEEE International Joint Conference on Neural Networks (IEEE Cat. No.04CH37541), Budapest, Hungary, 2004, pp. 1163-1168 vol.2, doi: 10.1109/IJCNN.2004.1380102.

[20] X. S. Yang, “A New Metaheuristic Bat-Inspired Algorithm,”Nature Inspired Cooperative Strategies for Optimization (NICSO 2010), springer, pp. 65–74, 2010, doi: 10.1007/978-3-642-12538-6_6.

[21] M.Banerjee, “Cook's distance in linear longitudinal models,” Communications in Statistics-Theory and Methods,vol 27, pp. 2973-2983, 1998, doi: 10.1080/03610929808832267.

[22] E. -S. M. El-Kenawy et al., “Advanced Ensemble Model for Solar Radiation Forecasting Using Sine Cosine Algorithm and Newton’s Laws,” in IEEE Access, vol. 9, pp. 115750-115765, 2021, doi: 10.1109/ACCESS.2021.3106233.

Optimizing Solar Radiation Prediction Based on The Internet of Things Platform in Photovoltaic Power Plant

Abstract

Received:

Revised:

Accepted:

The solar radiation value parameter is one of the most important parameters in determining the output power value of photovoltaic panels. Accurate prediction of this parameter is of special importance for planning in dispatching and load management units. Uncertainty in the amount of solar radiation and the difficulty of predicting it, managers and designers face economic and managerial challenges. In this research, a prediction method with high accuracy and generality is presented using tree-based methods and improving the performance of these methods with the help of meta-heuristic algorithms. The main emphasis in the proposed method is the lack of over-fitting and high reliability the ability to be used in Internet of Things systems. Meta-heuristic algorithms have been used not only in the optimization of tree-based methods, also in feature selection and instance selection. The use of meta-heuristic methods as the main innovative aspect of this research, not only to obtain the optimal settings of machine learning models, but also to reduce the effect of noises, outliers and low-effective inputs, has helped to improve the quality of the final output. Aadapting the prediction which is considered in this research which was done through innovative fitting function of this research in the optimization of models, makes the final output to be optimal in addition to high accuracy in terms of ease of implementation in the real environments of photovoltaic power plants. The final output is a strong model that has a score of 0.95 with the R-square criterion and is optimal model.

Keywords: Internet of Things, Decision Tree, Machine Learning, Bat Algorithm, Photovoltaic Power Plants

[1] Internet of Things

[2] Overfitting

[3] Long-Short Term Memory

[4] Particle Swarm Optimization/Genetic Algorithm

شارک

عنوان URL للمقالة

بهینه‌سازی پیش‌بینی تابش خورشیدی بر اساس بستر اینترنت اشیاء در نیروگاه فوتولتائیک

سند

الروابط

المراكز ذات الصلة

دعامة

الصفحات الرسمية