Quantitative structure–property relationship models to Predict some thermodynamic properties of Imidazole Derivatives using molecular descriptor and genetic algorithm-multiple linear regressions
محورهای موضوعی : Journal of Physical & Theoretical Chemistryshiva Moshayedi 1 , fatemeh shafiei 2 , Tahereh Momeni Isfahani 3
1 - Tarbiat Modares University, Department of Materials, Tehran, Iran
2 - Department of Chemistry, Science Faculty, Arak Branch, Islamic Azad University,
Arak, Iran
3 - Department of Chemistry, Arak Branch, Islamic Azad University, Arak, Iran
کلید واژه: leave-one-out (LOO) cross-validation, QSPR, genetic algorithm- multiple linear regressions, imidazole derivatives,
چکیده مقاله :
Imidazole is compound with a wide range of biological activities and imidazole derivatives are the basis of several groups of drugs.In this study the relationship between molecular descriptors and the thermal energy (Eth kJ/mol), and heat capacity (Cv J/mol) of imidazole derivatives is studied. The chemical structures of 85 Imidazole derivatives were optimized at HF/6-311G* level with Gaussian 98 software.Molecular descriptors were calculated for selected compound by using the Dragon software.The Genetic algorithm- multiple linear regression (GA-MLR) and backward methods were used to select the suitable descriptors and also for predicting the thermodynamic properties of imidazole derivatives.The obtained models were evaluated by statistical parameters, such as correlation coefficient (R2adj), Fisher ratio (F), Root Mean Square Error (RMSE), Durbin-Watson statistic (D) and significance (Sig).The predictive powers of the GA- MLR models are studied using leave-one-out (LOO) cross-validation and external test set. The predictive ability of the GA-MLR models with two-three selected molecular descriptors was found to be satisfactory. The developed QSPR models can be used to predict the property of compounds not yet synthesized.
ایمیدازول ترکیبی با طیف وسیعی از فعالیت های بیولوژیکی است و مشتقات ایمیدازول اساس چندین گروه از داروها هستند. در این مطالعه رابطه بین توصیفگرهای مولکولی و انرژی حرارتی (Eth kJ/mol) و ظرفیت حرارتی (Cv J/mol) مشتقات ایمیدازول مورد بررسی قرار گرفته است. ساختار شیمیایی 85 مشتق ایمیدازول در سطح HF/6-311G* با نرم افزار گاوسیان 98 بهینه شد. توصیفگرهای مولکولی برای ترکیبات انتخابی با استفاده از نرم افزار Dragon محاسبه شد. برای انتخاب توصیفگرهای مناسب و همچنین برای پیشبینی خواص ترمودینامیکی مشتقات ایمیدازول از الگوریتم ژنتیک-رگرسیون خطی چندگانه (GA-MLR) و روشهای رو به عقب استفاده شد. مدلهای بهدستآمده با پارامترهای آماری مانند ضریب همبستگی (R2adj)، نسبت فیشر (F)، ریشه میانگین مربعات خطا (RMSE)، آماره دوربین واتسون (D) و معنیداری (Sig) مورد ارزیابی قرار گرفتند. قدرت پیشبینی مدلهای GA-MLR با استفاده از اعتبارسنجی متقاطع ترک یک خروجی (LOO) و مجموعه تست خارجی مورد مطالعه قرار میگیرد. توانایی پیشبینی مدلهای GA-MLR با دو یا سه توصیفگر مولکولی منتخب رضایتبخش بود. مدلهای توسعهیافته QSPR میتوانند برای پیشبینی ویژگیهای ترکیباتی که هنوز سنتز نشدهاند استفاده شوند.