ارائه یک الگوی پیش بینی فرار مالیاتی مشاغل مبتنی بر تکنیک های داده کاوی
محورهای موضوعی : آلودگی هوامحمد قاسمی 1 , صادق عابدی 2 , علی محتشمی 3
1 - دانشجوی دکتری ، گروه مدیریت صنعتی، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران
2 - استادیار، گروه مدیریت صنعتی، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران
3 - دانشیار، گروه مدیریت صنعتی، واحد قزوین، دانشگاه آزاد اسلامی، قزوین، ایران
کلید واژه: پیش بینی, درخت تصمیم, داده کاوی, فرار مالیاتی, مالیات اصناف,
چکیده مقاله :
در این پژوهش با توجه به اهمیت موضوع و خلای پژوهش های پیشین، یک مدل پیش بینی فرار مالیاتی اصناف مبتنی بر تکنیک های داده کاوی ارائه می گردد. داده های مورد تحلیل شامل بررسی 5600 پرونده مالیاتی کلیه اصناف دارای کد مالیاتی در استان قزوین طی سال های ۹۳ تا ۹۸ می باشد. پرونده مالیاتی مرتبط با اصناف در پنج گروه مالیاتی شامل گروه صنفی صاحبان دفاتر رسمی، گروه صنفی مشاورین املاک، گروه صنفی تالارهای پذیرایی، رستوران و مشاغل وابسته، گروه صنفی خدمات ارتباطی و گروه صنفی نمایشگاه و فروشگاه لوازم خودرویی و مشاغل وابسته می باشند. جهت مدل سازی از الگوی کلاس بندی شامل الگوریتم درخت تصمیم استفاده گردید. نتایج نشان می دهد، معیار پوشش برابر 68 %، معیار کاپا برابر 0.612 بدست آمده است که عملکرد خوب مدل ساز را نشان می دهد. همچنین با استفاده از تکنیک Cross Validation صحت اعتبار مدل پیش بینی مورد آزمون قرار گرفت تا با اطمینان بیشتری درصد عملکرد مدل سازی تخمین زده شود. معیار صحت برابر 67.79% نشان از قابلیت اطمینان مناسب جهت مدل پیش بینی می باشد. نتایج حاصل از این پژوهش می تواند در تدوین راهبردهای عملیاتی مبتنی بر داده کاوی جهت پیش بینی فرار مالیاتی اصناف در استان ها مورد بهره برداری قرار گیرد.
In this research, considering the importance of the topic and deficiency in previous researches, amodel for predicting tax evasion of guilds based on data mining technique is presented. Theanalyzed data includes the review of 5600 tax files of all guilds holding tax codes in Qazvinprovince during the years 2014-2019. The tax file related to guilds is in five tax groups includethe guild group of owners of notary public offices, the guild group of real estate agencies, theguild group of catering halls, restaurants and related businesses, the guild group ofcommunication services, and the guild group of exhibitions and auto accessories stores andrelated businesses. For modeling, the classification model including the decision tree algorithmwas used. The results indicate that the coverage criterion is 68%, the Kappa criterion is 0.612,which indicates the good performance of the modeler. Also, using the Cross Validationtechnique, the validity of the prediction model was tested in order to more reliably estimate thepercentage of modeling performance. The accuracy criterion equal to 67.79% shows theappropriate reliability for the prediction model. The results of this research can be utilized informulating operational strategies based on data mining to predict the tax evasion of guilds in theprovinces.
_||_