یک چارچوب جدید آشکارسازی و تشخیص لوگو در تصاویر متنی
محورهای موضوعی : انرژی های تجدیدپذیرحسین پورقاسم 1 , امیر سالار جعفرپیشه 2
1 - استادیار/دانشگاه آزاد اسلامی واحد نجف آباد
2 - دانشجوی دکترا/دانشگاه علوم پزشکی تهران
کلید واژه: آشکارسازی و تشخیص لوگو, تصویر متنی, ناحیهبندی دومرحلهای, طبقهبندی سلسله مراتبی,
چکیده مقاله :
آشکارسازی و تشخیص لوگو یک بخش اساسی در یک سیستم خودکارسازی اداری جهت بایگانی و بازیابی تصاویر متنی میباشد. در این مقاله، ما یک چارچوب جدید آشکارسازی و تشخیص لوگو مبتنی بر یک استراتژی ناحیهبندی و طبقهبندی پشت سر هم در تصاویر متنی پیشنهاد میکنیم. در این چارچوب، با استفاده از یک الگوریتم ناحیهبندی دو مرحلهای (شامل الگوریتمهای ناحیهبندی مبتنی بر تبدیل ویولت و آستانهگذاری) و طبقهبندی سلسله مراتبی به وسیله دو طبقهبند شبکه عصبی پرسپترون چندلایه و یک طبقه بند نزدیکترین همسایگی، یک تصویر متنی به نواحی کاندیدای لوگو، عکسی خالص و متنی تقسیم بندی میگردد. سرانجام نیز در تصمیمگیری نهایی، کلاس لوگو کاندیدا بر اساس یک مجموعه از کلاسهای از پیش تعریفشدهای تعیین میگردد. در مرحله طبقهبندی و تشخیص سلسله مراتبی لوگو، بهترین مجموعه از ویژگیهای شکل و بافت به وسیله الگوریتم انتخاب ویژگی رو به جلو انتخاب میگردد. چارچوب پیشنهادی براساس یک پایگاه داده بزرگ و متنوع از تصاویر متنی و غیرمتنی و همچنین لوگوهای ایرانی و بینالمللی مورد ارزیابی قرار گرفت. نتایج حاصل کارایی و کارآمدی چارچوب پیشنهادی را در شرایط محیط پیادهسازی واقعی و عملی نشان میدهد.
Logo detection and recognition module is a vital requirement in official automation systems for document image archiving and retrieval applications. In this paper, we present a novel framework for logo detection and recognition based on sequential segmentation and classification strategy of document image. In this framework, using a two-stage segmentation algorithm (consisting of wavelet-based and threshold-based segmentation algorithms) and hierarchical classification by two multilayer Perceptron (MLP) classifiers and a k-nearest neighbor (KNN) classifier, a document image divides to text, pure picture and logo candidate regions. Ultimsately, in final decision, class of logo candidate region is determined based on pre-defined classes. In the hierarchical classification and logo recognition stages, the best feature space is selected by forward selection algorithm from a perfect set of texture and shape features. The proposed structure is evaluated on a variety and vast database consisting of the document and non-document images with Persian and international logos. The obtained results show efficiency of the proposed framework in the real and operational conditions.
_||_