اطلاعات پایان نامه
شماره شناسایی : 39304724
نام و نام خانوادگی : شهزادالسادات اوليايي
عنوان پایان نامه : بهبود حاشیه‌نویسی تصاویر پزشکی با استفاده از روش خوشه‌بندی ترکیبی در ساخت مدل کیف کلمات بصری
رشته تحصیلی : مهندسي كامپيوتر-هوش مصنوعي
مقطع تحصیلی : كارشناسي ارشد
استاد راهنما : فرساد زماني
استاد مشاور :
چکیده : به فرآیند تولید و انتساب کلمات متناسب با تصاویر، فرآیند حاشیه‌نویسی گفته می‌شود. تکنیک‌های حاشیه‌نویسی با توجه به حوزه کاربردی آن‌ها متفاوت می‌باشند، اما وجه اشتراک بین کلیه آن‌ها، انتساب کلمات مناسب به تصاویر با حداکثر صحت می‌باشد. برای رسیدن به صحت مطلوب در فرآیند حاشیه‌نویسی، تاکنون مطالعات بسیاری انجام شده و تکنیک‌های مختلفی معرفی شده ‌است. روش‌های حاشیه‌نویسی مبتنی بر یادگیری ماشین از متداولترین روشها هستند. مشکل اصلی این‌روش‌ها، استفاده از کلمات بصری با دقت پائین و بکارگیری تکنیک‌های خوشه‌بندی ساده و تک مرحله‌ای بوده که باعث کاهش کارآیی حاشیه‌نویسی می‌گردد. به‌علاوه، اغلب این‌روش‌ها از جمله روش شین و همکاران، ارائه شده در سال 2016، بدلیل ترکیب بردارهای ویژگی حاصل از چند توصیف‌گر و عدم بخش‌بندی این بردارها، با مشکل کاهش صحت و عدم کارایی در داده‌‌های بزرگ مواجه هستند. در این راستا برای رفع مشکل مذکور، در این پژوهش از ترکیب بردارهای ویژگی اجتناب شده و برای بخش‌بندی بردارهای ویژگی، از تکنیک کیف کلمات بصری مبتنی بر نوعی خوشه‌بندی ترکیبی استفاده شده است. در این‌روش برای افزایش دقت استخراج کلمات بصری، خوشه‌بندی آشیانه‌ای انجام شده و ریز‌خوشه‌هایی درون خوشه‌های ‌اصلی تشکیل شده و به این صورت هیستوگرام دقیق‌تری از تصاویر تولید شده است. در نهایت با استفاده از الگوریتم طبقه‌بندی k نزدیکترین همسایه، طبقه‌بندی و حاشیه‌نویسی تصاویر پزشکی صورت گرفته است. برای ارزیابی روش پیشنهادی، از مجموعه دادگان تصاویر پزشکی CLEF 2007 استفاده شده است. نتایج حاصل از اجرای مدل ارائه شده بر روی پایگاه داده فوق نشان می‌دهد که مدل حاشیه‌نویسی تصاویر پزشکی پیشنهاد شده، در مجموع 4 بخش از کد 13 کاراکتری IRMA، دارای 7/12‌% بهبود در مقایسه با روش پیشین می‌باشد.
کلمات کلیدی : حاشیه‌نویسی تصاویر, خوشه‌بندی ترکیبی, کیف کلمات بصری, ریز‌خوشه
تاریخ دفاع : 1397/08/03
دانلود فایل چکیده

About Proposal
Title : Improving Medical Image Annotation Using Cluster Ensemble for Bag-of-Visual-Words Model Generation
Abstract : The process of generating and assigning words tailored to images is called the image annotation process. Annotation techniques vary given their field of application, but the common aspect between all of them is the assignment of appropriate words to images with the highest accuracy. So far, a lot of studies have been conducted and various techniques have been introduced in order to obtain the desirable accuracy in the process of image annotation. Machine learning -based annotation methods are among the most common methods. The main problem with these methods is the use of visual words with low accuracy and the use of simple and single-stage clustering techniques which lead to the reduced efficiency of annotation. Additionally, most of these methods, namely Shin et al.'s method presented in 2016, are exposed to the problem of reduced accuracy and inefficiency in big data due to the combination of feature vectors from several descriptors and lack of segmentation of these vectors. Accordingly, in order to resolve the mentioned problem in this research, we avoided combining feature vectors and used the bag-of-visual-words technique based on a combined clustering type for feature vectors segmentation. In this method, nest clustering was performed to increase the accuracy of visual words extraction and sub-clusters were formed inside main clusters and a more accurate histogram was generated from images. Finally, using the k- nearest neighbors clustering algorithm, clustering and annotation of medical images have been done. In order to assess the proposed method, Medical ImageCLEF 2007 dataset was used. Results obtained from the implementation of the proposed model on the above mentioned dataset show that the suggested medical images annotation model in the total four segments of 13-character IRMA code has improved by 12.7% compared to the previous method.
Keywords : Images annotation, Ensemble clustering, Bag-of-visual-words, Micro cluster
Download Abstract File