اطلاعات پایان نامه
شماره شناسایی : 39304822
نام و نام خانوادگی : فاطمه خردمند
عنوان پایان نامه : بهبود دقت طبقه بندی هدف پرسش با استفاده از ماشین بردار پشتیبان و شبکه معنایی
رشته تحصیلی : مهندسي كامپيوتر-هوش مصنوعي
مقطع تحصیلی : كارشناسي ارشد
استاد راهنما : حميد رستگاري
استاد مشاور :
چکیده : طبقه‌‌بندی‌‌ پرسش نقشی اساسی در سیستم‌‌های پرسش و پاسخ دارد. به طور کلی وظیفه این بخش، انتساب پرسش ورودی به کلاس‌‌هایی از پیش تعیین شده است. طبقه‌‌بندی‌‌ پرسش تاکنون با استفاده از الگوریتم‌‌های طبقه‌‌بندی یادگیری ماشین و یا ایجاد ساختارهای معنایی و مبتنی بر الگو انجام گرفته است. با توجه به اهمیت عملیات طبقه‌‌بندی پرسش در سیستم‌‌های پرسش و پاسخ، صحت و دقت نتایج به دست آمده در تحقیقات پیشین مطلوب نبوده و بهبود این نتایج همواره امری مورد توجه است. با بررسی روش‌‌های ارائه شده و نتایج آن می‌‌توان این گونه بیان کرد که طبقه‌‌بندی پرسش در دامنه باز اطلاعاتی به صورتی که زمینه و هدف پرسش درنظر گرفته شود و عملکردی مناسب روی تمامی کلاس‌‌های تعریف شده برای پرسش داشته باشد، چالشی در این زمینه است. این بدین علت است که در سیستم‌‌های پرسش‌‌و پاسخ دامنه باز، تعداد کلاس‌‌ها زیاد بوده و پرسش‌‌ها دارای تنوع بالایی می‌‌باشند. از طرفی پرسش‌‌ها شامل معنا و مفهوم بوده که برای انتساب پرسش به کلاس آن نیاز به استخراج این مفاهیم و استفاده از عملیات پردازش زبان می‌‌باشد. به همین دلیل طبقه‌‌بندی درست برای همه کلاس‌‌ها از مسائل مهم این حوزه محسوب می‌‌گردد. در این پایان‌‌نامه روشی برای طبقه‌‌بندی پرسش بر پایه کلمات هدف ارائه گردید. این روش متشکل از دو طبقه‌‌بند شبکه معنایی واژگان و ماشین بردار پشتیبان می‌‌باشد. شبکه معنایی روش پیشنهاد شده برای طبقه‌‌بندی پرسش با استفاده از بررسی مفاهیم و ساختار پرسش می‌‌باشد. این شبکه به وسیله مجموعه‌‌ای از پرسش‌‌ها ایجاد شده و برای عملیات طبقه‌‌بندی مورد استفاده قرار گرفته است. با توجه به استفاده از دو طبقه‌‌بند شبکه معنایی و ماشین بردار پشتیبان، نیاز به ترکیب آن‌‌ها می‌‌باشد که برای ترکیب نتایج نیز روشی پیشنهاد گردید. در این روش به هریک از طبقه‌‌بندها وزنی اختصاص داده شد. پس از پیشنهاد کلاس پرسش توسط طبقه‌‌‌‌بندها، وزن هریک محاسبه شده و هرکدام که وزن بیشتری داشتند انتخاب گردید. روش ارائه شده برای طبقه‌‌بندی پرسش با استفاده از مجموعه دادگان UIUC و TREC-10 پیاده‌‌سازی و ارزیابی گردید. این روش توانست به صحت 93.60 برای کلاس درشت دانه و 91.00 برای کلاس ریزدانه دست‌‌ یابد. همچنین دقت این روش برای کلاس‌‌های مذکور به ترتیب 91.99 و 89.68 می‌‌باشد. این نتایج نشان دهنده افزایش صحت عملکرد روش پیشنهادی نسبت به سایر روش‌‌های موجود است.
کلمات کلیدی : سیستم پرسش و پاسخ, طبقه‌‌بندی پرسش, ماشین بردار پشتیبان, شبکه معنایی
تاریخ دفاع : 1396/06/30
دانلود فایل چکیده

About Proposal
Title : Question Target Classification using Support Vector Machine and Semantic Network
Abstract : Question classification has a main role in question answering systems. Generally, the task of this section is to assign input questions to preset classes. Question classification has been already done by using machine learning algorithms or the creation of semantic and pattern-based structures. Regarding the importance of question classification in question answering systems, the accuracy and precision of results in previous studies are not desirable, and improvement of these results has always been a matter of concern. By studying the proposed methods and its results, it can be stated that question classification in open domain system will be a challenge, considering the context and target of question and having a proper function on all the defined classes for question. This is because of high number of classes in open domain question answering systems and high degree of variation in questions. On the other hand, the questions include meaning and concepts that extraction of these concepts and using of language processing operations are required for assignment of question to its class. For this reason, the right classification for all classes is one of the most important issues in this area. This research presented a method for classifying questions based on target words. This method consists of two classifier of semantic network and support vector machine. The proposed semantic network method for question classification using the concepts and structure of question. This network is created by a set of questions and used for classification function. Due to using of two semantic network and support vector machine classifiers, their combination is necessary, a method is proposed for result combination too. In this method, each classifiers are weighted. After question class suggestion by classifiers, each weight is calculated and high weighed ones were selected. The proposed method for question classification was implemented and evaluated by using UIUC and TREC-10. This method was able to achieve the accuracy of 93.60 for the coarse-grained grade and 91.00 for fine-grained. The precision of this method for these classes is respectively 91.99 and 89.68. These results indicate that the proposed method is more accurate than other available methods.
Keywords : Question answering system, Question classification, Support vector machine, semantic network
Download Abstract File