اطلاعات پایان نامه
شماره شناسایی : 39304822
نام و نام خانوادگی : فاطمه خردمند
عنوان پایان نامه : بهبود دقت طبقه بندی هدف پرسش با استفاده از ماشین بردار پشتیبان و شبکه معنایی
رشته تحصیلی : مهندسي كامپيوتر-هوش مصنوعي
مقطع تحصیلی : كارشناسي ارشد
استاد راهنما : حميد رستگاري
استاد مشاور :
چکیده : طبقه‌‌بندی‌‌ پرسش نقشی اساسی در سیستم‌‌های پرسش و پاسخ دارد، چرا که انتساب نادرست پرسش به کلاس‌‌های تعریف شده، از دلایل اصلی ضعف این سیستم‌‌ها محسوب شده و موجب کاهش کارایی آن‌‌ها می‌‌شود. اگرچه تاکنون روش‌‌های مؤثری برای طبقه‌‌بندی پرسش ارائه شده است، اما با توجه به اهمیت طبقه‌‌بندی پرسش، میزان صحت ارائه شده مطلوب نبوده و نیاز به بهبود دارد. به طور کلی با بررسی روش‌‌های ارائه شده و نتایج آن می‌‌توان گفت، طبقه‌‌بندی پرسش در دامنه باز اطلاعاتی به صورتی که زمینه و هدف پرسش درنظر گرفته شود و عملکردی مناسب روی تمامی کلاس‌‌های تعریف شده برای پرسش داشته باشد، همچنان چالشی در این زمینه محسوب می‌‌شود. درواقع در سیستم‌‌های پرسش ‌‌و پاسخ دامنه باز، تعداد کلاس‌‌ها زیاد بوده و پرسش‌‌ها دارای تنوع بالایی می‌‌باشند. از طرفی پرسش‌‌ها شامل معنا و مفهوم بوده که برای انتساب پرسش به کلاس آن، نیاز به استخراج این مفاهیم و استفاده از عملیات پردازش زبان می‌‌باشد. به همین دلیل برای کسب نتایج مطلوب در طبقه‌‌بندی باید ساختار و مفاهیم پرسش در نظر گرفته شود. در این تحقیق روشی برای طبقه‌‌بندی پرسش بر پایه کلمات هدف ارائه گردید. این روش متشکل از دو طبقه‌‌بند شبکه معنایی واژگان و ماشین بردار پشتیبان می‌‌باشد. شبکه معنایی پیشنهاد شده برای طبقه‌‌بندی، بر اساس مفاهیم و ساختار پرسش ایجاد شده و برای عملیات طبقه‌‌بندی مورد استفاده قرار گرفته است. با توجه به استفاده از دو طبقه‌‌بند شبکه معنایی و ماشین بردار پشتیبان، برای ترکیب نتایج نیز روشی پیشنهاد گردید. در این روش به هریک از طبقه‌‌بندها وزنی اختصاص داده می‌‌شود. پس از پیشنهاد کلاس پرسش توسط طبقه‌‌‌‌بندها، وزن هریک محاسبه شده و هرکدام که وزن بیشتری داشتند انتخاب می‌‌گردد. روش ارائه شده برای طبقه‌‌بندی پرسش با استفاده از مجموعه دادگان UIUC و TREC-10 پیاده‌‌سازی و ارزیابی شده است. این روش توانست به صحت 93.60 درصد برای کلاس درشت دانه و 91.00 درصد برای کلاس ریزدانه دست‌‌ یابد. همچنین دقت این روش برای کلاس‌‌های مذکور به ترتیب 91.99 و 89.68 درصد می‌‌باشد. این نتایج نشان دهنده افزایش صحت عملکرد روش پیشنهادی نسبت به سایر روش‌‌های موجود است.
کلمات کلیدی : سیستم پرسش و پاسخ, طبقه‌‌بندی پرسش, ماشین بردار پشتیبان, شبکه معنایی
تاریخ دفاع : 1396/06/30
دانلود فایل چکیده

About Proposal
Title : Question Target Classification using Support Vector Machine and Semantic Network
Abstract : Question classification holds a major role in question answering system because incorrect attribution of question to defined classes is the principal reason of the defect of such systems and reduces their efficacy. Although until now effective question classification methods have been introduced, these methods have fallen short of achieving accuracy and as result beg for improvement. Generally speaking, taking into account these methods and their outcomes, it should be mentioned that question classification in an open domain system, in a way that both the context and target of the question are duly considered and in the way that it has an appropriate function on all defined classes, has proved to be a challenge. In fact, open domain question answering systems consists of several categories and many diverse questions. These questions bear meaning and for attributing each question to its class, it is necessary to elicit these meanings and use a language processing tool. That is why it is important to take into account the structure and the concept of the question in order for it to come to fruition. This research offered a method for question classification based on target words. This method is composed of two classifiers, namely semantic network and support vector machine. The former is used for question classification based on the meaning and the structure of the question, in a nutshell, for question classification purposes. Apart from these two classifiers, another method was proposed for combining the results. In this method, each of the classifiers was given a weight. Then, the weight of each is calculated and the one that has a higher weight is chosen. In this research, question classification has been executed and evaluated through TREC-10 and UIUC. The accuracy of the proposed method was 93.60 and 91 and the precision thereof was 91.99 and 89.68 for coarse-grained and fine-grained class respectively. The results are indicative of the supremacy of the present method over other ones when it comes to accuracy and precision.
Keywords : Question answering system, Question classification, Support vector machine, semantic network
Download Abstract File