دوره 9، شماره 3 - ( 7-1401 )                   جلد 9 شماره 3 صفحات 22-1 | برگشت به فهرست نسخه ها

XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

RiahiNia N, Shadanpour F, Borna K, Montazer G A. Automatic keyword extraction using Latent Dirichlet Allocation topic modeling: Similarity with golden standard and users' evaluation. Journal title 2022; 9 (3)
URL: http://hii.khu.ac.ir/article-1-3069-fa.html
ریاحی نیا نصرت، شادان‌پور فرزانه، برنا کیوان، منتظر غلامعلی. استخراج ماشینی کلیدواژه با مدل‌سازی موضوعی ال. دی. اِی.: شباهت‌سنجی با کلیدواژه‌های استاندارد و ارزیابی کاربران. عنوان نشریه 1401; 9 (3)

URL: http://hii.khu.ac.ir/article-1-3069-fa.html


دانشگاه خوارزمی ، دانشکده روانشناسی و علوم تربیتی، گروه علم اطلاعات و دانش شناسی
چکیده:   (300 مشاهده)
زمینه و هدف: هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتاب‌های الکترونیکی فارسی حوزۀ علوم  با استفاده از مدل‌سازی موضوعی ال. دی. اِی.،  سنجش شباهت‌ کلیدواژه‌های خروجی با کلیدواژه‌های استاندارد و ارزیابی کاربران از کلیدواژه‌های استخراج‌شده به‌صورت ماشینی است.
روش پژوهش: این پژوهش کاربردی، از نوع پژوهش‌های متن‌کاوی و به جنبۀ روش‌های مورداستفاده در آن پژوهش آمیخته است. از مدل‌سازی موضوعی ال. دی. اِی.  برای  استخراج کلیدواژه از فهرست‌های مندرجات کتاب‌ها استفاده‌شده‌ و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.
یافته‌ها: فهرست‌های مندرجات مورد بررسی با میانگین پیراسته  ۲۶۰.۰۲ کلمه از متون با طول متوسط  محسوب می‌شوند و  حدود ۲۰ درصد از کلمات  آن‌ها را  ایست‌واژه‌ها تشکیل داده‌اند. میان کلیدواژه‌های استاندارد سرعنوانی و کلیدواژه‌های خروجی مدل ال. دی. اِی.  کسینوس شباهت، ۰.۰۹۳۲، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژه‌های خروجی  مدل موضوعی ال. دی. اِی.  حوزه موضوعی کل پیکره را نشان می‌دهند، اما ازنظر کاربران به ترتیب کلیدواژه‌های سرعنوانی استاندارد، کلیدواژه‌های مستخرج از مدل در زیرحوزه‌های موضوعی و کلیدواژه‌های مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفق‌اند.  
نتیجه‌گیری: کلیدواژه‌های به‌دست‌آمده از مدل موضوعی ال. دی. اِی.  را می‌توان در مجموعه‌های ناشناخته به‌منظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق  موضوع به  مدرک در پیکره‌های بزرگ با موضوعات  ناهمگن و متنوع، نمی‌توان از این روش استفاده کرد. این روش در رویه‌های رسمی توصیف موضوعی تک‌تک مدارک به‌صورت مستقل می‌تواند به‌عنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایه‌ساز به کار گرفته  شود.
 
متن کامل [PDF 897 kb]   (164 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
CAPTCHA

ارسال پیام به نویسنده مسئول


بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.

کلیه حقوق این وب سایت متعلق به تعامل انسان و اطلاعات می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2023 CC BY-NC 4.0 | Human Information Interaction

Designed & Developed by : Yektaweb