RiahiNia N, Shadanpour F, Borna K, Montazer G A. Automatic keyword extraction using Latent Dirichlet Allocation topic modeling: Similarity with golden standard and users' evaluation. تعامل انسان و اطلاعات 2022; 9 (3)
URL:
http://hii.khu.ac.ir/article-1-3069-fa.html
ریاحی نیا نصرت، شادانپور فرزانه، برنا کیوان، منتظر غلامعلی. استخراج ماشینی کلیدواژه با مدلسازی موضوعی ال. دی. اِی.: شباهتسنجی با کلیدواژههای استاندارد و ارزیابی کاربران. تعامل انسان و اطلاعات 1401; 9 (3)
URL: http://hii.khu.ac.ir/article-1-3069-fa.html
دانشگاه خوارزمی ، دانشکده روانشناسی و علوم تربیتی، گروه علم اطلاعات و دانش شناسی
چکیده: (135 مشاهده)
زمینه و هدف: هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتابهای الکترونیکی فارسی حوزۀ علوم با استفاده از مدلسازی موضوعی ال. دی. اِی.، سنجش شباهت کلیدواژههای خروجی با کلیدواژههای استاندارد و ارزیابی کاربران از کلیدواژههای استخراجشده بهصورت ماشینی است.
روش پژوهش: این پژوهش کاربردی، از نوع پژوهشهای متنکاوی و به جنبۀ روشهای مورداستفاده در آن پژوهش آمیخته است. از مدلسازی موضوعی ال. دی. اِی. برای استخراج کلیدواژه از فهرستهای مندرجات کتابها استفادهشده و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.
یافتهها: فهرستهای مندرجات مورد بررسی با میانگین پیراسته ۲۶۰.۰۲ کلمه از متون با طول متوسط محسوب میشوند و حدود ۲۰ درصد از کلمات آنها را ایستواژهها تشکیل دادهاند. میان کلیدواژههای استاندارد سرعنوانی و کلیدواژههای خروجی مدل ال. دی. اِی. کسینوس شباهت، ۰.۰۹۳۲، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژههای خروجی مدل موضوعی ال. دی. اِی. حوزه موضوعی کل پیکره را نشان میدهند، اما ازنظر کاربران به ترتیب کلیدواژههای سرعنوانی استاندارد، کلیدواژههای مستخرج از مدل در زیرحوزههای موضوعی و کلیدواژههای مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفقاند.
نتیجهگیری: کلیدواژههای بهدستآمده از مدل موضوعی ال. دی. اِی. را میتوان در مجموعههای ناشناخته بهمنظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق موضوع به مدرک در پیکرههای بزرگ با موضوعات ناهمگن و متنوع، نمیتوان از این روش استفاده کرد. این روش در رویههای رسمی توصیف موضوعی تکتک مدارک بهصورت مستقل میتواند بهعنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایهساز به کار گرفته شود.
نوع مطالعه:
پژوهشي |
موضوع مقاله:
تخصصي