دوره 9، شماره 3 - ( 7-1401 )                   جلد 9 شماره 3 صفحات 22-1 | برگشت به فهرست نسخه ها

XML English Abstract Print


دانشگاه خوارزمی ، دانشکده روانشناسی و علوم تربیتی، گروه علم اطلاعات و دانش شناسی
چکیده:   (115 مشاهده)
زمینه و هدف: هدف این پژوهش، بررسی نتایج استخراج خودکار کلیدواژه از فهرست مندرجات کتاب‌های الکترونیکی فارسی حوزۀ علوم  با استفاده از مدل‌سازی موضوعی ال. دی. اِی.،  سنجش شباهت‌ کلیدواژه‌های خروجی با کلیدواژه‌های استاندارد و ارزیابی کاربران از کلیدواژه‌های استخراج‌شده به‌صورت ماشینی است.
روش پژوهش: این پژوهش کاربردی، از نوع پژوهش‌های متن‌کاوی و به جنبۀ روش‌های مورداستفاده در آن پژوهش آمیخته است. از مدل‌سازی موضوعی ال. دی. اِی.  برای  استخراج کلیدواژه از فهرست‌های مندرجات کتاب‌ها استفاده‌شده‌ و نتایج کاربرد مدل با دو روش سنجش کسینوس شباهت و پژوهش کیفی توسط کاربران مورد ارزیابی قرار گرفته است.
یافته‌ها: فهرست‌های مندرجات مورد بررسی با میانگین پیراسته  ۲۶۰.۰۲ کلمه از متون با طول متوسط  محسوب می‌شوند و  حدود ۲۰ درصد از کلمات  آن‌ها را  ایست‌واژه‌ها تشکیل داده‌اند. میان کلیدواژه‌های استاندارد سرعنوانی و کلیدواژه‌های خروجی مدل ال. دی. اِی.  کسینوس شباهت، ۰.۰۹۳۲، بسیار پایین به دست آمد. توافق کامل کاربران نشان داد کلیدواژه‌های خروجی  مدل موضوعی ال. دی. اِی.  حوزه موضوعی کل پیکره را نشان می‌دهند، اما ازنظر کاربران به ترتیب کلیدواژه‌های سرعنوانی استاندارد، کلیدواژه‌های مستخرج از مدل در زیرحوزه‌های موضوعی و کلیدواژه‌های مستخرج از مدل با کل پیکره در توصیف موضوعات هر تک مدرک موفق‌اند.  
نتیجه‌گیری: کلیدواژه‌های به‌دست‌آمده از مدل موضوعی ال. دی. اِی.  را می‌توان در مجموعه‌های ناشناخته به‌منظور استخراج محتوای موضوعی ناآشکار کل مجموعه به کار برد، اما برای ربط دقیق  موضوع به  مدرک در پیکره‌های بزرگ با موضوعات  ناهمگن و متنوع، نمی‌توان از این روش استفاده کرد. این روش در رویه‌های رسمی توصیف موضوعی تک‌تک مدارک به‌صورت مستقل می‌تواند به‌عنوان یک سیستم پیشنهاددهنده کلیدواژه به نیروی انسانی نمایه‌ساز به کار گرفته  شود.
 
متن کامل [PDF 897 kb]   (70 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي

بازنشر اطلاعات
Creative Commons License این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.