| تعداد نشریات | 45 |
| تعداد شمارهها | 1,490 |
| تعداد مقالات | 18,184 |
| تعداد مشاهده مقاله | 58,859,454 |
| تعداد دریافت فایل اصل مقاله | 20,353,817 |
طبقه بندی هوشمند موضوعی کتاب بر پایه تحلیل خلاصه متن و یادگیری نظارت شده | ||
| نشریه مطالعات دانش پژوهی | ||
| مقالات آماده انتشار، پذیرفته شده، انتشار آنلاین از تاریخ 20 فروردین 1405 | ||
| نوع مقاله: مقاله پژوهشی | ||
| شناسه دیجیتال (DOI): 10.22034/jkrs.2026.69800.1201 | ||
| نویسندگان | ||
| مریم قدیمی نیک* 1؛ حلیه سادات حاجی محمدی2 | ||
| 1کارشناسی ارشد مدیریت فناوری اطلاعات، دانشگاه شهید بهشتی | ||
| 2کارشناسی مهندسی نرم افزار دانشگاه غیرانتفاعی شهاب دانش | ||
| چکیده | ||
| هدف: این پژوهش بهدنبال توسعه مدلی است که بتواند به کمک الگوریتمهای یادگیریماشین و تکنیکهای متنکاوی، صرفاً با تحلیل خلاصهکتاب، موضوع یک کتاب را به صورت خودکار شناسایی کند. در این تحقیق از یک مجموعهداده ساختاریافته شامل نامکتاب، خلاصه و موضوع استفاده شده است. هدفنهایی، ارائه مدلی است که نهتنها به لحاظ فنی دقیق باشد، بلکه در کاربردهای واقعی مانند موتورهای پیشنهاد کتاب و پلتفرمهای کتابخوانی دیجیتال نیز قابلاستفاده باشد. روش:دادهها ازطریق وباسکراپینگ و وبکرالینگ، از منابعمعتبر شامل Goodreads، Ketabrah و Fidibo جمعآوری شدهاند. داده هایخام، تحت فرایندهایی مانند پاکسازیمتنی، نرمالسازی و آمادهسازی ویژگیها(Data Preprocessing) قرار گرفتند. فرآیند ﭘﯿﺶﭘﺮﺩﺍﺯﺵ ﺷﺎﻣﻞ3 ﻣﺮﺣﻠﻪ ﺍﺳﺖ: ﺍﺑﺘﺪﺍ، ﺗﻤﺎﻡ ﮐﺎراکترهایخاص حذف ﻣﯽ ﺷﻮﻧﺪ ﻭ ﺳﭙﺲ هرﮐﻠﻤﻪ ﺑﻪ ریشهﻣﻮرﻓﻮﻟﻮژﯾﮑﯽ خود ﺗﺠﺰﯾﻪ میشود. سپس، تمام ایستواژهها ﻧﯿﺰ از ﺧﻼﺻﻪ ﮐﺘﺎبها ﺣﺬف ﻣﯽ ﺷﻮﻧﺪ، زﯾﺮﺍ در ﮐﺎﺭ ﭘﯿﺶ ﺑﯿﻨﯽ ﮐﻤﮑﯽ نخواهند کرد. استخراج ویژگی از خلاصه کتاب پیشپردازششده با استفاده از آماره Tf-idf انجام میشود. درنهایت، رگرسیون لجستیک و ماشینبردارپشتیبان (SVM) بهمنظور استخراج روابطپنهان میان موضوعکتاب و خلاصه آن مورد استفاده قرار گرفتند. یافتهها: با تقسیمبندی 80-20% دادهها برای آموزش و آزمایش، دقت حاصلشده از اجرای الگوریتمهای رگرسیون لجستیک، ماشینبردارپشتیبانخطی و ماشینبردارپشتیبان RBF به ترتیب 80%، 79%و 79.7% میباشد. همچنین با تقسیم بندی 90-10% رکوردها، دقت حاصلشده از اجرای الگوریتمهای فوق به ترتیب82.2%، 78.6%و 79.3% بدست آمد. نتیجهگیری: نتایج حاصل نشان داد که الگوریتمرگرسیونلجستیک بهترین دقت پیشبینی را در میان مدلهای آزمایش شده ارائه میدهد. سرعت آموزش و پیشبینی بالای رگرسیونلجستیک، آن را به گزینهای مناسب برای مسائلی از نوع تحلیلهای متنی و دستهبندیهای چندکلاسه تبدیل کرده است. | ||
| کلیدواژهها | ||
| طبقه بندی موضوعی کتاب؛ رگرسیون لجستیک؛ ماشین بردار پشتیبان؛ متن کاوی؛ یادگیری ماشین | ||
| مراجع | ||
|
| ||
|
آمار تعداد مشاهده مقاله: 65 |
||