تعداد نشریات | 41 |
تعداد شمارهها | 1,116 |
تعداد مقالات | 13,681 |
تعداد مشاهده مقاله | 48,571,131 |
تعداد دریافت فایل اصل مقاله | 12,332,599 |
تولید کلمات کلیدی متون فارسی با استفاده از یادگیری انتقالی | ||
مجله مهندسی برق دانشگاه تبریز | ||
دوره 52، شماره 2 - شماره پیاپی 100، مهر 1401، صفحه 115-123 اصل مقاله (923.78 K) | ||
نوع مقاله: علمی-پژوهشی | ||
شناسه دیجیتال (DOI): 10.22034/tjee.2022.15426 | ||
نویسندگان | ||
مرضیه رحیمی ![]() | ||
1استادیار، دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران | ||
2دانشجوی دکتری، دانشکده مهندسی انفورماتیک، دانشگاه پورتو، پورتو، پرتغال | ||
3فارغ التحصیل کارشناسی دانشکده مهندسی کامپیوتر، دانشگاه صنعتی شاهرود، شاهرود، ایران | ||
چکیده | ||
تولید خودکار کلمات کلیدی، نقش مهمی در بسیاری از کاربردهای تحلیلی متن و زبانهای طبیعی، بهویژه در دستهبندی و بازیابی سریع متون دارد. بسیاری از روشهای کنونی محدود به انتخاب کلماتی هستند که صریحاً در متن ذکر شدهاند. استفاده از روشهای دنبالهبهدنباله قادر است این نقصان را برطرف کند. البته استفاده از این روشها معمولاً مستلزم وجود پیکرههای عظیم است که برای زبانهای کممنبع مثل فارسی یک چالش محسوب میشود. در چنین موقعیتهایی، یادگیری انتقالی که در آن یک مدل پیشآموخته بر روی یک وظیفه جدید با مجموعه کوچکتری از دادهها تطبیق داده میشود، میتواند راهگشا باشد. در این مقاله، برآنیم تا با استفاده از یک روش دنبالهبهدنباله مبتنی بر شبکههای عمیق انتقالی، به تولید کلمات کلیدی برای متون علمی فارسی بپردازیم. در همین راستا، پیکره متنوعی از ٧۰هزار مقاله تخصصی به زبان فارسی و کلمات کلیدی متناظرشان جمعآوری شده است. سپس شبکه انتقالی پیشآموخته MT5 با استفاده از این پیکره، برای وظیفه تولید کلمات کلیدی، تنظیم و بازآموزی شده است. مدل حاصل، با چندین روش دیگر مقایسه شده است. نتایج این مقایسه حاکی از برتری حداقل 2.71 درصدی آن بر روشهای موجود است. | ||
کلیدواژهها | ||
تولید عبارات کلیدی؛ استخراج عبارات کلیدی؛ روشهای دنبالهبهدنباله؛ شبکههای عمیق انتقالی؛ پیکره فارسی؛ خلاصهسازی چکیدهای | ||
مراجع | ||
| ||
آمار تعداد مشاهده مقاله: 84 تعداد دریافت فایل اصل مقاله: 52 |