تولید قواعد فازی احتمالی به‌کمک یادگیری تقویتی

محمدکریمی, نعیمه; درهمی, ولی

فهرست نشریات دارای اعتبار وزارت علوم، تحقیقات و فناوری

تعداد نشریات	45
تعداد شماره‌ها	1,532
تعداد مقالات	18,594
تعداد مشاهده مقاله	60,955,186
تعداد دریافت فایل اصل مقاله	21,762,812

	تولید قواعد فازی احتمالی به‌کمک یادگیری تقویتی
مجله مهندسی برق دانشگاه تبریز
مقاله 32، دوره 47، شماره 4 - شماره پیاپی 82، اسفند 1396، صفحه 1669-1676 اصل مقاله (1.05 M)
نویسندگان
نعیمه محمدکریمی؛ ولی درهمی^*
دانشگاه یزد - دانشکده مهندسی برق و کامپیوتر
چکیده
مهم‌ترین بخش در یک سیستم فازی پایگاه قواعد آن است. یکی از مشکلات موجود در تولید قواعد فازی با داده‌های آموزشی، وجود داده‌های ناسازگار است زیرا در این‌گونه داده‌ها چند خروجی برای وضعیت‌های یکسان وجود دارد. لذا تولید قواعد و تصمیم‌گیری برای انتخاب تالی مناسب برای هر قاعده با چالش همراه خواهد بود. روش‌های موجود از برآیند حالت‌های ناسازگار استفاده می‌کنند که باعث تولید خروجی با مقدار میانگین تالی‌های مربوطه می‌شود. به‌منظور بهبود این مشکل در این مقاله از مقداردهی اولیه به‌مقدار احتمال انتخاب عمل‌ها، در یادگیری تقویتی فازی مبتنی بر معماری عملگر-نقاد استفاده می‌شود. با خوشه‌بندی داده آموزشی و استفاده از مدل سوگنوی مرتبه صفر با تعدادی عمل کاندید در هر قاعده، پارامترهای ماژول عملگر مقداردهی اولیه شده و درنهایت با معماری عملگر-نقاد و سیگنال تقویتی، به‌صورت برخط تنظیم می‌شوند. با توجه به اینکه مشکل ناسازگاری در داده‌های مربوط به ناوبری ربات نسبت به موارد دیگر نمایان‌تر است، ایده ارائه‌شده در مسئله ناوبری ربات استفاده می‌شود. آزمایش‌ها در شبیه‌ساز Webots برای ربات ایپاک انجام شده است. نتایج آزمایش‌ها حاکی از آن است که روش ارائه‌شده موجب کاهش زمان یادگیری، کاهش برخورد به موانع در مسئله ناوبری ربات با قواعد فازی کم‌تر است.
کلیدواژه‌ها
کنترل‌گر فازی؛ تولید قواعد فازی؛ داده آموزشی ناسازگار؛ معماری عملگر-نقاد

مراجع

آمار تعداد مشاهده مقاله: 685 تعداد دریافت فایل اصل مقاله: 970

سامانه مدیریت نشریات علمی. قدرت گرفته از سیناوب

پیوندهای مفید

آمار

تولید قواعد فازی احتمالی به‌کمک یادگیری تقویتی