تعداد نشریات | 44 |
تعداد شمارهها | 1,303 |
تعداد مقالات | 16,020 |
تعداد مشاهده مقاله | 52,489,219 |
تعداد دریافت فایل اصل مقاله | 15,216,892 |
بهسازی وفقی سیگنال گفتار در محیطهای واقعی با استفاده از ساختار ترکیبی مبتنی بر شکلدهندههای پرتو و فیلتر پسینه | ||
مجله مهندسی برق دانشگاه تبریز | ||
مقاله 3، دوره 48، شماره 2 - شماره پیاپی 84، شهریور 1397، صفحه 481-495 اصل مقاله (2.18 M) | ||
نویسندگان | ||
آوید آوخ* 1؛ حمیدرضا ابوطالبی2 | ||
1دانشگاه آزاد اسلامی واحد نجف آباد - باشگاه پژوهشگران جوان و نخبگان | ||
2دانشگاه یزد - دانشکده مهندسی برق - آزمایشگاه تحقیقاتی پردازش گفتار | ||
چکیده | ||
تنوع میدانهای نویزی حاکم بر محیطهای واقعی، طراحی سیستم واحدی را که قادر به حذف کامل همه اغتشاشات محیطی باشد، با مشکل مواجه میکند. لذا، داشتن یک شناخت اولیه از میدانهای نویزی موجود در محیط و بررسی نوع اثر هر یک بر روی سیگنال گفتار، گام مؤثری در جهت فرآیند بهسازی محسوب میشود. در این مقاله، ضمن بررسی نویزهای اساسی موجود در زمینه گفتار ضبطشده در شرایط واقعی، به ارزیابی میدانهای نویزی پایینگذر پخشنده و مقایسه تابع همدوسی فضایی آنها در شرایط واقعی با نتایج تئوری خواهیم پرداخت. همچنین، ساختار کارآمد ترکیبی مبتنی بر آرایههای میکروفونی متشکل از شکلدهندههای پرتو وفقی و فیلتر پسینه پیشنهاد میشود. در طرح پیشنهادی، با هدف دنبال کردن شرایط پویای محیط وکنترل وفقی ضرایب وزندهی شکلدهنده پرتو، دو الگوریتم حداقل میانگین مربع و سریعترین کاهش استفاده واثر هر یک بر بهسازی سیگنال گفتار مقایسه خواهد شد. ساختار مذکور، ضمن ایجاد صفرهای کنترلشدهای در الگوی تشعشعی شکلدهنده پرتو برای مقابله پویا با میدانهای نویزی جهتدار محیط، به تعدیل نویزهای ناهمبسته و پخشنده میپردازد. بررسی اثر سرعت همگرایی الگوریتمهای مورد استفاده بر میزان SNR در حضور انواع میدانهای نویزی با طیفهای فرکانسی مختلف از دیگر فعالیتهای انجام شده در این تحقیق محسوب میشود. نتایج حاصل از شبیهسازی و همچنین پیادهسازی طرح پیشنهادی در شرایط واقعی و در سناریوهای مختلف، حاکی از نقش بهسزای آن در بهبود عملکرد بهسازی سیگنال گفتار دارد. | ||
کلیدواژهها | ||
آرایه میکروفونی؛ بهسازی گفتار؛ شکلدهی پرتو؛ فیلتر پسینه؛ نویز پخشنده | ||
مراجع | ||
[1] Z. Yermeche, “Subband beamforming for speech enhancement in hands-free communication”, Licentiate Thesis, Blekinge Institute of Technology 372 25 Ronneby, Sweden, Dec. 2004. [2] N. Ito, E. Vincent, T. Nakatani, N. Ono, S. Araki, and S. Sagayama, “Blind suppression of nonstationary diffuse acoustic noise based on spatial covariance matrix decomposition,” Signal Processing Systems, vol. 79, no. 2, pp. 145-157, 2015. [3] I. McCowan and H. Bourlard, “Microphone array post-filter for diffuse noise field”, In Proc. International Conference on Acoustics, Speech, and Signal Processing, vol. 1, pp. 905-908, Florida, 2002. [4] زهرا حبیبی، مرتضی کازرونی، سیدحسین محسنی ارمکی و عماد حمیدی، ”ارائه یک روش کاربردی جهت کالیبراسیون آنتنهای آرایه فازی“، مجله مهندسی برق دانشگاه تبریز، صفحه 79-84، شماره 4، 1394. [5]A. Avokh and H. R. Abutalebi, “Speech enhancement using linearly constrained adaptive constant directivity beamformers,” Applied Acoustics, vol. 71, no. 3, pp. 262-268, 2010. [6] D. Comminiello, M. Scarpiniti, R. Parisi and A. Uncini, “A novel affine projection algorithm for superdirective microphone array beamforming,” in Proc. IEEE International Symposium on Circuits and Systems, pp. 2127-2130, Jun. 2010. [7] W. Dongxia, Z. Jiachao, W. Tao, “A broadband beamforming method [8]S. M. Golan, A. Bertrand, M. Moonen, and S. Gannot, “Optimal distributed minimum-variance beamforming approaches for speech enhancement in wireless acoustic sensor networks,” Signal Processing, vol. 107, pp. 4-20, 2015. [9] S. Khoubrouy and J. Hansen, “Microphone array processing strategies for distant based automatic speech recognition,” IEEE Signal Processing Letters, vol. 23, no. 10, pp. 1344 - 1348, July 2016. [10] T. Padoisa, F. Sgard, O. Doutres, and AlainBerry, “Acoustic source localization using a polyhedral microphone array and an improved generalized cross-correlation technique,” Journal of Sound and Vibration, vol. 386, pp. 82-99, Jan. 2017. [11] M. J. Taghizadeh, P. N. Garner, and H. Bourlard, “Enhanced diffuse field model for ad hoc microphone array calibration,” Signal Processing, vol. 101, pp. 242–255, August 2014. [12] J. Li and M. Akagi, “A hybrid microphone array post-filter in a diffuse noise field,” vol. 69, no. 6, pp. 546-557, June 2008. [13]Y. A. Huang, A. Luebs, J. Skoglund, and W. B. Kleijn, “Globally optimized least-squares post-filtering for microphone array speech enhancement,” In proc International Conference on Signal Processing Systems, , pp. 380-384, 2016. [14] G. Huang, J. Benesty, and J. Chen, “Superdirective beamforming based on the Krylov matrix,” IEEE/ACM Trans. Audio, Speech, Language Processing, vol. 24, pp. 2531-2543, Dec. 2016. [15] D. L. Alon and B. Rafaely, “Beamforming with optimal aliasing cancellation in spherical microphone arrays,” IEEE/ACM Trans. Audio, Speech & Language Processing, vol. 24, no. 1, pp.196-210, 2016. [16] N. Ito, H. Shimizu, N. Ono, and S. Sagayama, “Diffuse noise suppression using crystal-shaped microphone arrays,” IEEE Trans. on Audio, Speech and Language Processing, vol. 19, no. 7, pp. 2101-2110, Sep. 2011. [17] مجتبی حاجی آبادی، عباس ابراهیمی مقدم و حسین خوش بین، ”حذف نویز صوتی مبتنی بر یک الگوریتم وفقی نوین“، مجله مهندسی برق دانشگاه تبریز، صفحه 139-146، شماره 3، 1395. [18] L. Chergui and S. Bouguezel, “A new pre-whitening transform domain LMS algorithm and its application to speech denoising,” Signal Processing, Vol. 130, , pp. 118-128, Jan. 2017 [19] مسعود گراوانچی زاده، پریا دادور و بابک بهادرنیا، ”بهبود سیستم جداسازی منبع مبتنی بر آنالیز ترکیب شنیداری در زبان فارسی“ شماره 4،صفحه 273-283 ، 1395 [20] S. A. Vorobyov, A. B. Gershman, and Z. Q. Luo, “Robust adaptive beam-forming using worst-case performance optimization: A solution to the signal mismatch problem,” IEEE Trans. Signal Process., vol. 51, no. 2, pp. 313-324, Feb. 2003. [21] S. Haykin, Adaptive Filter Ttheory, fourth ed., Prentice Hall, 2002. [22] G. Doblinger “An adaptive microphone array for optimum beamforming and noise reduction,” in Proc. European Signal Processing Conference (EUSIPCO) Florence, Italy, 2006. [23] P. Teal, T. D. Abhayapala, and R. A. Kennedy, “Spatial correlation in non-isotropic scattering scenarios,” in proc. International Conference on Acoustics, Speech, and Signal Processing, pp. 2833-2836, 2002. [24] Y. Ephraim and D. Malah, “Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator,” IEEE Trans. Acoust., Speech, Signal Processing, vol. 32, pp. 1109–1121, Dec. 1984. [25] https://pws.yazd.ac.ir/sprl [26] M. Bijankhan, J. Seikhzadeghan, M. R. Roohani, Y. Samareh, K. Lucas, M. Tebyani, “FARSDAT - the speech database of farsi spoken language,” in Proc. of SST-94, pp. 826-831,1994. [27] http://svr-ww.eng.cam.ac.uk/comp.speech/section1/data/noisex.html
| ||
آمار تعداد مشاهده مقاله: 1,184 تعداد دریافت فایل اصل مقاله: 657 |