Распознавания речи

Ushbu kurs ishi nutqni tanib olish va kalit so'zlarni aniqlash sohasidagi audio ma'lumotlar bilan ishlash bo'yicha tajribaviy-eksperimental tadqiqotni o'z ichiga oladi. Unda nutqni tanib olishning turli usullari, shu jumladan, ovozli signallarni qayta ishlash, mel-filtrlardan foydalanish, yashirin Markov modellarini (YMM) qo'llash hamda ularning afzalliklari va kamchiliklari ko'rib chiqilgan. Tadqiqot davomida nutqni tanib olishning samaradorligini oshirish maqsadida dasturiy ta'minot ishlab chiqilgan va amaliy sinovlardan o'tkazilgan.

Asosiy mavzular

  • Nutqni tanib olish asoslari: Ushbu mavzu nutqning o'zi nima ekanligini, ovozli signallarning fizik xususiyatlarini, ularni raqamli shaklda saqlash usullarini va nutqni tanib olish jarayonining umumiy tamoyillarini ochib beradi. Signalni tahlil qilish uchun uni kichik qismlarga (fremelarga) ajratish va ularning xususiyatlarini o'rganish muhimligi ta'kidlanadi.
  • Mel-filtrlardan foydalanish: Bu bo'lim mel-skalasining inson eshitish qobiliyati bilan bog'liqligini, mel-koeffitsientlarni hisoblash usullarini va ularning nutqni tahlil qilishdagi ahamiyatini tushuntiradi. Mel-filtrlarning chastota diapazonini inson idroki darajasiga moslashtirish yo'llari ko'rsatilgan.
  • Yashirin Markov modellari (YMM): Ushbu mavzu YMMning statistik model sifatida ta'rifini beradi, uning qanday ishlashini (avtoregressiya, Markov zanjiri) tushuntiradi va nutqni tanib olishda qo'llanilishini o'rganadi. YMMning Viterbi va Baum-Welch algoritmlari kabi asosiy algoritmilari ham yoritilgan.
  • Tajribaviy va eksperimental ishlar: Bu qismda muallif tomonidan ishlab chiqilgan dasturiy ta'minotning interfeysi va uning ishlash prinsipi ko'rsatilgan. Sinov natijalari va turli xil nutqni tanib olish usullarining taqqoslanishi keltirilgan, shu jumladan, ularning aniqlik darajasi va qo'llanilish sohalari haqida ma'lumot berilgan.