Lista przedmiotów z materiałami udostępnionymi dla studentów

Dla_studentów
  • Increase font size
  • Default font size
  • Decrease font size

Agnieszka Górska

System rozpoznawania izolowanych słów mowy polskiej


Isolated word recognition system of the Polish language


Opiekun pracy dyplomowej: dr inż. Paweł Pełczyński
Praca dyplomowa inżynierska obroniona 2012-04-19
Streszczenie pracy dyplomowej:
Systemy do rozpoznawania izolowanych słów oraz mowy ciągłej zostały stworzone na potrzeby rozwoju technologicznego. W XXI wieku możemy sterować na przykład telefonem komórkowym, komputerem, bądź też urządzeniami znajdującymi się w domu za pomocą wydawanych na bieżąco komend słownych. Wszystko to dzieje dzięki systemom rozpoznawania mowy, które to analizują wypowiedź, wydobywając charakterystyczne dla niej cechy – częstotliwości formantowe, parametry cepstralne, parametry LPC. Dzięki tym cechom można dane polecenia dopasować do wcześniej wyuczonego wzoru, dzięki czemu komputer zabudowany we wszystkich wcześniej wspomnianych urządzeniach jest w stanie zrozumieć człowieka i wykonać polecenie, które jest przypisane komendzie słownej. Opracowany system rozpoznawania izolowanych słów bazuje na czasowo – częstotliwościowej analizie sygnału mowy, dzięki której zostają wyodrębnione częstotliwości formantowe dla trzech pierwszych formantów. Następnie częstotliwości te są porównywane z wprowadzonymi do bazy za pomocą klasyfikatora minimalno – odległościowego z uwzględnieniem dynamicznego skalowania czasu. Wypowiedź użytkownika jest klasyfikowana do jednego z wzorców jeśli łączna odległość wszystkich próbek sygnału od tego wzorca jest najmniejsza.
Abstract:
Systems for recognition separated words and the continuous speech were created for the purposes of the technological development. In the 21st century we can control for example a mobile phone, the computer, or devices being found at home with given voice commands. It is possible thanks to developed voice recognition systems that analyse speech signal and extract its features – formant frequencies, cepstral parameters, LPC parameters. Thanks to these features it is possible to fit given orders to the earlier taught patterns, thanks to what the computer embedded in all earlier recalled devices is able to understand the man and to carry out the order which is assigned to a given voice command. The developed system for recognition of isolated words is based on time – frequency analysis of the voice signal, which extracts formant frequencies for three first formants. Next these frequencies are compared to the database with the use of minimum distance classifier assuming a dynamic time warping takes place. A signal is classified to a given pattern if the total distance over all samples is the minimum.