Lista przedmiotów z materiałami udostępnionymi dla studentów

Dla_studentów
  • Increase font size
  • Default font size
  • Decrease font size

Paweł Tomasik

Układ rozpoznawania komend głosowych dla systemu wbudowanego


Voice recogniyion system for an embedded system


Opiekun pracy dyplomowej: dr inż. Przemysław Barański
Praca dyplomowa inżynierska obroniona 2014-02-13
Streszczenie pracy dyplomowej:
Celem pracy inżynierskiej jest zbudowanie układu do rozpoznawania komend głosowych w oparciu o platformę wbudowaną. Główny element układu stanowi 32 bitowy mikrokontroler ARM. Do zbudowania układu został wykorzystany gotowy zestaw uruchomieniowy. Pierwszy rozdział opisuje historię przetwarzania mowy oraz przedstawiony został przegląd dostępnych metod do rozpoznawania mowy jak analiza obwiedni czasowej, analiza częstotliwościowa, spektrogram, czy krótkoczasowa analiza cepstralna. W drugim rozdziale opisywany jest zaimplementowany algorytm do rozpoznawania komend. Przedstawione są etapy wstępnego przetwarzania oraz właściwej parametryzacji. Przedstawiono metodę DTW (ang. Dynamic Time Warping) do porównania szeregów czasowych o różnych skalach czasowych w celu eliminacji problemu różnej szybkości wypowiadanych słów. Rozdział trzeci przedstawia implementację sprzętową układu. Opisany został zestaw uruchomieniowy w tym jego główne elementy takie jak mikrokontroler, wzmacniacz mikrofonowy, wyświetlacz LCD, karta SD oraz inne peryferia. W czwartym rozdziale przedstawiono wyniki skuteczności działania zaimplementowanego algorytmu. Przedstawiono 5 różnych miar szacowania wypowiedzianej komendy: wartości minimalnej, średniej z trzech najlepszych wyników, wartości średniej, wartości średniej bez wartości ekstremalnych, mediany. Przedstawiono skuteczność algorytmu w funkcji liczby instancji wzorców komend. Rozdział piąty to podsumowanie pracy, zestawiające najważniejsze punkty pracy.
Abstract:
The aim of the thesis is building a voice recognition system for an embedded platform. The core of the system is a 32 bit ARM7 microcontroller. An off-the-shelf development board was used for the work. The first chapter presents historically the problem of voice recognition. Different methods for analyzing voice, like time-domain envelope, frequency analysis, spectrogram or short-time cepstral analysis are discussed. The second charter presents in detail the implemented algorithm for voice recognition. The stages of preprocessing and actual signal parameterization are elucidated with a help of example plots. The method of elastic matching, DTW (Dynamic Time Warping) is introduced to compare two signals of different time scale. The method solves the problem of comparing two voice commands uttered with different speed. The third charter presents the hardware. The development board and its main elements like microcontroller, microphone amplifier, LCD display, SD care and other peripherals are described. The fourth chapter finally shows the results of the implemented voice recognition system. Different measures of assessing the uttered command are discussed: minimum value, the average value of three best values, average value, average value without extrema, median. The effectiveness of the system is analyzed against the number of reference command instantiations. The last charter is the summary of the work, highlighting the main achievements of the thesis.