Lista przedmiotów z materiałami udostępnionymi dla studentów

Dla_studentów
  • Increase font size
  • Default font size
  • Decrease font size

Dariusz Kuc

Lokalizacja tekstu w scenach rejestrowanych przez urządzenia mobilne z systemem operacyjnym Android


Text localization in scenes recorded by Android smartphones


Opiekun pracy dyplomowej: dr inż. Piotr Skulimowski
Praca dyplomowa magisterska obroniona 2012-07-12
Streszczenie pracy dyplomowej:
Celem pracy było opracowanie algorytmu wyznaczającego lokalizację tekstu w scenach rejestrowanych przez urządzenia mobilne. Przedmiot zainteresowania stanowił tekst pełniący rolę informacyjną, charakteryzujący się poziomą bądź pionową orientacją. W trakcie tworzenia algorytmu położono szczególny nacisk na szybkość jego działania, co zostało podyktowane niskimi możliwościami obliczeniowymi, jakie oferują docelowe urządzenia. Jako platformę docelową wybrano system operacyjny Android, który w trakcie realizacji pracy był najpopularniejszym mobilnym systemem operacyjnym. Zaproponowana metoda bazuje na wyznaczeniu obrazu gradientowego, w którym uwidaczniają się wszystkie występujące w zdjęciu krawędzie. Dokonując ich analizy wydzielane są segmenty obrazu, które potencjalnie stanowią elementy tekstu. W dalszej kolejności segmenty zostają grupowane w łańcuchy tekstowe. Jako kryterium przyjęto ich położenie względem siebie oraz właściwości geometryczne. Opracowany algorytm został poddany testom, które potwierdziły satysfakcjonującą skuteczność i szybkość działania.
Abstract:
The aim of the thesis was to design an algorithm which identifies the location of text in scenes recorded by mobile devices. It was assumed that the text would have a horizontal or a vertical orientation. The algorithm was optimized for the relatively low computing abilities that are specific to the target devices. The Android operating system was selected as the target mobile platform due to its market dominance during the preparation of the thesis. The first step of the proposed algorithm is contour extraction. The second is image segmentation, which outputs segments that are potentially elements of the text. At the end the segments are grouped into text strings based on segment positions and analysis of geometrical features. Proper functionality of the system was verified through performance tests. The algorithm’s correctness and speed are satisfactory.