Lista przedmiotów z materiałami udostępnionymi dla studentów

Dla_studentów
  • Increase font size
  • Default font size
  • Decrease font size

Łukasz Popiński

Analiza wybranych metod lokalizacji tekstu w obrazach rejestrowanych przez urządzenia


Analysis of selected text localization methods in images recorded by mobile devices


Opiekun pracy dyplomowej: dr inż. Piotr Skulimowski
Praca dyplomowa magisterska obroniona 2014-09-26
Streszczenie pracy dyplomowej:
Celem pracy magisterskiej była analiza wybranych metod lokalizacji tekstu w obrazach rejestrowanych przez aparaty cyfrowe urządzeń mobilnych. Praca poświęcona została głównie analizie i implementacji metody Stroke Width Transform. Metoda ta jest jedną z najskuteczniejszych metod pozwalających na lokalizacje tekstu w scenach naturalnych. Tekst stanowi w tego typu obrazach zazwyczaj tylko fragment, a pozostałą cześć stanowią inne elementy sceny takie jak roślinność, samochody czy budynki. Taka złożoność sceny powoduje, że analiza obrazu mająca na celu znalezienie obszarów z tekstem jest bardzo trudna. W pracy ponadto omówiono kluczowe etapy innych metod lokalizacji tekstu o zbliżonej skuteczności, szczególną uwagę zwrócono na metodę Edge-Enhanced Maximally Stable Extremal Regions. Implementacja wybranej metody na urządzenia mobilne pracujące pod kontrolą systemu operacyjnego Android potwierdziła jej wysoką skuteczność. Krytycznym elementem okazał się jednak czas potrzebny na obliczenia na urządzeniu mobilnym. Było to szczególnie zauważalne, w przypadku obrazów o dużej rozdzielczości.
Abstract:
The aim of the thesis was to analyze and implement selected text localization methods in images taken by built-in mobile device cameras. The thesis is mainly focused on the Stroke Width Transform method, which has been by far one of the most breakthrough recent achievements in the field of localization of text in natural images. Text areas usually fill only a limited part of the whole image, with the rest filled by other artificial or natural elements, like trees, cars and buildings. Such a complexity of the scene makes it difficult to localize the text areas in the image. Additionally, the thesis reviews a number of other text localization methods with similar efficiency, with special attention paid to the Edge-Enhanced Maximally Stable Extremal Regions method. Implementation of the chosen method on Android smartphones confirmed its high accuracy. On the other hand, time which was consumed by the algorithm turned out to be a critical parameter on a smartphone with limited resources, particularly in case of high resolution images.