Lista przedmiotów z materiałami udostępnionymi dla studentów

Dla_studentów
  • Increase font size
  • Default font size
  • Decrease font size

Radosław Pomirski

Detekcja tekstu w obrazach cyfrowych scen naturalnych


Opiekun pracy dyplomowej: prof. dr hab. inż. Paweł Strumiłło
Praca dyplomowa magisterska obroniona 2005-10-26
Streszczenie pracy dyplomowej:
Istnieje coraz większe zapotrzebowanie na systemy pozyskujące informacje tekstową. Jednym z niezbędnych etapów pozyskiwania jest lokalizacja obszarów zainteresowań. W pracy przedstawiono prototypowy algorytm realizujący detekcje tekstu w cyfrowych obrazach scen naturalnych. Ze względu na znaczną różnorodność form tekstu drukowanego, niemożliwe jest zbudowanie jednego modułu dokonującego detekcji dowolnego tekstu. Najczęstszym występującym rodzajem tekstu, jest tekst jednolitego koloru na jednolitym tle. Postać taka jest bardzo czytelna dla obserwatora. W niniejszej pracy jest przedstawiony prototypowy algorytm detekcji tekstu o jednolitym kolorze. Opracowany program komputerowy dokonuje detekcji informacji tekstowej zawartej w obrazie kolorowym i przedstawia wyniki segmentacji w postaci graficznej na ekranie monitora, z możliwością zapisu obrazu wynikowego. Lokalizowany tekst może być pisany dowolną czcionką. Minimalna wysokość znaku powinna wynosić 15 pikseli w celu poprawnej detekcji. Idea działania programu opiera się na analizie obrazu gradientowego krawędzi utworzonego z wczytanego obrazu. Zastosowano maskę gradientową Sobela do utworzenia obrazu krawędzi. Analizowany jest wzajemny układ poszczególnych krawędzi i ich wymiary. Warunkiem poprawnej detekcji jest nie łączenie się krawędzi poszczególnych znaków. Dodatkową funkcja programu jest binaryzacja obszarów zainteresowań w celu późniejszego rozpoznania zlokalizowanego tekstu przez programy OCR. Binaryzacja przeprowadzana jest w oparciu o analizę histogramu. Aby wydobyty znak mógł być rozpoznany przez program OCR, jego wysokość powinna wynosić minimum 20 pikseli. Znaki, których wysokość jest mniejsza, są lokalizowane w obrazie, jednak w wyniku progowania ich kształt jest zniekształcony i niemożliwe staje się ich poprawne rozpoznanie.