Lista przedmiotów z materiałami udostępnionymi dla studentów

Dla_studentów
  • Increase font size
  • Default font size
  • Decrease font size

Karol Matusiak

Detekcja obiektów w scenie rejestrowanej przez urządzenie mobilne


Object detection in scenes recorded by a mobile device


Opiekun pracy dyplomowej: dr inż. Piotr Skulimowski
Praca dyplomowa inżynierska obroniona 2011-02-16
Streszczenie pracy dyplomowej:
Celem pracy inżynierskiej było opracowanie i implementacja algorytmu umożliwiającego identyfikację obiektów zabudowy miejskiej w obrazach rejestrowanych przy użyciu kamery wbudowanej w telefon komórkowy. Przeanalizowano metody identyfikacji obrazów o relatywnie niskiej złożoności obliczeniowej oraz określono wymagania projektowanego algorytmu i na ich podstawie podjęto decyzję o wykorzystaniu transformacji SIFT (ang. Scale-Invariant Feature Transform). Algorytm zapewnia wykrycie stabilnych cech charakterystycznych obrazów oraz buduje deskryptory w znacznym stopniu niezależne od warunków rejestracji obrazu, takich jak: rotacja, szum, skala i zmiany jasności. Za docelową platformę mobilną wybrano grupę rozbudowanych telefonów komórkowych z systemem operacyjnym Symbian. Program napisano z wykorzystaniem zmodyfikowanej przez autora biblioteki Nokia Computer Vision Library zawierającej szereg funkcji przydatnych w zagadnieniach przetwarzania i analizy obrazów. Struktura programu została oparta o standardowy szablon aplikacji z graficznym interfejsem użytkownika. Do rejestracji obrazów wykorzystywany jest aparat cyfrowy wbudowany w urządzenie mobilne. Program pozwala na zbudowanie bazy danych wzorców i porównania rejestrowanych obrazów ze wzorcami z użyciem zmodyfikowanego klasyfikatora najbliższego sąsiedztwa. Testy aplikacji przeprowadzono na 8 obiektach miejskich tworząc ich wzorce w bazie danych, a następnie porównano z 24 zdjęciami testowymi (wszystkie zdjęcia rejestrowano przy użyciu aparatu wbudowanego w urządzenie). Wyniki testów uznano za zadowalające w przypadku 67% obrazów testowych, w pozostałych przypadkach wskazano powody błędnej identyfikacji. W podsumowaniu zaproponowano ocenę działania aplikacji oraz możliwości jej rozwoju i usprawnień. Algorytm może znaleźć zastosowanie w aplikacjach typu informator miejski lub turystyczny, w systemach rzeczywistości wirtualnej lub w przypadku wspomagania nawigacji w terenach zurbanizowanych.
Abstract:
The aim of bachelor’s thesis was to design and implement an application which enables identification of urban objects in the images recorded by the built-in mobile phone camera. The images identification methods demanding relatively low computing complexity were analyzed and the requirements of designed algorithm were determined. On the basis of the analysis it was decided to use the Scale-Invariant Feature Transform. The algorithm provides the detection of stable characteristic features of images and builds descriptors which are to a considerable degree independent from the conditions of image recording, such as: rotation, noise, scale and brightness changes. As the target mobile platform a group of developed mobile phones with operating system Symbian was selected. The program was written with usage of modified by author Nokia Computer Vision Library, which contains a number of functions useful in image processing and analysis. The program structure is based on a standard application template with graphical user interface. The recording of image is done through a digital camera built in the mobile device. The program enables to build a database with patterns and to compare recorded images with patterns, using a modified nearest neighbor classification. The application tests were conducted on 8 urban objects, whose patterns were created and stored in the database. Then 24 test photos were compared against the database contents. The test results are considered to be satisfactory in the case of 67% of test images, whereas in the remaining cases the reasons of misinterpretation are indicated. In the summary, the application performance assessment and the possibilities of its improvement and development are proposed. The algorithm finds application in the range of fields, including city or tourist guide, the systems of virtual reality or as an aid to navigation in the urbanized area.