Detekcja i śledzenie obiektów w sekwencjach obrazów rejestrowanych przez ruchomy układ stereowizyjny do celów dźwiękowej reprezentacji sceny trójwymiarowej
Praca naukowa finansowana ze środków na naukę w roku 2008 jako projekt badawczy Nr N N516 386434
Zakres badań związany z doktoratem dotyczy problemu analizy i przetwarzania sekwencji barwnych obrazów sceny trójwymiarowej rejestrowanych przez ruchomy stereoskopowy układ kamer. Badania te są ukierunkowanie na opracowanie mobilnego układu wspomagającego osobę niewidomą w samodzielnym poruszaniu się.
Stereoskopia jest jedną z technik pozwalających na wyznaczenie odległości (tzw. głębi) elementów sceny od układu kamer. Kluczowym zadaniem w badaniach jest detekcja i selekcja obiektów sceny trójwymiarowej oraz ich parametryczny opis umożliwiający wytworzenie akustycznego odwzorowania wydzielonych obiektów sceny. Dane te będą aktualizowane i uszczegółowiane wraz z ruchem układu kamer, co pozwoli na śledzenie położenia obiektów, także tych, które przestały być widoczne w polu widzenia kamer.
Przyjętym ograniczeniem w konstrukcji systemu stereowizyjnego jest jego mała baza (odległość między osiami optycznymi kamer). Ograniczenie to wynika z docelowego zastosowania układu stereowizyjnego jako personalnego modułu wizyjnego osoby niewidomej. Mała baza układu stereoskopowego skutkuje zmniejszeniem dokładności wyznaczenia obrazu głębi. Poprawienie tej dokładności jest możliwe na podstawie sekwencji obrazów stereoskopowych rejestrowanych przez ruchomy układ kamer. Do tego celu niezbędna jest estymacja sześciu parametrów ruchu (ang. ego-motion estimation), na który składają się trzy wektory translacji i trzy kąty obrotu sztywnego układu kamer.
W przypadku zagadnień związanych z robotyką parametry ruchu systemu można pozyskać z układu sterowania lub innych urządzeń (systemy nawigacji GPS, skanery odległości, czujniki inercyjne). Założeniem przyjętym w pracy jest korzystanie wyłącznie z informacji wizyjnej, bez konieczności stosowania dodatkowych czujników.
Obraz zarejestrowany przez prawą kamerę systemu stereowizyjnego |
Wyznaczona mapa głębi. Jasnością kodowana jest współrzędna głębi sceny |
Wynik detekcji obiektów w scenie do celów dźwiękowej reprezentacji |