- Nazwa przedmiotu:
- Analiza semantyczna obrazu
- Koordynator przedmiotu:
- Rajmund Kożuszek
- Status przedmiotu:
- Fakultatywny dowolnego wyboru
- Poziom kształcenia:
- Studia II stopnia
- Program:
- Informatyka
- Grupa przedmiotów:
- Przedmioty techniczne - podstawowe
- Kod przedmiotu:
- ASO
- Semestr nominalny:
- 3 / rok ak. 2021/2022
- Liczba punktów ECTS:
- 4
- Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
- 1. liczba godzin kontaktowych – 47 godz., w tym
obecność na wykładach 30 godz.,
spotkania projektowe 15 godz.,
konsultacje 2 godz.,
2. praca własna studenta – 55 godz., w tym
przygotowanie do zadania projektowego 10 godz.,
realizacja projektu 45 godz.
Łączny nakład pracy studenta wynosi 102 godz., co odpowiada 4 pkt. ECTS.
- Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
- 1,84 pkt. ECTS, co odpowiada 47 godz. kontaktowym
- Język prowadzenia zajęć:
- polski
- Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
- 2,74 pkt. ECTS, co odpowiada 15 godz. spotkań projektowych plus 55 godz. przygotowania i realizacji projektu
- Formy zajęć i ich wymiar w semestrze:
-
- Wykład30h
- Ćwiczenia0h
- Laboratorium0h
- Projekt15h
- Lekcje komputerowe0h
- Wymagania wstępne:
- Osoby uczęszczające na przedmiot powinny przede wszystkim mieć widzę związaną z podstawowymi metodami przetwarzania obrazów. Wymagana będzie również umiejętność programowania w językach wysokiego poziomu (takich jak python).
- Limit liczby studentów:
- 30
- Cel przedmiotu:
- Celem przedmiotu jest zapoznanie słuchaczy ze współczesnymi metodami i algorytmami semantycznej analizy obrazu.
Przedmiot zawiera, dyskusję podstawowych i zaawansowanych metod analizy semantycznej obrazu. W ramach przedmiotu słuchacz zostanie zaznajomiony z metodami analizy obrazów statycznych, zmiennych w czasie, wielospektralnych. Pokazanie skuteczności wprowadzonych metod w rozwiazywaniu praktycznych problemów automatycznego rozpoznawania (np.: kodu pocztowego, zdjęć twarzy, poleceń dla komputera wydawanych głosem)
- Treści kształcenia:
- Treść wykładu
1. Wprowadzenie. Ilustracja toru analizy obrazu na przykładach (aktywizacja sygnału, przetwarzanie wstępne, segmentacja, ekstrakcja cech, klasyfikacja, przetwarzanie danych klasyfikacyjnych).
2. Analiza kształtu. Omówienie zagadniej z zakresu: cech geometrycznych, cech momentowych, operatorów morfologicznych.
3. Zastosowania reprezentacji sygnału w dziedzinie częstości. Reprezentacja Fouriera, DWT, EMD, VMD i ich zastosowanie w ekstrakcji cech z obrazu.
4. Transformacje Hougha. Podstawowy algorytm Hougha, detekcja linii,dwystopniowy algorytm Hougha i jego optymalizacja, algorytm Hougha z informacją gradientową, zastosowanie do lokalizacji twarzy w obrazie, metoda Ballarda detekcji dowolnych kszałtów;
5. Algorytmy klasteryzacji danych: algorytm centroidów (LGB), jego analiza i postać neuronowa, metoda ewolucyjna VQ, algorytm neuronowy LVQ. Redukcjia wymiarowości sygnału – analiza obrazów hiperspektralnych.
6. Zaawansowane techniki analizy i indeksowania obrazów - metody przetwarzania i analizy obrazu, detekcja zdarzeń, śledzenie ruchu, indeksowanie obrazu. Segmentacja obrazów cyfrowych i metody jej realizacji. Metody statystyczne w przetwarzaniu obrazów cyfrowych.
7. Podstawy projektowania systemów semantycznej analizy obrazów - omówienie pełnej ścieżki projektowania, od analizy wymagań, poprzez tworzenie projektu właściwego po końcowe testowanie. Testowanie systemów - metody testowania jakości toru przetwarzania obrazu. Przegląd metodyk, narzędzi i architektur.
8. Zastosowanie głebokich sieci neuronowych do semantycznej analizy danych obrazowych. Przegląd rozwiązań. Przykładowe architektury i modele.
Projekt:
Celem projektu jest opracowanie kompletnego systemu bazującego na metodach sementycznej analizy obrazów rozwiązującego konkretne zadanie. System powinien zawierać moduły:
• pozyskiwania danych obrazowych
• przetwarzania obrazów
• analizy obrazów
W ramach realizacji zadania projektowego przewidziane są cztery spotkania ewaluacyjne mające na celu wspólną ocenę osiągniętych kamieni milowych projektu.
1. Analiza przedstawionego problemu i zaproponowanie rozwiązań,
2. Przygotowanie danych obrazowych i/lub budowa układu wizyjnego,
3. Implementację systemu realizującego główne wymagania techniczne projektu,
4. Przeprowadzenie eksperymentu umożliwiającego testowanie opracowanego rozwiązania.
- Metody oceny:
- Wykład prowadzony w tradycyjnej formie.
Realizacja projektu będzie podzielona na cztery etapy. Na zakończenie każdego z etapów przewidziana jest wspólna dyskusja rezultatów (2h):
1. Analiza przedstawionego problemu i zaproponowanie rozwiązań,
2. Przygotowanie danych obrazowych i/lub budowa układu wizyjnego,
3. Implementację systemu realizującego główne wymagania techniczne projektu,
4. Przeprowadzenie eksperymentu umożliwiającego testowanie opracowanego rozwiązania.
- Egzamin:
- nie
- Literatura:
- 1. Cremers Daniel, Video Processing and Computational Video, International Seminar, Dagstuhl Castle, Germany, 2010,
2. McAndrew Alasdair,Computational Introduction to Digital Image Processing
3. A.J. Jain: Fundamentals of digital image processing, Prentice-Hall, 1995
4. C. Bishop: Neural networks for recognition, Clarendon Press, 1995
5. A. Pandya, R. Macy: Pattern recognition with neural networks in C++, CRC Press, 1996
6. Richard Szeliski, Computer Vision: Algorithms and Applications, Springer 2010
- Witryna www przedmiotu:
- https://usosweb.usos.pw.edu.pl/kontroler.php?_action=katalog2/przedmioty/pokazPrzedmiot&prz_kod=103A-xxxxx-MSP-ASO
- Uwagi:
- (-)
Efekty uczenia się