Nazwa przedmiotu:
Analiza semantyczna obrazu
Koordynator przedmiotu:
Rajmund Kożuszek
Status przedmiotu:
Fakultatywny dowolnego wyboru
Poziom kształcenia:
Studia II stopnia
Program:
Informatyka
Grupa przedmiotów:
Przedmioty techniczne - podstawowe
Kod przedmiotu:
ASO
Semestr nominalny:
3 / rok ak. 2021/2022
Liczba punktów ECTS:
4
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
1. liczba godzin kontaktowych – 47 godz., w tym obecność na wykładach 30 godz., spotkania projektowe 15 godz., konsultacje 2 godz., 2. praca własna studenta – 55 godz., w tym przygotowanie do zadania projektowego 10 godz., realizacja projektu 45 godz. Łączny nakład pracy studenta wynosi 102 godz., co odpowiada 4 pkt. ECTS.
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
1,84 pkt. ECTS, co odpowiada 47 godz. kontaktowym
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
2,74 pkt. ECTS, co odpowiada 15 godz. spotkań projektowych plus 55 godz. przygotowania i realizacji projektu
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium0h
  • Projekt15h
  • Lekcje komputerowe0h
Wymagania wstępne:
Osoby uczęszczające na przedmiot powinny przede wszystkim mieć widzę związaną z podstawowymi metodami przetwarzania obrazów. Wymagana będzie również umiejętność programowania w językach wysokiego poziomu (takich jak python).
Limit liczby studentów:
30
Cel przedmiotu:
Celem przedmiotu jest zapoznanie słuchaczy ze współczesnymi metodami i algorytmami semantycznej analizy obrazu. Przedmiot zawiera, dyskusję podstawowych i zaawansowanych metod analizy semantycznej obrazu. W ramach przedmiotu słuchacz zostanie zaznajomiony z metodami analizy obrazów statycznych, zmiennych w czasie, wielospektralnych. Pokazanie skuteczności wprowadzonych metod w rozwiazywaniu praktycznych problemów automatycznego rozpoznawania (np.: kodu pocztowego, zdjęć twarzy, poleceń dla komputera wydawanych głosem)
Treści kształcenia:
Treść wykładu 1. Wprowadzenie. Ilustracja toru analizy obrazu na przykładach (aktywizacja sygnału, przetwarzanie wstępne, segmentacja, ekstrakcja cech, klasyfikacja, przetwarzanie danych klasyfikacyjnych). 2. Analiza kształtu. Omówienie zagadniej z zakresu: cech geometrycznych, cech momentowych, operatorów morfologicznych. 3. Zastosowania reprezentacji sygnału w dziedzinie częstości. Reprezentacja Fouriera, DWT, EMD, VMD i ich zastosowanie w ekstrakcji cech z obrazu. 4. Transformacje Hougha. Podstawowy algorytm Hougha, detekcja linii,dwystopniowy algorytm Hougha i jego optymalizacja, algorytm Hougha z informacją gradientową, zastosowanie do lokalizacji twarzy w obrazie, metoda Ballarda detekcji dowolnych kszałtów; 5. Algorytmy klasteryzacji danych: algorytm centroidów (LGB), jego analiza i postać neuronowa, metoda ewolucyjna VQ, algorytm neuronowy LVQ. Redukcjia wymiarowości sygnału – analiza obrazów hiperspektralnych. 6. Zaawansowane techniki analizy i indeksowania obrazów - metody przetwarzania i analizy obrazu, detekcja zdarzeń, śledzenie ruchu, indeksowanie obrazu. Segmentacja obrazów cyfrowych i metody jej realizacji. Metody statystyczne w przetwarzaniu obrazów cyfrowych. 7. Podstawy projektowania systemów semantycznej analizy obrazów - omówienie pełnej ścieżki projektowania, od analizy wymagań, poprzez tworzenie projektu właściwego po końcowe testowanie. Testowanie systemów - metody testowania jakości toru przetwarzania obrazu. Przegląd metodyk, narzędzi i architektur. 8. Zastosowanie głebokich sieci neuronowych do semantycznej analizy danych obrazowych. Przegląd rozwiązań. Przykładowe architektury i modele. Projekt: Celem projektu jest opracowanie kompletnego systemu bazującego na metodach sementycznej analizy obrazów rozwiązującego konkretne zadanie. System powinien zawierać moduły: • pozyskiwania danych obrazowych • przetwarzania obrazów • analizy obrazów W ramach realizacji zadania projektowego przewidziane są cztery spotkania ewaluacyjne mające na celu wspólną ocenę osiągniętych kamieni milowych projektu. 1. Analiza przedstawionego problemu i zaproponowanie rozwiązań, 2. Przygotowanie danych obrazowych i/lub budowa układu wizyjnego, 3. Implementację systemu realizującego główne wymagania techniczne projektu, 4. Przeprowadzenie eksperymentu umożliwiającego testowanie opracowanego rozwiązania.
Metody oceny:
Wykład prowadzony w tradycyjnej formie. Realizacja projektu będzie podzielona na cztery etapy. Na zakończenie każdego z etapów przewidziana jest wspólna dyskusja rezultatów (2h): 1. Analiza przedstawionego problemu i zaproponowanie rozwiązań, 2. Przygotowanie danych obrazowych i/lub budowa układu wizyjnego, 3. Implementację systemu realizującego główne wymagania techniczne projektu, 4. Przeprowadzenie eksperymentu umożliwiającego testowanie opracowanego rozwiązania.
Egzamin:
nie
Literatura:
1. Cremers Daniel, Video Processing and Computational Video, International Seminar, Dagstuhl Castle, Germany, 2010, 2. McAndrew Alasdair,Computational Introduction to Digital Image Processing 3. A.J. Jain: Fundamentals of digital image processing, Prentice-Hall, 1995 4. C. Bishop: Neural networks for recognition, Clarendon Press, 1995 5. A. Pandya, R. Macy: Pattern recognition with neural networks in C++, CRC Press, 1996 6. Richard Szeliski, Computer Vision: Algorithms and Applications, Springer 2010
Witryna www przedmiotu:
https://usosweb.usos.pw.edu.pl/kontroler.php?_action=katalog2/przedmioty/pokazPrzedmiot&prz_kod=103A-xxxxx-MSP-ASO
Uwagi:
(-)

Efekty uczenia się