Nazwa przedmiotu:
Głębokie sieci neuronowe w mediach cyfrowych
Koordynator przedmiotu:
Rajmund Kożuszek
Status przedmiotu:
Fakultatywny dowolnego wyboru
Poziom kształcenia:
Studia II stopnia
Program:
Informatyka
Grupa przedmiotów:
Przedmioty techniczne - podstawowe
Kod przedmiotu:
GSN
Semestr nominalny:
3 / rok ak. 2021/2022
Liczba punktów ECTS:
4
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
1. liczba godzin kontaktowych – 62 godz., w tym obecność na wykładach 30 godz., laboratoria 15 godz., spotkania projektowe 15 godz., konsultacje 2 godz. 2. praca własna studenta – 58 godz., w tym przygotowanie do zadania projektowego 4 godz., realizacja projektu 24 godz., przygotowanie do laboratoriów 15 godz., przygotowania do kolokwiów 15 godz. Łączny nakład pracy studenta wynosi 120 godz., co odpowiada 4 pkt. ECTS.
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
2,07 pkt. ECTS, co odpowiada 62 godz. kontaktowym
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
1,93 pkt. ECTS, co odpowiada 15 godz. przygotowań do laboratoriów, 15 godz. laboratorium oraz 28 godz. przygotowania i realizacji projektu
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium15h
  • Projekt15h
  • Lekcje komputerowe0h
Wymagania wstępne:
Osoby uczęszczające na przedmiot powinny przede wszystkim mieć wiedzę związaną z podstawami przetwarzania multimediów. Wymagana będzie również umiejętność programowania w języku Python.
Limit liczby studentów:
30
Cel przedmiotu:
Celem przedmiotu jest przekazanie niezbędnej wiedzy i wyrobienie stosownych umiejętności w zakresie projektowania i programowania modułów sztucznej inteligencji opartych na głębokich sieciach neuronowych, ze szczególnym uwzględnieniem jednostek splotowych i ich zastosowań w mediach cyfrowych.
Treści kształcenia:
Wykład: 1. Wprowadzenie (8h): podstawowe pojęcia (jednostka przetwarzania tensorowego, sieć jednostek jako model, sieci rekurencyjne i ze wzmocnieniem), symboliczne sieci neuronowe, stochastyczne metody optymalizacji sieci głębokich, równania przepływu gradientu i sieci dualne, przegląd architektur neuronowych w zagadnieniach CREAMS. 2. Elementy programowanie głębokich sieci neuronowych (2h): przetwarzanie tensorów w Pythonie, programowanie sieci głębokich w pakietach Pytorch i Keras. 3. Filtracja sygnału (4h): zmiana rozdzielczości próbkowania obrazu i dźwięku, rektyfikacja obrazu, transfer koloru i stylu w obrazie, techniki filtracji sygnału mowy. 4. Rozpoznawanie obiektów cyfrowych (4h): rozpoznawanie twarzy w obrazie, rozpoznawanie mówcy. 5. Indeksowanie obiektów cyfrowych (4h): segmentacja z adnotacją w obrazie, segmentacja z adnotacją w ścieżce dźwiękowej, podsumowanie zawartości wideo. 6. Modelowanie 3D na potrzeby interfejsu człowiek-maszyna (4h): detekcja twarzy i znaczników FP68 w obrazie twarzy, model Candide-3 (geometria, personalizacja, animacja), detekcja orientacji głowy, detekcja i śledzenie sylwetki osoby, rozpoznawanie emocji człowieka w obrazie twarzy. 7. Kompresja obrazu i dźwięku (2h): doradcze sieci generacyjne w kompresji i zanurzaniu mediów cyfrowych, splot przyczynowy w kodowaniu arytmetycznym. 8. Bezpieczeństwo w mediach cyfrowych (2h): detekcja wirusów w programach komputerowych w ich reprezentacji sygnałowej, synteza i analiza podpisu cyfrowego, zanurzanie obiektów cyfrowych (steganografia i steganofonia). Laboratoria (15h) zorganizowane są w formie pięciu bloków tematycznych po trzy godziny zajęć. Ćwiczenia i zwarte zadania laboratoryjne dotyczą analizy architektury istniejących modeli neuronowych w wybranych aplikacjach. Analiza prowadzona jest w metodologii ablacyjnej (ablation analysis). Student zapoznaje się również z technikami projektowania i programowania modułów takich aplikacji. Projekt (15h) jest definiowany w formie wymagań aplikacji i jest realizowany w grupach projektowych złożonych z 4-6 osób. Grupa projektowa wybiera realizowaną aplikację z aktualnej listy projektów lub proponuje własną aplikację do akceptacji prowadzącego zajęcia projektowe.
Metody oceny:
teoria jest zaliczana na podstawie dwóch kolokwiów
Egzamin:
nie
Literatura:
1. Władysław Skarbek: „Symbolic tensor neural networks for digital media -- from tensor processing via BNF graph rules to CREAMS applications” (w pliku syblic-net.pdf) , 2. Władysław Skarbek: „Matematyka multimediów w zadaniach” (w pliku zadania-matmu.pdf), 3. Władysław Skarbek: „Adaptive Image Recognition -- Updated Notes on: Math, Algorithms, and Programming” (w pliku air-notes-student.pdf) 4. Umberto Michelucci -- Advanced Applied Deep Learning: Convolutional Neural Networks and Object Detection, Springer APress, 2019 (książka ta jest dostępna bezpłatnie w sieci naszej Politechniki).
Witryna www przedmiotu:
https://usosweb.usos.pw.edu.pl/kontroler.php?_action=katalog2/przedmioty/pokazPrzedmiot&prz_kod=103A-INIMU-MSP-GSN
Uwagi:
(-)

Efekty uczenia się