Nazwa przedmiotu:
Analiza i indeksowanie multimediów
Koordynator przedmiotu:
dr inż. Jacek Krzysztof Naruniec
Status przedmiotu:
Fakultatywny ograniczonego wyboru
Poziom kształcenia:
Studia II stopnia
Program:
Telekomunikacja
Grupa przedmiotów:
Przedmioty techniczne - zaawansowane
Kod przedmiotu:
AIM
Semestr nominalny:
2 / rok ak. 2018/2019
Liczba punktów ECTS:
5
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
150
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
3
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
2
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium15h
  • Projekt15h
  • Lekcje komputerowe0h
Wymagania wstępne:
programowanie, programowanie obiektowe
Limit liczby studentów:
60
Cel przedmiotu:
Przedmiot dotyczy technik budowy systemów wyszukiwania a analizy informacji multimedialnej: projektowania architektury systemu wyszukiwania, projektowania indeksu, kompresji indeksu, budowy słowników, kwerendy przez przykład, kwerendy złożonej, ekstrakcji cech wizualnych, ekstrakcji cech dźwiękowych, klasyfikacji, śledzenia obiektów, reprezentacji meta-danych w XML. Dodatkowo omówiona będzie struktura standardu MPEG-7 i jego rola w indeksowaniu multimediów. W efekcie studenci opanują wiedzę o najnowszych metodach analizy i indeksowania danych multimedialnych oraz zdobędą doświadczenie praktyczne w projektowaniu i implementacji praktycznych systemów w tym zakresie.
Treści kształcenia:
- Wprowadzenie do indeksowania: system indeksowania a system wyszukiwania, miary selektywności atrybutu indeksowego (2h). - Kompresja indeksu: kody przedziałowe, kompresja interpolacyjna (2h). - Budowa słowników skalarnych: tablice skalarne, funkcje numeracji dokładnej, słowniki ortograficzne – drzewa trie i typu B, wydobywanie danych w sieci, silnik Google (4h). - Budowa słowników wektorowych: przedziały wektorowe, drzewa typu R, drzewa typu M, akceleracja kwerend przez przykład (2h). - Ekstrakcja cech wizualnych: cechy koloru, tekstury i kształtu obiektu w obrazie, charakterystyka ruchu, transformata Hougha i Radona (6h) - Klasyfikacja deskryptorów cech: PCA, LDA, DLDA, SDA, SVM. (4h) - Analiza i indeksowanie obrazów i modeli twarzy: detekcja śledzenie twarzy 2D, akwizycja modelu 3D (4h). - Wykrywanie obiektów w obrazie: ISM, filtry Haara w połączeniu z metodami typu boosting (2h) - Ekstrakcja cech dźwiękowych: cechy czasowe i widmowe, charakterystyka barwy dźwięku, sygnatura audio(4h). Zakres laboratorium: Laboratorium 1 (3h): Budowa słownika ortograficznego. Laboratorium 2 (3h): Sygnatura obrazu. Laboratorium 3 (3h): Śledzenie twarzy. Laboratorium 4 (3h): Rozpoznawanie twarzy. Laboratorium 5 (3h): Rozpoznawanie komend głosowych. Zakres projektu: Projekt do wyboru: „System indeksowania” lub „System rozpoznawania”
Metody oceny:
Zaliczenie na podstawie wyników laboratorium, projektu i egzaminu. Maksymalna liczba punktów za egzamin: 40 Maksymalna liczba punktów za projekt: 20 Maksymalna liczba punktów za laboratorium: 40 Do zaliczenia przedmiotu wymagane jest zdobycie min. 20 punktów za egzamin i przekroczenie łącznej sumy 50 punktów. Pozostałe progi punktowe według standardowej skali.
Egzamin:
tak
Literatura:
1. Literatura podstawowa: Notatki wykładowe - materiały elektroniczne Dokumenty i raporty grupy MPEG 2. Literatura dodatkowa: - Bing Liu, Web Data Mining: Exploring Hyperlinks, Contents and Usage Data. Springer, 2007. - T. Huang, Z. Wen: 3D Face Processing, Springer, 2007 - C. Bishop: Pattern Recognition and Machine Learning, Springer 2006 - Witten, Moffat, Bell: Managing Gigabytes, Morgan Kauffman Publishers,San Francisco, 1999. - Knuth: Sztuka programowania – Wyszukiwanie i sortowanie (tom 3), WNT, Warszawa, 2002.
Witryna www przedmiotu:
ztv.ire.pw.edu.pl/aim
Uwagi:

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Charakterystyka W1
Student, który zaliczył przedmiot posiada wiedzę na temat metod indeksowania danych oraz analizy semantycznej obrazu i dźwięku.
Weryfikacja: Sprawdzian pisemny.
Powiązane charakterystyki kierunkowe: K_W07
Powiązane charakterystyki obszarowe: I.P7S_WG

Profil ogólnoakademicki - umiejętności

Charakterystyka U1
Student potrafi samodzielnie zaprojektować i wykonać system indeksowania lub przetwarzania obrazu.
Weryfikacja: Ocena wyników projektu.
Powiązane charakterystyki kierunkowe: K_U12, K_U06, K_U09
Powiązane charakterystyki obszarowe: I.P7S_UW, III.P7S_UW.1.o, III.P7S_UW.3.o
Charakterystyka U2
Student potrafi zaimplementować poznane metody analizy i indeksowania w typowych dla tej dziedziny zagadnieniach
Weryfikacja: Ocena z laboratorium.
Powiązane charakterystyki kierunkowe: K_U08, K_U09
Powiązane charakterystyki obszarowe: I.P7S_UW, III.P7S_UW.2.o, III.P7S_UW.3.o

Profil ogólnoakademicki - kompetencje społeczne

Charakterystyka K1
Potrafi określić priorytety rozwoju technik multimedialnych 3D w kraju i na świecie.
Weryfikacja: Pytania testowe.
Powiązane charakterystyki kierunkowe: K_K01, K_K02
Powiązane charakterystyki obszarowe: I.P7S_KO, I.P7S_KK, I.P7S_KR