Nazwa przedmiotu:
Zaawansowane metody uczenia maszynowego
Koordynator przedmiotu:
prof. dr hab. Jan Mielniczuk
Status przedmiotu:
Obowiązkowy
Poziom kształcenia:
Studia II stopnia
Program:
Inżynieria i Analiza Danych
Grupa przedmiotów:
Wspólne
Kod przedmiotu:
1120-DS000-MSP-0115
Semestr nominalny:
2 / rok ak. 2018/2019
Liczba punktów ECTS:
6
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
1. godziny kontaktowe – 83 h; w tym a) obecność na wykładach – 30 h b) obecność na laboratoriach – 30 h c) obecność na zajęciach projektowych – 15 h d) konsultacje – 5 h e) obecność na egzaminie – 3 h 2. praca własna studenta – 60 h; w tym a) zapoznanie się z literaturą – 5 h b) przygotowanie projektu – 25 h c) rozwiązanie zadań domowych – 5 h d) przygotowanie do zajęć projektowych – 10 h e) przygotowanie raportu/prezentacji – 5 h f) przygotowanie do egzaminu – 10 h Razem 158 h, co odpowiada 6 pkt. ECTS
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
1. obecność na wykładach – 30 h 2. obecność na laboratoriach – 30 h 3. obecność na zajęciach projektowych – 15 h 4. konsultacje – 5h 5. obecność na egzaminie – 3 h Razem 83 h, co odpowiada 3 pkt. ECTS
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
1. obecność na laboratoriach – 30 h 2. obecność na zajęciach projektowych – 15 h 3. przygotowanie projektu – 25 h 4. rozwiązanie zadań domowych – 5 h 5. przygotowanie do zajęć laboratoryjnych – 5 h 6. przygotowanie do zajęć projektowych – 10 h 7. przygotowanie raportu/prezentacji – 5 h Razem 95 h, co odpowiada 4 pkt. ECTS
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium30h
  • Projekt15h
  • Lekcje komputerowe0h
Wymagania wstępne:
Wstęp do Uczenia Maszynowego
Limit liczby studentów:
Liczba grup: 2, Laboratoria – 15 osób / grupa
Cel przedmiotu:
Celem przedmiotu jest zapoznanie słuchaczy z zaawansowanymi metodami uczenia maszynowego oraz nauczenie ich aktywnej umiejętności modelowania i analizy danych regresyjnych przy użyciu szeregu nowoczesnych metod statystycznych i data miningowych, w szczególności metod modelowania krzywych regresji, metod klasyfikacji i analizy szeregów czasowych.
Treści kształcenia:
Wykład (program przedmiotu): 1. Regresja liniowa: metoda MNK, diagnostyka dopasowania i podstawowe testy. 2. Regresja liniowa: podstawowe odstępstwa od modelu i metody jego adaptacji. 3. Podejście bayesowskie w regresji liniowej, bayesowskie porównanie modeli 4. Regularyzacja w regresji: regresja grzbietowa i metoda Lasso 5. Regresja wysokowymiarowa, selekcja zmiennych: filtry, wrappery, kryteria informacyjne, metody zachłanne. 6. Regresja nieliniowa: nieliniowe metody parametryczne, metody nieparametryczne, drzewa regresyjne CART, metoda MARS. 7. Nieliniowe metody klasyfikacyjne: nieliniowe empiryczne reguły bayesowskie, estymatory gęstości. 8. Nieliniowe metody klasyfikacyjne: QDA, drzewa klasyfikacyjne CART, metoda jądrowa SVM. Klasyfikacja wieloetykietowa 9. Komitety klasyfikatorów (bagging, boosting, algorytmy gradientowe, lasy losowe). 10. Modele graficzne: sieci bayesowskie. 11. Modele graficzne: losowe pola Markowa, wnioskowanie w modelach graficznych. 12. Praktyczna budowa systemu uczącego się dla danych wysokowymiarowych, metody Multisplit , Random Subspace Methods i Nearest Shrunken Centroids. 13. Szeregi czasowe: charakterystyki procesów stacjonarnych, problem prognozy, metoda Yule’a-Walkera, algorytm innowacyjny. 14. Procesy liniowe: modelowanie procesami ARMA(p,q). 15. Analiza danych funkcjonalnych FDA. Laboratorium: Analiza i modelowanie zbiorów danych wykorzystująca metody regresyjne, klasyfikacyjne, i prognozy szeregów czasowych – w siatce ćwiczenia Projekt: Praktyczna wieloaspektowa analiza zbiorów danych i konstrukcja systemu automatycznego modelowania spełniającego określone kryteria (zadana precyzja, kryterium LIFT 5% na zbiorze testowym, zadany błąd średniokwadratowy prognozy)
Metody oceny:
Wykład: wykład problemowy i omawianie studiów przypadku, Laboratoria: samodzielne rozwiązywanie zadań w laboratoriach Projekt: Samodzielna konstrukcja modelu predykcyjnego
Egzamin:
tak
Literatura:
1.Bishop, Pattern Recognition and Machine Learning, Springer 2006 2. Hastie, Tibshirani, Friedman, Elements of Statistical Learning, wydanie drugie, Springer 2009 3. Izenman, Modern Multivariate Statistical Techniques, Springer 2008
Witryna www przedmiotu:
.
Uwagi:
program 3 semestralny - 1 semestr program 4 semestralny - 2 semestr

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Charakterystyka W01
Zna metody dopasowania modelu liniowego przy użyciu metody najmniejszych kwadratów, estymatora Lasso i estymatora ridge, zna podstawowe przyczyny odstępstw od modelu i środki zaradcze. Zna metody selekcji predyktorów, również dla sytuacji wysokowymiarowej.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe: DS2_W03, DS2_W05
Powiązane charakterystyki obszarowe: I.P7S_WG
Charakterystyka W02
Zna podstawowe metody nieliniowe klasyfikacji i regresji i wie, kiedy mogą być użyteczne. Wie jak oceniać jakość klasyfikatora i oszacowania funkcji regresji.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe: DS2_W04, DS2_W05
Powiązane charakterystyki obszarowe: I.P7S_WG
Charakterystyka W03
Wie jak stosować komitety klasyfikatorów i dobierać ich parametry i jak je wykorzystać do uporządkowania predyktorów
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe: DS2_W04, DS2_W05
Powiązane charakterystyki obszarowe: I.P7S_WG
Charakterystyka W04
Zna podstawowe charakterystyki procesów stacjonarnych, zna metody identyfikacji komponent periodycznej i trendu procesu, zna podstawowe procesy liniowe (ARMA) , zna analizę danych funkcjonalnych FDA
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe: DS2_W03, DS2_W05
Powiązane charakterystyki obszarowe: I.P7S_WG

Profil ogólnoakademicki - umiejętności

Charakterystyka U01
Umie ocenić dopasowanie modelu liniowego, zidentyfikować ewentualne odstępstwa od modelu i zaadaptować model.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe: DS2_U03, DS2_U14
Powiązane charakterystyki obszarowe: I.P7S_UW
Charakterystyka U02
Umie skonstruować klasyfikator nieliniowy i ocenić jego jakość
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe: DS2_U04
Powiązane charakterystyki obszarowe:
Charakterystyka U03
Umie skonstruować nieliniowy estymator regresji i ocenić jego jakość
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe: DS2_U03, DS2_U14
Powiązane charakterystyki obszarowe: I.P7S_UW
Charakterystyka U04
Egzamin, ocena projektu
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe: DS2_U14
Powiązane charakterystyki obszarowe: I.P7S_UW

Profil ogólnoakademicki - kompetencje społeczne

Charakterystyka K01
Rozumie społeczne aspekty podejmowanych działań data miningowych, w szczególności związane z popełnionymi błędami fałszywego sygnału i braku jego detekcji
Weryfikacja: Ocena projektu
Powiązane charakterystyki kierunkowe: DS2_K05
Powiązane charakterystyki obszarowe: I.P7S_KO, I.P7S_KR