Nazwa przedmiotu:
Advanced Machine Learning
Koordynator przedmiotu:
Prof. dr hab. Jan Mielniczuk
Status przedmiotu:
Obowiązkowy
Poziom kształcenia:
Studia II stopnia
Program:
Data Science
Grupa przedmiotów:
Współny
Kod przedmiotu:
.
Semestr nominalny:
2 / rok ak. 2022/2023
Liczba punktów ECTS:
6
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
1. godziny kontaktowe – 83 h; w tym a) obecność na wykładach – 30 h b) obecność na laboratoriach – 30 h c) obecność na zajęciach projektowych – 15 h d) konsultacje – 5 h | e) obecność na egzaminie – 3 h 2. praca własna studenta – 70 h; w tym a) zapoznanie się z literaturą – 5 h b) przygotowanie projektu – 25 h c) rozwiązanie zadań domowych – 10 h d) przygotowanie do zajęć projektowych – 10 h e) przygotowanie prezentacji projektu – 5 h f) przygotowanie do egzaminu – 10 h g) przygotowanie do zajęć laboratoryjnych –5 h Razem 153 h, co odpowiada 6 pkt. ECTS
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
1. obecność na wykładach – 30 h 2. obecność na laboratoriach – 30 h 3. obecność na zajęciach projektowych – 15 h 4. konsultacje – 5 h 5. obecność na egzaminie – 3 h Razem 83 h, co odpowiada 3pkt. ECTS
Język prowadzenia zajęć:
angielski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
1. obecność na laboratoriach – 30 h 2. obecność na zajęciach projektowych – 15 h 3. przygotowanie projektu – 25 h 4. rozwiązanie zadań domowych – 10 h 5. przygotowanie do zajęć laboratoryjnych –5 h 6. przygotowanie do zajęć projektowych – 10 h 7. przygotowanie prezentacji projektu – 5h Razem 100 h, co odpowiada 4 pkt. ECTS
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium30h
  • Projekt15h
  • Lekcje komputerowe0h
Wymagania wstępne:
Introduction to Machine Learning
Limit liczby studentów:
Number of groups: no limits Project – the number of students in a group matches the limits defined by the Warsaw University of Technology Laboratory – the number of students in a group matches the lim
Cel przedmiotu:
Course objective: The aim of the course is to acquiant listeners with advanced machine learning techniques and to teach them, via hands-on approach, how to model and analyse regression data with the aid the state-of-the art statistical and data mining techniques,, including in particular modeling methods for regression curves, classification methods and analysis of time series.
Treści kształcenia:
Lecture: 1. Linear regression; Least Squares Method, regression diagnostics nd tests 2. Linear regression: departures from the linear model and its adaptation 3. Bayesian approach to linear modelling: Bayesian model comparison 4. Regularisation in regression: ridge regression and Lasso 5. High-dimensional regression, variable selection, filters, wrappers, criterion methods, greedy solutions to variable selection 6. Generalized linear models: Poisson and negative binomial responses 7. Loglinear models, contingency tables 8. Nonlinear regression: nonlinear parametric methods, nonparametric methods, regression tress CART, MARS method 9. Linear classification methods: empirical Bayes rules, density estimation 10. Nonlinear classification methods: QDA, classification TREES CART, kernel SVM. Multilabel classification. 11. Committees of classifiers: bagging, boosting, gradient algorithms, random forests. 12. Graphical models: Bayesian networks 13. Graphical models: random Markov fields, inference for graphical models 14. Practical construction of learning system for high-dimensional data: Multisplit, Random Subspace Methods, Shrunken Centroids 15. Time series: time series characteristics, forecasting, Yule-Walker method, innovation algorithm 16. Linear processes: ARMA(p,q) modelling 17. Functional Data Analysis 18. General kernel method 19. Mixture models and EM algorithm Laboratory: Analysis and modelling of data using classification, regression and time series analytical methods Project classes: Practical and multipurpose analysis of given data sets and construction of automatic modelling system meeting specific requirements ( bound on mean squared error of a forecast, LIFT criterion on test data)
Metody oceny:
50% based on project grading, 50%: exam performance
Egzamin:
tak
Literatura:
1..Bishop, Pattern Recognition and Machine Learning, Springer 2006 2. Hastie, Tibshirani, Friedman, Elements of Statistical Learning, wydanie drugie, Springer 2009 3. Izenman, Modern Multivariate Statistical Techniques, Springer 2008
Witryna www przedmiotu:
.
Uwagi:
.

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Charakterystyka W01
He/She knows how to fit linear model using Least Squares regression, Lasso, and Ridge method,knows main types of model inadequacy and remedial methods. He/She has knowledge on variable selection, also in high-dimensional case.
Weryfikacja: Exam, grading of the project
Powiązane charakterystyki kierunkowe: DS2_W02, DS2_W04
Powiązane charakterystyki obszarowe:
Charakterystyka W02
He/She knows nonlinear regression estimation methods and when they are useful. Knows how to assess goodness of fit for regression and adequacy of classifier. Knows how to construct commmittess of classifiers and how to use them to rank predictors. Knows basic characteristics of statationary processes.
Weryfikacja: Exam, grading of the projec
Powiązane charakterystyki kierunkowe: DS2_W03
Powiązane charakterystyki obszarowe:

Profil ogólnoakademicki - umiejętności

Charakterystyka U01
He/She is able to assess goodness of fit of a linear model, to identify possible departures from the linear model and modify the linear model
Weryfikacja: Exam, grading of the project
Powiązane charakterystyki kierunkowe: DS2_U03, DS2_U08, DS2_U14
Powiązane charakterystyki obszarowe:
Charakterystyka U02
He/She is able to construct nonlinear classifier and assess its performance
Weryfikacja: Exam, grading of the project
Powiązane charakterystyki kierunkowe: DS2_U04, DS2_U08, DS2_U14
Powiązane charakterystyki obszarowe:
Charakterystyka U03
He/She is able to construct nonlinear regression estimator and assess its performance
Weryfikacja: Exam, grading of the project
Powiązane charakterystyki kierunkowe: DS2_U03, DS2_U08, DS2_U14
Powiązane charakterystyki obszarowe:
Charakterystyka U04
He/She is able to construct a forecast based on linear/nonlinear time series models
Weryfikacja: Exam, grading of the project
Powiązane charakterystyki kierunkowe: DS2_U03, DS2_U14
Powiązane charakterystyki obszarowe:

Profil ogólnoakademicki - kompetencje społeczne

Charakterystyka K01
He/She understands consequences of data mining based conclusions, in particular of reporting false discovery signals
Weryfikacja: Grading of the project
Powiązane charakterystyki kierunkowe: DS2_K02, DS2_K03
Powiązane charakterystyki obszarowe: