- Nazwa przedmiotu:
- Wstęp do uczenia maszynowego
- Koordynator przedmiotu:
- Prof. dr hab. inż. Jacek Mańdziuk
- Status przedmiotu:
- Obowiązkowy
- Poziom kształcenia:
- Studia I stopnia
- Program:
- Inżynieria i Analiza Danych
- Grupa przedmiotów:
- Wspólne
- Kod przedmiotu:
- 1120-DS000-ISP-0242
- Semestr nominalny:
- 4 / rok ak. 2017/2018
- Liczba punktów ECTS:
- 5
- Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
- 1. godziny kontaktowe – 67 h; w tym
a) obecność na wykładach – 30 h
b) obecność na laboratoriach – 30 h
c) konsultacje – 5 h
d) obecność na egzaminie – 2 h
2. praca własna studenta – 60 h; w tym
a) zapoznanie się z literaturą – 5 h
b) przygotowanie projektu – 30 h
c) przygotowanie raportu/prezentacji – 10 h
d) przygotowanie do egzaminu – 10 h
Razem 127 h, co odpowiada 5 pkt. ECTS
- Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
- 1. obecność na wykładach – 30 h
2. obecność na laboratoriach – 30 h
3. konsultacje – 5h
4. obecność na egzaminie – 2 h
Razem 67 h, co odpowiada 3 pkt. ECTS
- Język prowadzenia zajęć:
- polski
- Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
- 1. obecność na laboratoriach – 30 h
2. przygotowanie projektu – 30 h
3. przygotowanie raportu/prezentacji – 10 h
Razem 70 h, co odpowiada 3 pkt. ECTS
- Formy zajęć i ich wymiar w semestrze:
-
- Wykład0h
- Ćwiczenia0h
- Laboratorium0h
- Projekt0h
- Lekcje komputerowe0h
- Wymagania wstępne:
- brak
- Limit liczby studentów:
- .
- Cel przedmiotu:
- Celem przedmiotu jest zapoznanie słuchaczy z podstawowymi metodami uczenia maszynowego nadzorowanego i nienadzorowanego oraz nauczenie ich praktycznej umiejętności ich stosowania i oceny ich przydatności
- Treści kształcenia:
- Wykład (program przedmiotu):
1. Wstępne przetwarzanie danych: redukcja wymiaru danych, ekstrakcja cech: analiza składowych głównych, SVD, skalowanie wielowymiarowe, korelacja cech
2. Generalizacja. Dobre dopasowanie a przeuczenie, walidacja krzyżowa. Miary podobieństwa obiektów, segmentacja danych w oparciu o podobieństwo.
3. Uczenie nienadzorowane: analiza skupień. Miary odległości, algorytmy optymalizacji funkcji kryterialnej (k-means, k-medoids), metody hierarchiczne.
4. Problem klasyfikacji binarnej/wieloklasowej: podejście bayesowskie, empiryczne klasyfikatory bayesowskie (naiwna metod bayesowska, klasyfikator knn)
5. Liniowe metody klasyfikacyjne: LDA, klasyfikator logistyczny, SVM (wersja liniowa)
6. Drzewa jako klasyfikatory. Ekstrakcja reguł z drzew.
7. Reguły asocjacyjne, systemy regułowe.
8. Ewaluacja skuteczności klasyfikatora. Macierz błędów. Miary błędów oraz ich interpretacja.
9. Kompleksowa analiza wszystkich etapów budowy oraz zastosowania narzędzi analizy danych na wybranych przykładach (case studies) z wykorzystaniem metodyki CRISP-DM.
Laboratorium:
Projekt: praktyczna, wieloaspektowa analiza rzeczywistych zbiorów danych obejmująca zagadnienia omawiane na wykładzie.
- Metody oceny:
- Zaliczenie przedmiotu oparte jest o wyniki dwóch zadań realizowanych w ramach laboratorium (w sumie maksymalnie 60 pkt) oraz wyniki egzaminu (maksymalnie 40 pkt). W przypadku zadań realizowanych w laboratorium oceniana jest zarówno jakość rozwiązań jak i terminowość ich realizacji. Szczegółowe zasady przyznawania punktów przedstawiane są studentom podczas pierwszych zajęć laboratoryjnych (dot. laboratorium) oraz wykładowych (dot. egzaminu).
Ocena końcowa zależy od łącznej liczby punktów uzyskanych z zadań punktowanych oraz egzaminu i jest wyznaczana zgodnie z poniższymi regułami: 0-50 pkt – 2.0, 51-60 pkt – 3.0, 61-70 pkt – 3.5, 71-80 pkt – 4.0, 81-90 pkt – 4.5, 91-100 pkt – 5.0. Warunkiem koniecznym uzyskania oceny pozytywnej jest zdobycie co najmniej 30 pkt z laboratorium oraz 20 pkt z egzaminu.
- Egzamin:
- tak
- Literatura:
- 1. Cichosz, Systemy Uczące się, WNT 2007
2. Bishop, Pattern Recognition and Machine Learning, Springer 2006
3. Flasiński , Wstęp do Sztucznej Inteligencji, PWN 2011
- Witryna www przedmiotu:
- .
- Uwagi:
- .
Efekty uczenia się
Profil ogólnoakademicki - wiedza
- Charakterystyka W01
- Zna podstawowe metody wstępnej obróbki danych, w tym metod redukcji wymiaru danych i ekstrakcji cech.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe:
DS_W04, DS_W05
Powiązane charakterystyki obszarowe:
I.P6S_WG
- Charakterystyka W02
- Posiada wiedzę teoretyczną i praktyczną w zakresie podstawowych metod liniowej klasyfikacji oraz kombinatorycznych i hierarchicznych metod analizy skupień.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe:
DS_W04
Powiązane charakterystyki obszarowe:
I.P6S_WG
- Charakterystyka W03
- Posiada wiedzę dotyczącą podstawowych metod indukcji drzew decyzyjnych oraz ekstrakcji reguł z drzew.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe:
DS_W04
Powiązane charakterystyki obszarowe:
I.P6S_WG
Profil ogólnoakademicki - umiejętności
- Charakterystyka U01
- Potrafi wykonać i zinterpretować analizę składowych głównych oraz metodę skalowania wielowymiarowego.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe:
DS_U06
Powiązane charakterystyki obszarowe:
I.P6S_UW
- Charakterystyka U02
- Potrafi skonstruować klasyfikator liniowy i ocenić jego jakość.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe:
DS_U13, DS_U16
Powiązane charakterystyki obszarowe:
I.P6S_UW
- Charakterystyka U03
- Potrafi zbudować klasyfikator w postaci drzewa decyzyjnego oraz ocenić jego praktyczną skuteczność.
Weryfikacja: Egzamin, ocena projektu
Powiązane charakterystyki kierunkowe:
DS_U13
Powiązane charakterystyki obszarowe:
I.P6S_UW
Profil ogólnoakademicki - kompetencje społeczne
- Charakterystyka K01
- Umie współpracować w grupie projektowej przyjmując w niej różne role
Weryfikacja: Ocena projektu
Powiązane charakterystyki kierunkowe:
DS_K04
Powiązane charakterystyki obszarowe:
I.P6S_KR