Nazwa przedmiotu:
Statystyka obliczeniowa
Koordynator przedmiotu:
Prof. dr hab. Jan Mielniczuk
Status przedmiotu:
Obowiązkowy
Poziom kształcenia:
Studia II stopnia
Program:
Informatyka
Grupa przedmiotów:
Wspólne
Kod przedmiotu:
1120-INPAD-MSP-0112
Semestr nominalny:
1 / rok ak. 2017/2018
Liczba punktów ECTS:
5
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
.
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
.
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
.
Formy zajęć i ich wymiar w semestrze:
  • Wykład0h
  • Ćwiczenia0h
  • Laboratorium30h
  • Projekt0h
  • Lekcje komputerowe0h
Wymagania wstępne:
Znajomość rachunku prawdopodobieństwa w zakresie podstawowym
Limit liczby studentów:
.
Cel przedmiotu:
Celem przedmiotu jest zapoznanie studentów z podstawowymi metodami statystyki obliczeniowej.
Treści kształcenia:
Wykład: Metody eksploracyjnej analizy danych w jednym wymiarze, detekcja obserwacji odstających. Przestrzeń statystyczna. Problem estymacji, testowania i predykcji. Próby losowe i metody próbkowania. Metody estymacji i własności estymatorów: obciążenie, MSE, efektywność, zgodność, rozkład asymptotyczny, pivot. Konstrukcja estymatorów parametrycznych, metodą momentów, największej wiarogodności, własności, metoda delta. Ocena jakości estymatorów: ryzyko, przedziały ufności , klasyczny i typu bootstrap, walidacja krzyżowa. Metody estymacji nieparametrycznej: dystrybuanta empiryczna, histogram, estymatory jądrowe. Metody estymacji funkcji regresji: model regresji liniowej jednokrotnej, estymator MNK, średniej ruchomej, lokalnie liniowy. Problem testowania: postawienie problemu testowania, statystyka testowa i jej rozkład, obszar krytyczny, błąd I i II rodzaju, specyficzność, czułość testu, p-wartość, krzywa ROC i LIFT, podstawowe testy dla jednej i dwóch prób. Techniki konstrukcji testów (np. ilorazu wiarogodności) i związane własności, testy wielokrotne. Kontrola FDR, Procedura Bonferroniego, Holma, Benjaminiego-Hochberga. Testy nieparametryczne. Pomiar zależności stochastycznej na różnych skalach pomiarowych (rho Pearsona, Spearmana, tau Kendalla). Testowanie niezależności. Modele zależności stochastycznej i ich reprezentacje graficzne. Analiza tablic kontyngencji, modele logliniowe. Wprowadzenie do statystyki bayesowskiej; estymator bayesowski, estymator MAP. Laboratorium: Praktyczna realizacja tematów omawianych na wykładzie w oparciu o system R w oparciu o rzeczywiste i symulowane zbiory danych.
Metody oceny:
Laboratoria maks. 30 p., egzamin maks. 70 p., łącznie maks. 100 p. Na zaliczenie konieczne jest uzyskanie łącznie ponad 50 p. na 100 p. możliwych. Ostateczna ocena z przedmiotu wynika z sumy zdobytych punktów: [0, 50] – 2,0; (50, 60] – 3,0; (60, 70] – 3,5; (70, 80] – 4,0; (80, 90] – 4,5; (90, 100] – 5,0.
Egzamin:
tak
Literatura:
1. J. Johnson, Probability and Statistics for Computer Science 2. J. Gentle, Computational Statistics 3. G. Givens, J. Hoeting, Computational Statistics
Witryna www przedmiotu:
e.mini.pw.edu.pl
Uwagi:
.

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Efekt W2_01
Zna podstawowe metody reprezentacji danych jednowymiarowych z uwzględnieniem skali pomiarowej, umie zidentyfikować obserwacje odstające na podstawie wykresu pudełkowego i zinterpretować wykres kwantylowy; odróżnia zagadnienia estymacji, testowania i predykcji i zna związki między nimi; zna metody generacji prostych próby losowych z podstawowych rozkładów prawdopodobieństwa; zna metody oceny jakości estymatora na podstawie jego rozkładu, konstrukcji przedział ufności dla odpowiedniego parametru i obliczenia jego błąd średniokwadratowy; zna postawienie problemu testowania dla danych, rozróżnia błędy obu rodzajów, umie zinterpretować p-wartość, umie skonstruować krzywą ROC i LIFT; zna metodę budowy testu LRT dla prostego problemu parametrycznego
Weryfikacja: egzamin, ocena z zajęć laboratoryjnych
Powiązane efekty kierunkowe: PD_W01, PD_W03, PD_W08, PD_W09, PD_W13
Powiązane efekty obszarowe: , , , ,
Efekt W2_02
Zna podstawowe metody rangowe i wie jak symulacyjnie wyznaczać rozkład statystyk rangowych; zna podstawowe miary zależności stochastycznej i obszar ich stosowalności; zna podstawowe modele zależności w modelach wielodzielczych i umie skonstruować ich testy w modelach logliniowych
Weryfikacja: egzamin, ocena z zajęć laboratoryjnych
Powiązane efekty kierunkowe: PD_W01, PD_W03, PD_W08, PD_W09, PD_W13
Powiązane efekty obszarowe: , , , ,

Profil ogólnoakademicki - umiejętności

Efekt U2_01
Umie generować próbki pseudolosowe z różnych rozkładów prawdopodobieństwa; umie stosować metody Monte Carlo do całkowania i zagadnień optymalizacyjnych; umie dobrać test właściwy do badanego zagadnienia i potrafi stosować ów test w praktyce
Weryfikacja: egzamin, ocena z zajęć laboratoryjnych
Powiązane efekty kierunkowe: PD_U06, PD_U16, PD_U19
Powiązane efekty obszarowe: , ,
Efekt U2_02
Umie ocenić jakość estymatora parametru i skonstruować przedział ufności (klasyczny i metodą bootstrap)
Weryfikacja: egzamin, ocena z zajęć laboratoryjnych
Powiązane efekty kierunkowe: PD_U06, PD_U16, PD_U19
Powiązane efekty obszarowe: , ,
Efekt U2_03
Umie dokonać oceny kroswalidacyjnej jakości estymatora i metody prognozy
Weryfikacja: egzamin, ocena z zajęć laboratoryjnych
Powiązane efekty kierunkowe: PD_U06, PD_U16, PD_U19
Powiązane efekty obszarowe: , ,
Efekt U2_04
Umie przeprowadzić test niezależności i warunkowej niezależności w tablicach kontyngencji
Weryfikacja: egzamin, ocena z zajęć laboratoryjnych
Powiązane efekty kierunkowe: PD_U06, PD_U19
Powiązane efekty obszarowe: ,

Profil ogólnoakademicki - kompetencje społeczne

Efekt K2_01
Posiada świadomość wagi społecznej rzetelnej analizy statystycznej
Weryfikacja: egzamin, ocena z zajęć laboratoryjnych
Powiązane efekty kierunkowe: PD_K03
Powiązane efekty obszarowe: