Nazwa przedmiotu:
Synteza mechanizmów decyzyjnych
Koordynator przedmiotu:
dr hab. inż. Andrzej Karbowski
Status przedmiotu:
Fakultatywny ograniczonego wyboru
Poziom kształcenia:
Studia II stopnia
Program:
Informatyka
Grupa przedmiotów:
Przedmioty specjalnościowe
Kod przedmiotu:
SMDUZ
Semestr nominalny:
3 / rok ak. 2014/2015
Liczba punktów ECTS:
5
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
120 - 30 godzin wykładów, 30 godzin ćwiczeń projektowych, liczonych w mierze tradycyjnej oraz około 60 godzin pracy własnej
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
3
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
2
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium0h
  • Projekt30h
  • Lekcje komputerowe0h
Wymagania wstępne:
Matematyka wyższa na poziomie studiów technicznych I stopnia
Limit liczby studentów:
30
Cel przedmiotu:
Celem wykładu jest przedstawienie zagadnień oraz algorytmów dotyczących projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: i) zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się, ii) nauka formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego, iii) nauka projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych). Celem projektu jest opanowanie przez studentów podstawowych schematów decyzyjnych oraz metod obliczeniowych, zwłaszcza algorytmu dyskretnego stochastycznego programowania dynamicznego dla zadań z horyzontem skończonym i nieskończonym (wersja z dyskontem).
Treści kształcenia:
Treść wykładu 1. Zadanie syntezy optymalnej reguły (optymalnego prawa sterowania) w warunkach niepewności na skończonym horyzoncie czasu, formułowanie zadania, pierwotne i wtórne wskaźniki jakości, modele niepewności, zadanie syntezy stochastycznej, zadanie syntezy minimaksowej. 2. Metodyka i możliwości rozwiązania zadania syntezy optymalnej w układzie zamkniętym, dla skończonej liczby etapów decyzyjnych (skończony horyzont działania), z pełnym i niezakłóconym pomiarem stanu; metoda programowania dynamicznego; przykłady zadań optymalnej syntezy i ich rozwiązań, w tym zadanie liniowo-kwadratowe. 3. Zadania syntezy optymalnych reguł decyzyjnych dla nieskończonej liczby etapów (nieskończony horyzont działania): wskaźnik jakości z uwzględnieniem dyskonta (zadanie z dyskontem), wskaźnik w postaci wartości średniej kosztu i inne. 4. Rozwiązanie zadania z dyskontem, warunki istnienia rozwiązania, równanie Bellmana, metody wyznaczania stacjonarnej reguły decyzyjnej w przypadku skończonej liczby wartości stanu. 5. Optymalna synteza reguł decyzyjnych w przypadku niepełnego i zakłóconego pomiaru stanu; algorytm programowania dynamicznego, statystyki wystarczające, zagadnienie filtracji i estymacji stanu. Efekt dualny i efekt ostrożności, własność separowalności. Zadanie liniowo-kwadratowo-gaussowskie (LQG). 6. Praktyczne sposoby podejmowania decyzji operacyjnych w warunkach niepewności: parametryzowane reguły decyzyjne o danej postaci, sterowanie i zarządzanie z powtarzaną optymalizacją decyzji, układy warstwowe. 7. Sposoby konstrukcji parametryzowanych reguł decyzyjnych: wykorzystanie reguł liniowych, sztucznych sieci neuronalnych oraz zbiorów rozmytych. Układy uczące się. 8. Bieżące podejmowanie decyzji (sterowanie) w oparciu o powtarzaną optymalizację w układzie otwartym oraz w oparciu o powtarzaną syntezę wykorzystującą uproszczony model niepewności, w tym model w postaci prognoz wielowariantowych. 9. Przykłady współczesnych zastosowań reguł decyzyjnych do zarządzania (sterowania operacyjnego). Warstwowe układy decyzyjne, układ sterowania procesem technologicznym i zagadnienie wyboru wielkości regulowanych. Wykładowi towarzyszy projekt. Składa się on z 2 części (zadania na horyzoncie skończonym i nieskończonym) , w ramach których studenci rozwiązują praktyczne zadania optymalnej syntezy z dziedziny ekonomii, sterowania systemami wodno-gospodarczymi, zarządzania sieciami teleinformatycznymi. Ważną składnikiem każdej z części jest samodzielna implementacja algorytmu optymalizacyjnego oraz weryfikacja poprawności na drodze wielokrotnej symulacji sterowania w układzie zamkniętym dla różnych przebiegów zakłóceń. Projekt jest realizowany w środowisku Freemat (jest to darmowy klon Matlaba).
Metody oceny:
Oceny punktowe z dwóch zadań projektowych. Ocena indywidualnego zadania od 0 do 25 punktów. Łączna liczba punktów 50, do zaliczenia wymagane 26 lub więcej punktów. Egzamin obejmujący rozwiązanie zadań rachunkowych oraz odpowiedzi na pytania. Ocena od 0 do 50 punktów. Egzamin uważany jest za zdany po uzyskaniu 26 lub więcej punktów. W razie potrzeby przeprowadzany jest uzupełniający egzamin ustny. Zaliczenie przedmiotu wymaga zaliczenia projektu i zdania egzaminu. Oceny końcowe wystawiane są zgodnie z ogólnie przyjętą skalą, w szczególności ocena 3 (dst) po uzyskaniu 52 do 60 punktów.
Egzamin:
tak
Literatura:
1. Krzysztof Malinowski i Andrzej Karbowski, Synteza Mechanizmów Decyzyjnych, E-book, Kopipol/OKNO PW, 2007. 2. Dimitri P. Bertsekas, Dynamic Programming and Optimal Control, Vols. I and II, Athena Scientific, 1995, (3rd Edition Vol. I, 2005, 4rd Edition Vol. II, 2012), wybrane fragmenty (lektura nieobowiązkowa)
Witryna www przedmiotu:
https://red.okno.pw.edu.pl/witryna/wybor_przedmiotu.php?sub_ed=1027
Uwagi:

Efekty uczenia się

Profil praktyczny - wiedza

Efekt T2P_W01, T2P_W02, T2P_W03, T2P_W04, T2P_W07
Znajomość mechanizmów zapewniających osiągnięcie najlepszych z możliwych efektów działania konkretnego układu dynamicznego działającego w warunkach niepewnośc i ryzyka na bazie danego modelu formalnego.
Weryfikacja: Poprzez zastosowanie abstrakcyjnych algorytmów w konkretnych zadaniach praktycznych rozwiązywanych numerycznie.
Powiązane efekty kierunkowe:
Powiązane efekty obszarowe:

Profil praktyczny - umiejętności

Efekt T2P_U03, T2P_U07, T2P_U08, T2P_U09, T2P_U11, T2A_U15, T2P_U16, T2P_U17, T2P_U18, T2P_U19
Umiejętność klasyfikacji zadania z konkretnej dziedziny, zwłaszcza pod względem zastosowanego modelu niepewności (stochastyczna, typu przynależności do zbioru, prognoza, ew. wielowariantowa), rodzaju horyzontu (skończony, nieskończony), typu wskaźników jakości, a następnie opracowania pełnego modelu formalnego, doboru właściwej metody obliczeniowej i rozwiązania na maszynie cyfrowej.
Weryfikacja: Zmierzone w serii realizacji (symulacji) wskaźniki jakości, dokładniej ich wartość średnia (w przypadku stochastycznego modelu zakłóceń) lub maksymalna (w przypadku modelu typu przynależności do zbioru) w stosunku do wartości odnośnego wskaźnika otrzymanej podczas obliczeń, tzn. syntezy mechanizmu decyzyjnego.
Powiązane efekty kierunkowe:
Powiązane efekty obszarowe:

Profil praktyczny - kompetencje społeczne

Efekt T2P_K02, T2P_K04, T2P_K05, T2P_K06, T2P_K07
Pamiętanie przy opracowywaniu pewnych regulacji w życiu społecznym o konieczności weryfikacji po jakimś czasie zgodności ich efektów z oczekiwanymi. Jeśli jej nie ma, należy je wyznaczyć ponownie. Jednocześnie w przypadkach zadań, w których trudno jest stworzyć ścisły model formalny, należy zastosować podejścia "miękkie", tzw. inteligentne - np. rozmyte, neuronowe, zakładające automatyczne uczenie się systemu.
Weryfikacja: W czasie, gdy uczestnicy zajęć osiągną w życiu zawodowym lub społecznym pozycję związaną z opracowywaniem regulacji dla podlegających im podwładnych, społeczności lokalnych, poprzez ocenę czy wprowadzone zmiany przyniosły oczekiwane, pozytywne efekty.
Powiązane efekty kierunkowe:
Powiązane efekty obszarowe:

Profil ogólnoakademicki - wiedza

Efekt SMD_W1
Poznanie metod projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się,
Weryfikacja: EGZAMIN Sprawdzenie przyswojenia części teoretycznej. Ma charakter pisemny z ewentualnym uzupełnieniem ustnym w razie potrzeby.
Powiązane efekty kierunkowe: K2_W03, K2_W06, K2_W08
Powiązane efekty obszarowe: T2A_W04, T2A_W04, T2A_W07, T2A_W08

Profil ogólnoakademicki - umiejętności

Efekt SMD_U1
Umiejętność formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego, Umiejętność projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych).
Weryfikacja: EGZAMIN i PROJEKT (napisanie dwóch programów w języku Matlab wyznaczających optymalne polityki decyzyjne w zadaniu optymalizacji z horyzontem skończonym /wskaźnik Bolzy/ oraz nieskończonym /wskaźnikiem jest suma kosztów/zysków etepowych z dyskontem/ oraz weryfikujących je na drodze symulacyjnej).
Powiązane efekty kierunkowe: K2_U02, K2_U03, K2_U06, K2_U07, K2_U15, K1_U02, K1_U03
Powiązane efekty obszarowe: T2A_U02, T2A_U03, T2A_U09, T2A_U10, T2A_U19, T2A_U07, T2A_U08

Profil ogólnoakademicki - kompetencje społeczne

Efekt SMD_K1
Uświadomienie, że przy podejmowaniu decyzji obowiązujących przez wiele etapów w warunkach ryzyka kluczowe znaczenie ma sprzężenie zwrotne. Pewne reguły decyzyjne lub programy sterowania wyznaczone dla założonych prognoz mają wartość i poprawiają funkcjonowanie systemu wtedy, gdy przyjęto wystarczająco dobry model dynamiki oraz niepewności, w przeciwnym wypadku procedura powinna być ponowiona.
Weryfikacja: Pozycja absolwenta studiów w życiu zawodowym i społecznym, uznanie jego autorytetu i kompetencji.
Powiązane efekty kierunkowe: K2_K01, K2_K02, K2_K04, K2_K05
Powiązane efekty obszarowe: T2A_K06, T2A_K02, T2A_K04, T2A_K05