Nazwa przedmiotu:
Synteza reguł decyzyjnych
Koordynator przedmiotu:
Krzysztof MALINOWSKI, Andrzej KARBOWSKI
Status przedmiotu:
Fakultatywny ograniczonego wyboru
Poziom kształcenia:
Studia I stopnia
Program:
Informatyka
Grupa przedmiotów:
Przedmioty techniczne
Kod przedmiotu:
SRD
Semestr nominalny:
7 / rok ak. 2012/2013
Liczba punktów ECTS:
5
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
151
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium30h
  • Projekt0h
  • Lekcje komputerowe0h
Wymagania wstępne:
Podstawy Optymalizacji oraz ogólnowydziałowe przedmioty z zakresu matematyki
Limit liczby studentów:
48
Cel przedmiotu:
- przedstawienie zagadnień dotyczących projektowania optymalnych i uproszczonych reguł i mechanizmów decyzyjnych w zastosowaniach do zarządzania lub sterowania systemami: zadania syntezy optymalnej, parametryzowane reguły decyzyjne, układy z powtarzana optymalizacją decyzji oraz układy uczące się, - nauka formułowania i rozwiązywania zadań optymalnej syntezy przy pomocy rodziny metod programowania dynamicznego, - nauka projektowania reguł i mechanizmów decyzyjnych wykorzystujących podejścia uproszczone, w tym optymalizację parametryczną oraz powtarzaną optymalizację decyzji z wykorzystaniem prognoz wielkości i wejść swobodnych (niesterowanych). Ang. - presentation of problems in design of optimal and suboptimal decision policies and rules with applications to management of control systems: optimal control design problems, parametric decision rules, structures with repetitive optimization of decisions, learning systems, - learning formulating and solving optimal decision/control problems using methods of dynamic programming family, - learning design of rules and decision policies based on suboptimal approaches, including parametric optimization and repetitive optimization of decisions with the use of forecasts of uncontrolled inputs.
Treści kształcenia:
Treść wykładu 1. Zadanie syntezy optymalnej reguły (optymalnego prawa sterowania) w warunkach niepewności na skończonym horyzoncie czasu, formułowanie zadania, pierwotne i wtórne wskaźniki jakości, modele niepewności, zadanie syntezy stochastycznej, zadanie syntezy minimaksowej. 2. Metodyka i możliwości rozwiązania zadania syntezy optymalnej w układzie zamkniętym, dla skończonej liczby etapów decyzyjnych (skończony horyzont działania), z pełnym i niezakłóconym pomiarem stanu; metoda programowania dynamicznego; przykłady zadań optymalnej syntezy i ich rozwiązań, w tym zadanie liniowo-kwadratowe. 3. Zadania syntezy optymalnych reguł decyzyjnych dla nieskończonej liczby etapów (nieskończony horyzont działania): wskaźnik jakości z uwzględnieniem dyskonta (zadanie z dyskontem), wskaźnik w postaci wartości średniej kosztu i inne. 4. Rozwiązanie zadania z dyskontem, warunki istnienia rozwiązania, równanie Bellmana, metody wyznaczania stacjonarnej reguły decyzyjnej w przypadku skończonej liczby wartości stanu. 5. Optymalna synteza reguł decyzyjnych w przypadku niepełnego i zakłóconego pomiaru stanu; algorytm programowania dynamicznego, statystyki wystarczające, zagadnienie filtracji i estymacji stanu. Efekt dualny i efekt ostrożności, własność separowalności. Zadanie liniowo-kwadratowo-gaussowskie (LQG). 6. Praktyczne sposoby podejmowania decyzji operacyjnych w warunkach niepewności: parametryzowane reguły decyzyjne o danej postaci, sterowanie i zarządzanie z powtarzaną optymalizacją decyzji, układy warstwowe. 7. Sposoby konstrukcji parametryzowanych reguł decyzyjnych: wykorzystanie reguł liniowych, sztucznych sieci neuronalnych oraz zbiorów rozmytych. Układy uczące się. 8. Bieżące podejmowanie decyzji (sterowanie) w oparciu o powtarzaną optymalizację w układzie otwartym oraz w oparciu o powtarzaną syntezę wykorzystującą uproszczony model niepewności, w tym model w postaci prognoz wielowariantowych. 9. Przykłady współczesnych zastosowań reguł decyzyjnych do zarządzania (sterowania operacyjnego). Warstwowe układy decyzyjne, układ sterowania procesem technologicznym i zagadnienie wyboru wielkości regulowanych. Zakres laboratorium Laboratorium składa się z 6 ćwiczeń, realizowanych w zespołach 2-osobowych, podczas których studenci rozwiązują praktyczne zadania optymalnej syntezy z dziedziny ekonomii, sterowania systemami wodno-gospodarczymi, zarządzania sieciami teleinformatycznymi. Ważną częścią każdego ćwiczenia jest samodzielna implementacja algorytmu optymalizacyjnego oraz weryfikacja poprawności, na drodze wielokrotnej symulacji sterowania, w układzie zamkniętym, dla różnych przebiegów zakłóceń. Program laboratorium został pomyślany tak, by jego uczestnicy opanowali wszystkie podstawowe schematy decyzyjne oraz metody obliczeniowe, w tym: klasyczny algorytm stochastycznego programowania dynamicznego w zadaniach z horyzontem skończonym, algorytmy kolejnych przybliżeń oraz iteracji polityki w zadaniach nieliniowych z horyzontem nieskończonym, metodologię LQG w wersji standardowej oraz rozszerzonej (uwzględnienie nieliniowości modelu oraz wskaźnika jakości), zastosowanie metod gradientowych optymalizacji trajektorii sterowań (wraz z rozwiązaniem równania sprzężonego) w podstawowych wersjach sterowania predykcyjnego z kilkoma scenariuszami zakłóceń. Podczas zajęć w laboratorium wykorzystywane jest środowisko Matlab oraz jego dwie biblioteki: Optimization oraz Control Toolbox.
Metody oceny:
Oceny punktowe z ćwiczeń laboratoryjnych obejmujące przygotowanie i wykonanie ćwiczenia. Ocena indywidualnego ćwiczenia od 0 do 12 + 2 za zaliczenie wszystkich 4 ćwiczeń. Łączna liczba punktów 50, do zaliczenia wymagane 26 lub więcej punktów. Egzamin obejmujący rozwiązanie zadań rachunkowych oraz odpowiedzi na pytania. Ocena od 0 do 50 punktów. Egzamin uważany jest za zdany po uzyskaniu 26 lub więcej punktów. W razie potrzeby przeprowadzany jest uzupełniający egzamin ustny. Zaliczenie przedmiotu wymaga zaliczenia laboratorium i zdania egzaminu. Oceny kończowe wystawiane są zgodnie z ogólnie przyjętą skalą, w szczegolności ocena 3 (dst) po uzyskaniu 52 do 60 punktów.
Egzamin:
tak
Literatura:
1. Krzysztof Malinowski i Andrzej Karbowski, Synteza Mechanizmów Decyzyjnych, E-book, Kopipol/OKNO PW, 2007. 2. Dimitri P. Bertsekas, Dynamic Programming and Optimal Control, Vols. I and II, Athena Scientific, 1995, (3rd Edition Vol. I, 2005, 3rd Edition Vol. II, 2007), wybrane fragmenty (lektura nieobowiązkowa) 3. Instrukcje do 4 ćwiczeń laboratoryjnych
Witryna www przedmiotu:
https://studia.elka.pw.edu.pl/priv/11Z/SRD.A/
Uwagi:

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Efekt Wpisz opis
ma wiedzę w zakresie budowy i strojenia parametryzowanych reguł decyzyjnych oraz struktur i układów z powtarzaną optymalizacją decyzji.
Weryfikacja: egzamin, testy wstępne do ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_W22
Powiązane efekty obszarowe: T1A_W03

Profil ogólnoakademicki - umiejętności

Efekt Wpisz opis
projektować i badać układy z powtarzaną optymalizacją decyzji
Weryfikacja: egzamin, wykonanie ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_U25
Powiązane efekty obszarowe: T1A_U09, T1A_U10

Profil ogólnoakademicki - kompetencje społeczne

Efekt Wpisz opis
Student, który zaliczył przedmiot potrafi pracować w zespole
Weryfikacja: ocena przebiegu ćwiczeń laboratoryjnych
Powiązane efekty kierunkowe: K_K02, K_K03
Powiązane efekty obszarowe: T1A_K02, T1A_K03