Nazwa przedmiotu:
Techniki kompilacji
Koordynator przedmiotu:
Rajmund Kożuszek
Status przedmiotu:
Fakultatywny ograniczonego wyboru
Poziom kształcenia:
Studia I stopnia
Program:
Informatyka
Grupa przedmiotów:
Inżynieria oprogramowania
Kod przedmiotu:
TKOM
Semestr nominalny:
6 / rok ak. 2021/2022
Liczba punktów ECTS:
4
Liczba godzin pracy studenta związanych z osiągnięciem efektów uczenia się:
1. liczba godzin kontaktowych – 40 godz., w tym  obecność na wykładach: 30 godz.,  obecność na egzaminie: 3 godz.,  udział w konsultacjach związanych z realizacją wykładu: 2 godz.,  zajęcia projektowe: konsultowanie i weryfikacja etapów realizacji projektu: 5 godz. 2. praca własna studenta – 70 godz., w tym  analiza literatury i materiałów wykładowych związana z przygotowaniem do kolejnych wykładów: 30 godz.,  realizacja projektu: 30 godz.,  przygotowanie do kolokwiów i egzaminu: 10 godz. Łączny nakład pracy studenta wynosi 110 godz., co odpowiada 4pkt. ECTS.
Liczba punktów ECTS na zajęciach wymagających bezpośredniego udziału nauczycieli akademickich:
1,5 pkt. ECTS, co odpowiada 40 godz. kontaktowym
Język prowadzenia zajęć:
polski
Liczba punktów ECTS, którą student uzyskuje w ramach zajęć o charakterze praktycznym:
1 pkt. ECTS, co odpowiada 30 godz. realizacji projektu
Formy zajęć i ich wymiar w semestrze:
  • Wykład30h
  • Ćwiczenia0h
  • Laboratorium0h
  • Projekt30h
  • Lekcje komputerowe0h
Wymagania wstępne:
Programowanie obiektowe Algorytmy i struktury danych Architektura komputerów Systemy operacyjne Sztuka wytwarzania oprogramowania
Limit liczby studentów:
60
Cel przedmiotu:
Celem przedmiotu jest zapoznanie studentów z głównymi pojęciami, metodami i algorytmami związanymi z transformacją tekstów oraz podstawami budowy kompilatorów i stosowanych w nich metodach i algorytmach. W szczególności, studenci zapoznają się/pogłębiają wiedzę i umiejętności praktyczne w zakresie wyrażeń regularnych (aspektów użytkowych jak i samego sposobu realizacji mechanizmu wyrażeń regularnych – automaty niedeterministyczne i deterministyczne), gramatyki i języki (metody specyfikacji, różne klasy gramatyk – metody weryfikacji przynależności do danej klasy, przekształcanie gramatyk), gramatyki bezkontekstowe, teoretyczne i praktyczne aspekty analizy leksykalnej, składniowej, semantycznej, interpretacja i generacja kodu. W sposób praktyczny student zdobywa i weryfikuje swoją wiedzę i umiejętności poprzez realizację, w ramach zajęć projektowych, np. interpretera własnego języka programowania czy fragmentu kompilatora.
Treści kształcenia:
1. Wykład: Wprowadzenie (1h): Ogólnie o problemie kompilacji / interpretacji; wprowadzenie do budowy kompilatorów i procesu kompilacji; składniki zależne od języka źródłowego (front end) i od platformy docelowej. Potrzebne techniki i narzędzia (również teoretyczne); Języki regularne i analiza leksykalna (5h): Reprezentacje języków regularnych, formalizm wyrażeń regularnych (WR), gramatyki regularne; automaty niedeterministyczne (AN) i deterministyczne (AD). Konwersja wyrażeń regularnych na automaty, algorytm Thompsona, konwersja AN na AD (algorytm podzbiorowy), bezpośrednia konwersja WR na AD. Właściwości klasy języków regularnych. Zastosowania do wyszukiwania wzorców i analizy leksykalnej. Przykład implementacji analizatora leksykalnego i obsługi źródeł. Generatory analizatorów leksykalnych. Makrogeneracja – parametryczne przetwarzanie tekstów (3h): Typy substytucji tekstowych, rozpoznawanie makrodefinicji i makrowywołań, organizacja biblioteki makrodefinicji, reguły przesłaniania i dostępności; mechanizmy wiązania parametrów. Przykłady makrogeneratorów. Podstawy teoretyczne – języki i gramatyki (3h): Języki i gramatyki; style definiowania języka; konwencje notacyjne; przegląd metanotacji (BNF, EBNF, ISO-14977, ABNF, diagramy składniowe); Gramatyki generacyjne; Hierarchia języków wg Chomskiego, formy kanoniczne gramatyk (CNF, GNF, KNF); Twierdzenie o pompowaniu dla gramatyk bezkontekstowych; Drzewa wyprowadzeń dla gramatyk bezkontekstowych. Niejednoznaczność w gramatykach bezkontekstowych - przykłady. Języki bezkontekstowe i ich rozbiór (2h): Reprezentacje języków bezkontekstowych; właściwości gramatyk bezkontekstowych. Przekształcanie gramatyk (substytucja, usuwanie symboli niedostępnych, usuwanie produkcji pustych i jednostkowych); Usuwanie rekursji lewostronnej, faktoryzacja lewostronna. Zbiory FIRST i FOLLOW; Rozbiór rekursywnie zstępujący (5h). Schematy translacji. Schemat translacji wyrażeń arytmetycznych. Rozbiór rekursywnie zstępujący sterowany składnią (RD); Rekursywnie zstępujący analizator składniowy – przykłady praktyczne; struktury pomocnicze w analizie składniowej; Współpraca analizator składniowy – analizator leksykalny; Obsługa błędów; Rozbiór sterowany tablicą - parser LL(1); Analizatory składniowe wstępujące (5h): Schemat ogólny metod wstępujących; LR-formy; Automat LR(0) i sterownik parsera LR(0), rozbiór wyrażeń wg LR(0). Konflikty w tabelach LR(0), rozbiór SLR(1), konflikty w SLR(1). Rozbiór LR(1), LR1-formy, wyznaczanie tabeli dla parsera LR(1), redukcja LR(1) - LALR(1). Porównanie parserów. Własności i problemy decyzyjne języków bezkontekstowych. Gramatyki z atrybutami i operatorowe (2h) Gramatyki operatorowe; Rozbiór wyrażeń w gramatykach operatorowych; przykład translacji wyrażeń do Odwrotnej Notacji Polskiej (ONP); Gramatyki z atrybutami i ich wykorzystanie w generatorach parserów; Akcje semantyczne parsera. Analiza semantyczna (2h): Struktury danych i schematy programistyczne w kompilatorze; Atrybuty identyfikatorów, organizacja tabel symboli; organizacja rekursji i zmiennych lokalnych na przykładzie interpreterów. Generacja kodu i techniki optymalizacyjne (2h): Komunikacja analizatora z generatorem, alokacja pamięci w strukturach blokowych, generacja kodu dla wyrażeń i struktur sterowania; przejście z konwencji maszyny stosowej do konwencji procesora docelowego. Elementy optymalizacji kodu, optymalizacje lokalne i globalne; algorytm optymalizacji wyrażeń. 2. Projekt Zakres projektu Celem projektu jest zapoznanie się z metodami wytwarzania i budową kompilatorów. W szczególności, opanowanie przez studenta praktycznych umiejętności realizacji przetwarzania sterowanego składnią w odniesieniu do różnych typów zastosowań wykorzystujących notację sformalizowaną (symulacja, przetwarzanie i rozpoznawanie tekstu, interpretacja prostych języków). Wymagane jest przygotowanie projektu (w szczególności: zebranie i wyspecyfikowanie wymagań w toku dyskusji z prowadzącym projekt, opracowanie gramatyki własnego języka, koncepcji rozwiązania) oraz dokumentacji końcowej.
Metody oceny:
Realizacja przedmiotu obejmuje następujące formy zajęć: • wykład prowadzony w wymiarze 2 godz. tygodniowo (30 godzin); w wybranych zagadnieniach przewidziana jest aktywizacja studentów na wykładzie; • zajęcia projektowe (30 godzin); w ramach tych zajęć student, w oparciu o ustalane z prowadzącym wymagania funkcjonalne, opracowuje składnię i semantykę własnego języka a następnie realizuje kompilator, interpreter lub inny procesor tekstu. Przygotowuje projekt wstępny (zawierający zebrane wymagania, projekt rozwiązania i przypadki testowe), który po akceptacji prowadzącego jest implementowany w uzgodnionym z prowadzącym języku programowania i testowany. Efekty pracy student demonstruje w laboratorium. Po prezentacji programu student opracowuje dokumentacje końcową i przedstawia ją prowadzącemu. Student może ponadto uczestniczyć w prowadzonych co tydzień w wymiarze 2 godz. konsultacjach. Sprawdzanie założonych efektów kształcenia realizowane jest przez: • ocenę wiedzy i umiejętności związanych z realizacją tematów projektowych; • formatywną ocenę związaną z rozwiązaniem zadań przedkolokwialnych, a także z interaktywną forma prowadzenia wykładu oraz z ćwiczeniami; • ocenę wiedzy i umiejętności wykazanych na kolokwiach (na kolokwiach student może korzystać z wybranych materiałów dydaktycznych oraz książek); • ocenę wiedzy i umiejętności wykazanych na egzaminie (student może korzystać z wybranych materiałów dydaktycznych oraz książek).
Egzamin:
tak
Literatura:
• Aho A.V., Lam M., Sethi R., Ullman J.D.: “Compilers: Principles, Techniques & Tools”, 2nd edition, Pearson, Addison-Wesley, 2013; • Aho A.V., Sethi R., Ullman J.D.: Kompilatory: reguły, metody i narzędzia, WNT 2006; • Bennet J.P.: “Introduction to Compiling Techniques: A First Course Using ANSI C, Lex, and Yacc”, 2nd edition, Mc Graw Hill, 1996; • Grune D., van Reeuwijk K., Bal H. E., Jacobs C. J. H., Langendoen K.: “Modern Compiler Design”, Springer, 2016 • Reinhard W.: “Compiler Design”, Springer-Verlag Berlin and Heidelberg, 2013; • K.D. Cooper, L.Torcon: “Engineering a Compiler”, 2nd edition, Elsevier, 2011; • Mak R.:“Writing Compilers and Interpreters: A Modern Software Engineering Approach Using Java”, 2014; • Galles D.: “Modern Compiler Design”, Addison-Wesley, 2004; • Aho A.V., Sethi R., Ullman J.D., Lam J.D.: „21st Century Compilers”, Addison-Wesley, 2006; • M. T. Aegidius: “Introduction to Compiler Design”, Springer, 2011; • Pająk A., Wigura A.: Makrogeneratory, asemblery i konsolidatory, PWN, 1983; • Strona domowa i dokumentacja projektu ANTLR - https://www.antlr.org ; • Materiały elektroniczne na stronie przedmiotu
Witryna www przedmiotu:
https://usosweb.usos.pw.edu.pl/kontroler.php?_action=katalog2/przedmioty/pokazPrzedmiot&prz_kod=103D-INIOP-ISP-TKOM
Uwagi:
(-)

Efekty uczenia się

Profil ogólnoakademicki - wiedza

Charakterystyka W01
zna metody opisu języków formalnych
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W05
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o
Charakterystyka W02
zna hierarchię języków wg Chomskiego i ich modeli generacyjnych / obliczeniowych
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W05
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o
Charakterystyka W03
zna mechanizmy makrogeneracji i ich dostępność w środowiskach programistycznych
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W08
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o, III.P6S_WG
Charakterystyka W04
zna metody reprezentacji i przetwarzania języków regularnych
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W05
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o
Charakterystyka W05
zna metody analizy jednoznacznych języków bezkontekstowych (parser rekursywnie zstępujący, rozbiór wstępujący)
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W05
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o
Charakterystyka W06
zna podstawowe metody uwzględniania semantyki języka i generowania kodu wynikowego
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W08, W09
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o, III.P6S_WG
Charakterystyka W07
zna metody rozstrzygalności głównych problemów decyzyjnych w klasach języków regularnych i bezkontekstowych
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W05
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o
Charakterystyka W08
zna zasady działania kompilatorów i interpreterów
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W08, W09
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o, III.P6S_WG
Charakterystyka W09
zna metody i rozumie potrzebę modularyzacji przetwarzania danych
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W08, W09
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o, III.P6S_WG
Charakterystyka W10
rozumie niebezpieczeństwa i wady nieodpowiedniego przetwarzania danych wejściowych w programach
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W08, W10
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o, III.P6S_WG
Charakterystyka W11
rozumie wady i zalety stosowania wyrażeń regularnych oraz ich implementację w dostępnych bibliotekach i językach
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: W05, W08
Powiązane charakterystyki obszarowe: P6U_W, I.P6S_WG.o, III.P6S_WG

Profil ogólnoakademicki - umiejętności

Charakterystyka U01
potrafi zdefiniować formalnie składnię języka w metanotacji EBNF (lub podobnej)
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U01, U04, U09
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o, I.P6S_UK
Charakterystyka U02
potrafi przekształcić gramatykę języka wg zadanych kryteriów (sprawdzić kryteria LL(1), usunąć produkcje jednostkowe, sprowadzić do postaci normalnej Chomskiego)
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U04, U07
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o
Charakterystyka U03
potrafi przekształcać dowolnie reprezentację języka regularnego (wyrażenia regularne, automaty skończone, gramatyki regularne)
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U07
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o
Charakterystyka U04
potrafi zrealizować analizator leksykalny i parser rekursywnie zstępujący wg zadanej gramatyki
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U04
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o
Charakterystyka U05
potrafi zastosować model przetwarzania sterowanego składnią (schemat translacji) do prostych problemów obliczeniowych
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U08, U10, U04
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UO, I.P6S_UK, III.P6S_UW.o, I.P6S_UW.o
Charakterystyka U06
potrafi zaprojektować środowisko programowe do osadzenia akcji semantycznych dla prostego języka bezkontekstowego
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U01
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o
Charakterystyka U07
potrafi wykorzystywać generatory analizatorów leksykalnych i składniowych oraz integrować je we własnym programie
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U04, U10
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o, I.P6S_UK
Charakterystyka U08
potrafi odpowiednio ustrukturalizować kod programu i schemat przetwarzania
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U02, U06
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o
Charakterystyka U09
potrafi stosować dobre wzorce programowania do przetwarzania tekstu
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U02, U10
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o, I.P6S_UK
Charakterystyka U10
potrafi w sposób bezpieczny implementować strumieniowe przetwarzanie żądań, tekstu itp.
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U02, U06, U10
Powiązane charakterystyki obszarowe: III.P6S_UW.o, P6U_U, I.P6S_UW.o, I.P6S_UK
Charakterystyka U11
potrafi sprawnie posługiwać się wyrażeniami regularnymi
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: U02, U06
Powiązane charakterystyki obszarowe: P6U_U, I.P6S_UW.o, III.P6S_UW.o

Profil ogólnoakademicki - kompetencje społeczne

Charakterystyka K01
rozumie potrzebę stałego aktualizowania i wzbogacania posiadanej wiedzy
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: K01, K03
Powiązane charakterystyki obszarowe: P6U_K, I.P6S_KK, I.P6S_KR
Charakterystyka K02
ma świadomość konieczności komunikowania się z otoczeniem, także pozazawodowym, w sposób zrozumiały dla odbiorcy
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: K05
Powiązane charakterystyki obszarowe: P6U_K, I.P6S_KO
Charakterystyka K03
potrafi planować działania projektowe wg wymaganego terminu
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: K03
Powiązane charakterystyki obszarowe: P6U_K, I.P6S_KK, I.P6S_KR
Charakterystyka K04
potrafi samodzielnie pozyskiwać poszerzające informacje o rozwiązywanym problemie i dostępnych narzędziach programowych
Weryfikacja: kolokwia, egzamin, projekt
Powiązane charakterystyki kierunkowe: K01, K03
Powiązane charakterystyki obszarowe: P6U_K, I.P6S_KK, I.P6S_KR