Cvičení 2 - Markovův model
Průběh cvičení
- Prošli jsme spolu Markovovy modely.
- Na tabuli jsme udělali příklad prvního a druhého řádu na malém vstupu nad abecedou {0, 1}. Poté jste si zkusili sami první řád na náhodně vygenerované posloupnosti 0002102101 nad abecedou {0, 1, 2}. Viděli jste, že už první řád odhalil hodně struktury.
- Zbytek hodiny jste programovali úkoly níže.
- Do příště můžete popřemýšlet o úkolu 2, abychom mohli udělat malou “besídku” nápadů.
- Jedna možnost, jak implementovat Markovův model. Nic moc kód, dopočítává pouze frekvence výskytů všech znaků za všemi n-gramy (tj. chcete-li pravděpodobnost, vydělte si to četností ngramu).
Zápočet
Rozdělili jsme si zápočtové projekty. Všichni, kdo poslali svůj výběr, by měli dostat výsledek emailem. Pokud ne, tak se ozvěte. Ti, co se ještě neozvali mají čas do pátku 23.2.2024, 23:59 CET. Poté jim vyberu já.
Úkoly
- Implementujte n-tý Markovův model pro posloupnost celých čísel (ideálně načítanou ze souboru).
- ověřte svou implementací příklady z tabule.
- Meteo data:
- Zde máte meteorologická data o Lysé hoře za posledních 60 let. Budeme se bavit průměrnou teplotou po dnech. Zdroj dat
- Zkuste navrhnout nějaký rozumný model pro průměrnou teplotu po dnech zaokrouhlenou na celé stupně. V duchu příkladu z prvního cvičení.
- Ověřte vlastnosti svého modelu programově. Tj. vytvořte program, který načte data o teplotě po dnech do posloupnosti, zaokrouhlí je a poté provedte své experimenty s modelováním. Prozatím nemusíte řešit výsledné kódování. Stačí třeba jen co nejvíce snížit počet kódovaných symbolů.