Úkol 3: analýza hlavních komponent, shluková analýza

(i.)               Najděte první 3 hlavní komponenty dat numerických vstupních atributů a vyjádření těchto dat v nich.

(ii.)              Zopakujte (i.) po normalizaci vstupních proměnných na jednotkový rozptyl a porovnejte podíl celkového rozptylu, který odpovídá prvním 3 hlavním komponentám.

(iii.)            Znázorněte graficky vyjádření původních souřadnic a původních dat pomocí hlavních komponent nalezených v (i.) a (ii.).

(iv.)            Pro jednoduché spojení shluků a 2 vhodně zvolené vzdálenosti použitelné i pro shlukování na základě centroidů (k-means) proveďte hierarchickou shlukovou analýzu dat vstupních atributů.

(v.)             Výsledky (iv.) znázorněte pomocí dendrogramů.

(vi.)            Pro vzdálenost vedoucí k vyšší korelaci mezi délkou spojení shluků a vzdáleností dat rozdělte na základě výsledků (iv) data vstupních atributů do vhodně zvoleného počtu shluků.

(vii.)          Do téhož počtu shluků rozdělte při použití téže vzdálenosti data vstupních atributů  shlukováním na základě centroidů.

(viii.)         Shluky získané oběma metodami znázorněte graficky.