Obsah
MS Excel
Nahrané přednášky a cvičení (možno stáhnout)
Přednáška
- hledání, filtry, slicer (průřez), datové typy (datum, Data → Ověření dat), podmíněné formátování (s využitím logických hodnot:
IFERROR
) - formát buněk → vlastní – jednotky měření
- operátory (
&
) - funkce
KDYŽ
,A
,NEBO
- vyhledávací (
SVYHLEDAT
, tj. anglickyVLOOKUP
) či pokročilejší verze:XLOOKUP
;
- databázové (kritéria v tabulce: na řádku = AND; ve sloupci = OR). Příklad:
=DAVERAGE(osoby[#All];"vek";J3:K4)
, tj.
=DPRŮMĚR(osoby[#Vše];"vek";J3:K4)
- Od základního využití Excelu k pokročilému: doplňky do Excelu (ASAP Utilities a Microsoft Power Query) → Pentaho Data Integration → programovací jazyky (R, Python)
- Pentaho Data Integration alias Kettle – ETL (extract, transform, load) – nástroj pro transformaci dat. Pokud potřebujete data uložená v souboru (Excel, text, XML, apod.) či v databázi zpracovat, libovolně upravit a pak uložit do souboru (mj. .xlsx, .pdf, .csv), nahrát do databáze, nahrát na server či poslat e-mailem. Screenshot
Cvičení
Zdrojová data
Osoby s prokázanou nákazou COVID-19 (datum hlášení, věk a pohlaví nakažené osoby, KHS, informace o místě a zemi nákazy).2)
Postup
- Data → Z textu/CSV
- Dohledání dat z jiných tabulek: funkce
SVYHLEDAT
(anglickyVLOOKUP
) - Kontingenční tabulka a graf (včetně slicer = průřez, tj. tlačítka pro filtrování)
- Vložení → Kontingenční graf (anglicky pivot chart)
- Vložení → Průřez (anglicky slicer)
- Mapa: Vykopírovat data z kontingenční tabulky, kde jsou názvy krajů, okresů či států (každá geografická jednotka na jednom řádku) → Vložení → Mapy (❕ Funguje jen v plnohodnotném Excelu, nikoliv školním office.com)
Hezký dashboard
Popis požadavků
Máte dvě možnosti:
- Zreprodukujte, co jsme dělali, a to se stejnými či jinými daty:
- spojit tabulky3);
- přidat sloupec
Případy
a vyplňte jej jedničkami (na každém řádku je jedna osoba); - sestavit kontingenční tabulky (pivot tables) a dva kontingenční grafy – např.
- spojnicový (čárový) graf, když je na ose x čas a
- sloupcový graf, když jsou na ose x kategorie jako např. kraj (kraje je vhodné seřadit podle počtu případů, nikoliv podle abecedy);
- filtrovat data pomocí průřezu (slicer);
- smysluplně využít podmíněné formátování.
- Nebo proveďte jiné zpracování či analýzu dat dle vaší volby, která však nebude jednodušší než v případě první volby.
Nakonec uveďte nějaký zajímavý poznatek, který je výsledkem vaší analýzy (např. přes 80 % případů je z měst nad 100 000 obyvatel). Z grafu musí být jasné, co sděluje (začněte jednoduchým grafem, na každou osu jen jednu veličinu). Vaše práce je dostačující, pokud vám řeknu/napíšu, že „vyhovuje“.
Pokud nějakou část úlohy vámi použitý sw neumožňuje (slicer, mapa), tak tuto část nedělejte. Zamyslete se nad alternativním řešením.
Čtyři alternativy k plnohodnotnému Excelu
Ani jeden ze tří alternativních programů (níže) neumí vytvořit kontingenční tabulku a graf zároveň. Vytvořte kontingenční tabulku a tu využijte pro vytvoření kontingenčního grafu (označte tabulku a vložte graf).
Excel – online po přihlášení účtem TUL
- Není možno importovat CSV. Je třeba je otevřít v Poznámkovém bloku, vložit přes schránku a rozdělit do sloupců (Data → Text do sloupců).
- Neumí mapu.
- Přehlednější je Klasický pás karet:
- Průřez (Slicer):
LibreOffice
- List → Vložit list ze souboru
VLOOKUP
- Vložit → Kontingenční tabulka
- Úpravy → Odkazy na externí soubory… → Aktualizovat
- Aby se data nepřepsala při aktualizaci, je vhodné s nimi pracovat na jiném listu.
- Neumí mapu.
Tabulky Google
- Soubor → Importovat (nebude se aktualizovat)
SVYHLEDAT
- Vložit → Kontingenční tabulka
- Slicer: Data → Přidat průřez
Doplňková videa
Funkce použitá v našem cvičení pro připojení názvů krajů, okresů a států k jejich kódům
Import CSV + kontingenční graf a tabulka
Excel budete dále využívat příští rok v předmětu Základy statistiky ve zdravotnictví.
To stejné v jazyce R
Jazyk R – Využít ChatGPT, Google a RStudio (je nainstalované v učebně). 🐭