Kamil Nešetřil

Správa a analýza dat o životním prostředí

Uživatelské nástroje

Nástroje pro tento web


Microsoft Excel na TUL (office.com)

MS Excel

Přednáška

  • grafy, koláčový graf (takto ne1)); principy vizualizace
  • hledání, filtry, slicer (průřez), datové typy (datum, Data → Ověření dat), podmíněné formátování (s využitím logických hodnot: IFERROR)
  • formát buněk → vlastní – jednotky měření
  • operátory (&)
  • funkce
    • KDYŽ, A, NEBO
    • vyhledávací (SVYHLEDAT, tj. anglicky VLOOKUP) či pokročilejší verze: XLOOKUP;
    • databázové (kritéria v tabulce: na řádku = AND; ve sloupci = OR). Příklad:
      =DAVERAGE(osoby[#All];"vek";J3:K4), tj.
      =DPRŮMĚR(osoby[#Vše];"vek";J3:K4)
  • Od základního využití Excelu k pokročilému: doplňky do Excelu (ASAP Utilities a Microsoft Power Query) → Pentaho Data Integration → programovací jazyky (R, Python)
    • Pentaho Data Integration alias Kettle – ETL (extract, transform, load) – nástroj pro transformaci dat. Pokud potřebujete data uložená v souboru (Excel, text, XML, apod.) či v databázi zpracovat, libovolně upravit a pak uložit do souboru (mj. .xlsx, .pdf, .csv), nahrát do databáze, nahrát na server či poslat e-mailem. Screenshot
  • 🔒 příklad z Dekonty 👁
  • 🔒 dále podle knížky, projít menu 👁
  • 🔒 maticové (jeden vzorec pro celou oblast, a to bez mezivýpočtů)

Cvičení

Zdrojová data

Osoby s prokázanou nákazou COVID-19 (datum hlášení, věk a pohlaví nakažené osoby, KHS, informace o místě a zemi nákazy).2)

Postup

  • Data → Z textu/CSV
  • Dohledání dat z jiných tabulek: funkce SVYHLEDAT (anglicky VLOOKUP)
  • Kontingenční tabulka a graf (včetně slicer = průřez, tj. tlačítka pro filtrování)
    • Vložení → Kontingenční graf (anglicky pivot chart)
    • Vložení → Průřez (anglicky slicer)
  • Mapa: Vykopírovat data z kontingenční tabulky, kde jsou názvy krajů, okresů či států (každá geografická jednotka na jednom řádku) → Vložení → Mapy   ( Funguje jen v plno­hodnot­ném Excelu, nikoliv školním office.com)



Hezký dashboard



Popis požadavků

Máte dvě možnosti:

  1. Zreprodukujte, co jsme dělali, a to se stejnými či jinými daty:
    • spojit tabulky3);
    • přidat sloupec Případy a vyplňte jej jedničkami (na každém řádku je jedna osoba);
    • sestavit kontingenční tabulky (pivot tables) a dva kontingenční grafy – např.
      • spojnicový (čárový) graf, když je na ose x čas a
      • sloupcový graf, když jsou na ose x kategorie jako např. kraj (kraje je vhodné seřadit podle počtu případů, nikoliv podle abecedy);
    • filtrovat data pomocí průřezu (slicer);
    • smysluplně využít podmíněné formátování.
  2. Nebo proveďte jiné zpracování či analýzu dat dle vaší volby, která však nebude jednodušší než v případě první volby.

Nakonec uveďte nějaký zajímavý poznatek, který je výsledkem vaší analýzy (např. přes 80 % případů je z měst nad 100 000 obyvatel). Z grafu musí být jasné, co sděluje (začněte jednoduchým grafem, na každou osu jen jednu veličinu). Vaše práce je dostačující, pokud vám řeknu/napíšu, že „vyhovuje“.

Pokud nějakou část úlohy vámi použitý sw neumož­ňuje (slicer, mapa), tak tuto část nedělejte. Zamyslete se nad alternativním řešením.


Čtyři alternativy k plnohodnotnému Excelu

Ani jeden ze tří alternativních programů (níže) neumí vytvořit kontingenční tabulku a graf zároveň. Vytvořte kontingenční tabulku a tu využijte pro vytvoření kontingenčního grafu (označte tabulku a vložte graf).

Microsoft Excel na TUL (office.com)

Excel – online po přihlášení účtem TUL

  • Není možno importovat CSV. Je třeba je otevřít v Poznámkovém bloku, vložit přes schránku a rozdělit do sloupců (Data → Text do sloupců).
  • Neumí mapu.
  • Slicer

LibreOffice

LibreOffice

  • List → Vložit list ze souboru
  • VLOOKUP
  • Vložit → Kontingenční tabulka
  • Úpravy → Odkazy na externí soubory… → Aktualizovat
    • Aby se data nepřepsala při aktualizaci, je vhodné s nimi pracovat na jiném listu.
  • Neumí mapu.

Tabulky Google

Tabulky Google

  • Soubor → Importovat (nebude se aktualizovat)
  • SVYHLEDAT
  • Vložit → Kontingenční tabulka
  • Slicer: Data → Přidat průřez

CryptPad


Doplňková videa

Funkce použitá v našem cvičení pro připojení názvů krajů, okresů a států k jejich kódům


Import CSV + kontingenční graf a tabulka


Excel budete dále využívat příští rok v předmětu Základy statistiky ve zdravotnictví.

Programovací jazyk R

To stejné v jazyce R

Jazyk R – Využít ChatGPT, Google a RStudio (je nainstalované v učebně). 🐭




Kurz je financován v rámci projektu
Rozvoj lidských zdrojů TUL pro zvyšování relevance, kvality a přístupu ke vzdělání v podmínkách Průmyslu 4.0 (ROLIZ 4.0), reg.č. CZ.02.2.69/0.0/0.0/16_015/0002329. Licence Creative Commons: Uveďte původ – Zachovejte licenci

3)
či převést svoji vlastní tabulku z široké formy do „nudle“ (normalizace)
Poslední úprava: 16.06.2024