Kamil Nešetřil

Správa a analýza dat o životním prostředí

Uživatelské nástroje

Nástroje pro tento web


Na hlavní článek

Pomocí ChatGPT

ChatGPT – Bez přihlášení nelze nahrávat soubory, proto se můžete přihlásit například takto: Přihlásit sePokračovat přes Google → zadat školní e-mail …@tul.cz → dále to znáte…



Jeden z kódů v jazyce RPROJ, který mi vygeneroval ChatGPT:

Prompt: V jazyce R udělej sloupcový graf českých olympijských medailí podle jednotlivých let. Nechci instalovat další balíčky.

# Data: roky a počet medailí
roky    <- c(1996, 2000, 2004, 2008, 2012, 2016, 2020)
medaile <- c(11, 8, 10, 6, 10, 10, 11)
 
# Vytvoření sloupcového grafu
barplot(height = medaile, names.arg = roky, col = "blue",
        xlab = "Roky", ylab = "Počet medailí",
        main = "České olympijské medaile podle let")

Je tam funkce zalomená na více řádek, proto ve webovém R je třeba spustit celý skript najednou ► Run, nikoliv po řádcích (Ctrl+↵Enter).


🐭 Zkuste stejný prompt, nebo raději vymyslete jiný ;-)


Některé funkce jsou dostupné v balíčcích (package, library), které se načítají pomocí funkce library(jméno_balíčku).1)

ChatGPT je jazykový model, a tak programo­vacím jazykům rozumí skvěle. Proč zadávat Googlu obecné dotazy, když je možné se zeptat Chatu GPT přímo?

  • Alternativa k ChatGPT: Google Gemini
  • RTutor – specializovaná webová aplikace pro generování kódu v R pomocí AI, která obsahuje pěkné uživatelské rozhraní a příklady dat i kódu.
  • ChatGPT přímo v RStudiu: mlverse/chattr

💡 Obdobný graf (avšak se spolehlivými daty) snáze a elegantněji vytvoří WolframAlpha.

🐴 Smyslem těchto ukázek bylo demonstrovat snadnost použití programovacího jazyka, nikoliv jeho všechny možnosti. Výhodou programovacího jazyka (na rozdíl od GUI) je, že v něm můžete „naprogramovat cokoliv“.


Co jsme již dělali v Excelu

ChatGPT

osoby.csvkraje.csv stáhněte a načtěte do ChatuGPT.

Mám databázi případů COVID-19 v ČR.
Propoj ji s číselníkem krajů.
V Pythonu vytvoř graf časového vývoje 
a graf celkového počtu případů v jednotlivých krajích.

Jazyk Python je možný spouštět přímo v ChatGPT.

🔒 Když jsem zadal odkazy na soubory do chatu, tak si je nezanalyzoval, a vymýšlel si jména sloupečků.


Programovací jazyk R

R

Pro toto je třeba R běžící na počítači (nikoliv online verze).

osoby <- read.csv("https://files.dataearth.cz/osoby.csv")
 
# Histogram jen z jednoho sloupečku
hist(osoby$vek)
 
# Základní statistika
mean(osoby$vek)    # průměr
max(osoby$vek)     # maximum
 
# Takto zobrazíme veliké množství bodů.
smoothScatter(osoby)
 
# Jen 1000, protože 47 tisíc řádků je příliš
# mnoho pro vykreslení všech bodů několikrát.
osoby_1000 <- head(osoby, n = 1000)
plot(osoby_1000)
 
# Kategorická veličina (histogram není možné sestavit)
table(osoby$pohlavi)
barplot(table(osoby$pohlavi))
 
# Časový průběh
vyskyty <- table(osoby$datum)
plot(vyskyty) # Pro skutečný časový graf by bylo třeba např. plot.ts()

TBD 🐭 Složitější: Join, agregace podle krajů a pohlaví, denormalizace (kontingenční tabulka), ggplot2, ggsave()





S prvotním načtením dat vám pomůže RStudio:
RStudio – panel vpravo nahoře.
Vygeneruje kód, který pak dále používáte.

▶ Pokračování: Dál

1)
Když funkce vrací chybu, tak balíček není nainstalovaný. Nainstalujte jej tedy: Instalace balíčku (package, library) – v RStudiu vpravo
Poslední úprava: 18.12.2024