Pomocí ChatGPT
ChatGPT – Bez přihlášení nelze nahrávat soubory, proto se můžete přihlásit například takto: Přihlásit se → Pokračovat přes Google → zadat školní e-mail …@tul.cz
→ dále to znáte…
Jeden z kódů v jazyce , který mi vygeneroval ChatGPT:
Prompt: V jazyce R udělej sloupcový graf českých olympijských medailí podle jednotlivých let. Nechci instalovat další balíčky.
# Data: roky a počet medailí roky <- c(1996, 2000, 2004, 2008, 2012, 2016, 2020) medaile <- c(11, 8, 10, 6, 10, 10, 11) # Vytvoření sloupcového grafu barplot(height = medaile, names.arg = roky, col = "blue", xlab = "Roky", ylab = "Počet medailí", main = "České olympijské medaile podle let")
❕ Je tam funkce zalomená na více řádek, proto ve webovém R je třeba spustit celý skript najednou ► Run, nikoliv po řádcích (Ctrl+↵Enter).
🐭 Zkuste stejný prompt, nebo raději vymyslete jiný ;-)
Některé funkce jsou dostupné v balíčcích (package, library), které se načítají pomocí funkce library(jméno_balíčku)
.1)
ChatGPT je jazykový model, a tak programovacím jazykům rozumí skvěle. Proč zadávat Googlu obecné dotazy, když je možné se zeptat Chatu GPT přímo?
- Alternativa k ChatGPT: Google Gemini
- RTutor – specializovaná webová aplikace pro generování kódu v R pomocí AI, která obsahuje pěkné uživatelské rozhraní a příklady dat i kódu.
- ChatGPT přímo v RStudiu: mlverse/chattr
💡 Obdobný graf (avšak se spolehlivými daty) snáze a elegantněji vytvoří WolframAlpha.
🐴 Smyslem těchto ukázek bylo demonstrovat snadnost použití programovacího jazyka, nikoliv jeho všechny možnosti. Výhodou programovacího jazyka (na rozdíl od GUI) je, že v něm můžete „naprogramovat cokoliv“.
Co jsme již dělali v Excelu
ChatGPT
osoby.csv
a kraje.csv
stáhněte a načtěte do ChatuGPT.
Mám databázi případů COVID-19 v ČR. Propoj ji s číselníkem krajů. V Pythonu vytvoř graf časového vývoje a graf celkového počtu případů v jednotlivých krajích.
Jazyk Python je možný spouštět přímo v ChatGPT.
R
Pro toto je třeba R běžící na počítači (nikoliv online verze).
osoby <- read.csv("https://files.dataearth.cz/osoby.csv") # Histogram jen z jednoho sloupečku hist(osoby$vek) # Základní statistika mean(osoby$vek) # průměr max(osoby$vek) # maximum # Takto zobrazíme veliké množství bodů. smoothScatter(osoby) # Jen 1000, protože 47 tisíc řádků je příliš # mnoho pro vykreslení všech bodů několikrát. osoby_1000 <- head(osoby, n = 1000) plot(osoby_1000) # Kategorická veličina (histogram není možné sestavit) table(osoby$pohlavi) barplot(table(osoby$pohlavi)) # Časový průběh vyskyty <- table(osoby$datum) plot(vyskyty) # Pro skutečný časový graf by bylo třeba např. plot.ts()
🐭 Složitější: Join, agregace podle krajů a pohlaví, denormalizace (kontingenční tabulka), ggplot2, ggsave()
S prvotním načtením dat vám pomůže RStudio:
▶ Pokračování: Dál