Kamil Nešetřil

Správa a analýza dat o životním prostředí

Uživatelské nástroje

Nástroje pro tento web


Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revizePředchozí verze
Poslední revizeObě strany příští revize
cs:cheatsheet [21.03.2024] – [Jak začít] Kamil Nešetřilcs:cheatsheet [21.03.2024] – [Tahák pro Pentaho Data Integration] Kamil Nešetřil
Řádek 2: Řádek 2:
 //Toto je návod pro práci s Pentaho Data Integration (<nowiki>PDI</nowiki>) – Kettle – zejména s vývojovým prostředím <nowiki>Spoon</nowiki>//. Nejprve si přečtěte [[tools#platforma_pentaho|Obecné informace o PDI a dalších komponentách platformy Pentaho]]. //Toto je návod pro práci s Pentaho Data Integration (<nowiki>PDI</nowiki>) – Kettle – zejména s vývojovým prostředím <nowiki>Spoon</nowiki>//. Nejprve si přečtěte [[tools#platforma_pentaho|Obecné informace o PDI a dalších komponentách platformy Pentaho]].
  
-> [[https://hop.apache.org/|{{ :hop_logo.svg?nolink&40|Apache Hop}}]]Od té doby, kdy byla firma Pentaho koupena korporací Hitachi, vývoj platformy Pentaho stagnuje a web platformy je zmatený. Původní autor PDI (Matt Casters) vytvořil [[https://hop.apache.org/|Apache Hop]], fork PDI, který má konečně elegantní architekturu a je intenzivně vyvíjen. Transfor­mace PDI je možo do něj importovat. Nově funguje [[doc>https://hop.apache.org/blog/2022/12/hop-2.2.0/#_new_data_grid_toolbars_instead_of_right_click_menu|náhled dat na kliknutí]], stejně jako v PDI.+> [[https://hop.apache.org/|{{ :hop_logo.svg?nolink&40|Apache Hop}}]]Od té doby, kdy byla firma Pentaho koupena korporací Hitachi, vývoj platformy Pentaho stagnuje a web platformy je zmatený. Původní autor PDI (Matt Casters) vytvořil [[hop>https://hop.apache.org/|Apache Hop]], fork PDI, který má konečně elegantní architekturu a je intenzivně vyvíjen. Transfor­mace PDI je možo do něj importovat. Nově funguje [[doc>https://hop.apache.org/blog/2022/12/hop-2.2.0/#_new_data_grid_toolbars_instead_of_right_click_menu|náhled dat na kliknutí]], stejně jako v PDI.
  
 {{ :spoon.png?nolink|}} {{ :spoon.png?nolink|}}
Řádek 9: Řádek 9:
 Pokud nemůžete instalovat, použijte [[https://portableapps.com/apps/utilities/OpenJDK64|portable]] verzi.\\  Pokud nemůžete instalovat, použijte [[https://portableapps.com/apps/utilities/OpenJDK64|portable]] verzi.\\ 
 Při //aktualizaci// Javy je třeba ve Windows ručně aktualizovat cestu k Javě: „Upravit proměnné prostředí systému“ -> „Proměnné prostředí“ -> ''JAVA_HOME'')). Při //aktualizaci// Javy je třeba ve Windows ručně aktualizovat cestu k Javě: „Upravit proměnné prostředí systému“ -> „Proměnné prostředí“ -> ''JAVA_HOME'')).
-  - Stáhněte si [[https://www.hitachivantara.com/pentaho/pentaho-plus-platform/data-integration-analytics/pentaho-community-edition.html|Pentaho Data Integration (Community Edition)]].+  - Stáhněte si [[download>https://www.hitachivantara.com/pentaho/pentaho-plus-platform/data-integration-analytics/pentaho-community-edition.html|Pentaho Data Integration (Community Edition)]].
   - Rozbalte archiv ZIP do libovolné složky.   - Rozbalte archiv ZIP do libovolné složky.
   - Spusťte ''<nowiki>Spoon</nowiki>.bat''((tento skript také nastaví prostředí spuštěním dávky ''set-pentaho-env.bat'' – netřeba spouštět samostatně. \\ Případné chyby: viz [[vid>https://www.youtube.com/watch?v=PH6mWe3YVCQ|video]]))   - Spusťte ''<nowiki>Spoon</nowiki>.bat''((tento skript také nastaví prostředí spuštěním dávky ''set-pentaho-env.bat'' – netřeba spouštět samostatně. \\ Případné chyby: viz [[vid>https://www.youtube.com/watch?v=PH6mWe3YVCQ|video]]))
Řádek 69: Řádek 69:
     * Využívá [[wp>Apache Tika]], který podporuje [[https://tika.apache.org/1.22/formats.html|různé formáty]] –  pouze metadata k: DWG, GDAL, HDF, NetCDF, Matlab a nějakým geografickým formátům.     * Využívá [[wp>Apache Tika]], který podporuje [[https://tika.apache.org/1.22/formats.html|různé formáty]] –  pouze metadata k: DWG, GDAL, HDF, NetCDF, Matlab a nějakým geografickým formátům.
     * Pro PDF používá [[https://pdfbox.apache.org|Apache PDFBox]], který umí vyplňovat formuláře, dělit a slučovat soubory PDF atd.     * Pro PDF používá [[https://pdfbox.apache.org|Apache PDFBox]], který umí vyplňovat formuláře, dělit a slučovat soubory PDF atd.
-  * //Machine Intelligence// využíval volitelně různé enginy: R, Python, Weka či elegantně v Javě s využitím GPU Nvidia [[https://deeplearning4j.konduit.ai/|Deeplearning4j]].+  * [[git>pentaho-labs/pentaho-machine-intelligence|Machine Intelligence]] využívá volitelně různé enginy: R, Python, Weka či elegantně v Javě s využitím GPU Nvidia [[https://deeplearning4j.konduit.ai/|Deeplearning4j]].
   * [[git>pentaho-labs/pmi-visualization|PMI Visualization]] Plugin – vizualizace v PDI {{:pmi_visu_plugin.jfif?nolink|PMI Visualization – 3D Exploration and Scatter Plot Matrix}}   * [[git>pentaho-labs/pmi-visualization|PMI Visualization]] Plugin – vizualizace v PDI {{:pmi_visu_plugin.jfif?nolink|PMI Visualization – 3D Exploration and Scatter Plot Matrix}}
  
Poslední úprava: 20.04.2024