Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Předchozí verze | |||
— | cs:cheatsheet [21.03.2024] (aktuální) – [Tahák pro Pentaho Data Integration] Kamil Nešetřil | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
+ | ======Tahák pro Pentaho Data Integration ====== | ||
+ | //Toto je návod pro práci s Pentaho Data Integration (< | ||
+ | > [[https:// | ||
+ | |||
+ | {{ : | ||
+ | ===== Jak začít ===== | ||
+ | - Nainstalujte si [[javalang> | ||
+ | Pokud nemůžete instalovat, použijte [[https:// | ||
+ | Při // | ||
+ | - Stáhněte si [[download> | ||
+ | - Rozbalte archiv ZIP do libovolné složky. | ||
+ | - Spusťte ''< | ||
+ | - Přejděte na záložku **Design**. \\ {{: | ||
+ | - Přetáhněte položky ze složek vlevo na pracovní plochu vpravo //(drag and drop)//. | ||
+ | |||
+ | Níže je seznam některých kroků (//steps//) transformací a dále totéž pro jobs (úlohy vytvořené z více transformací). Jsou zmíněny i triky a tipy, které mi nebyly z dokumentace zřejmé. | ||
+ | |||
+ | |||
+ | |||
+ | |||
+ | ===== Některé často používané kroky v transformacích ===== | ||
+ | ^ Symbol | ||
+ | | {{ : | ||
+ | |Jiné kroky umožňují načítat data z (a ukládat do) nejrůznějších databází, zdrojů (e-mail, lokální počítač, FTP, HTTP) a souborů (MS Excel, [[wpcs> | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | | [[https:// | ||
+ | |||
+ | Další kroky jako doplňky pro PDI: | ||
+ | * Google Spreadsheet Input/ | ||
+ | * [[git> | ||
+ | * Extrahuje data např. z PDF či HTML. | ||
+ | * Využívá [[wp> | ||
+ | * Pro PDF používá [[https:// | ||
+ | * [[git> | ||
+ | * [[git> | ||
+ | |||
+ | ===== Některé často užívané entries v jobs ===== | ||
+ | ^ Symbol ^ Název ^ Popis ^ | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | | {{ : | ||
+ | |||
+ | Oficiální zdroj uvádí všechny kroky [[hitachi> | ||
+ | Tomu v Apache Hop odpovídají [[doc> | ||
+ | |||
+ | =====Regulární výrazy===== | ||
+ | Regulárních výrazů je více typů. Zde jsou uvedeny tak, jak fungují v PDI. | ||
+ | |||
+ | **Tabulka** Výběr vstupních souborů (regulární výraz odpovídá názvu souborů) | ||
+ | ^Popis | ||
+ | |Soubory s danou příponou |'' | ||
+ | |Libovolné soubory|'' | ||
+ | |Soubory začínající na '' | ||
+ | |||
+ | **Tabulka** Výběr z textového řetězce | ||
+ | ^Popis | ||
+ | |Mezery a tabulátory |<code reg>[ \t]{1, | ||
+ | |Mezi závorkami |<code reg> | ||
+ | |Po mezeře před závorkou |<code reg>[]* (.*) \(.*</ | ||
+ | |Do znaku čárka, středník či tečka|'' | ||
+ | |Do znaku čárka, středník či tečka apod.|'' | ||
+ | |||
+ | **Tabulka** Validace textového řetězce | ||
+ | ^Popis | ||
+ | |Validace čísla\\ napsaného jako text\\ s ne více než dvěma\\ desetinnými místy |<code reg> | ||
+ | |::: |<code reg> | ||
+ | |6 až 8 číslic |<code reg> | ||
+ | |Dvě verze téhož jména |<code reg> | ||
+ | |Jména políček v šachu\\ např. '' | ||
+ | |Cokoliv začínající číslicí |<code reg> | ||
+ | |Číslo s desetinnou tečkou (může být i záporné)|'' | ||
+ | |Číslo s tečkou na konci|'' | ||
+ | |||
+ | =====JavaScript===== | ||
+ | Zkopírovat hodnoty do prázdných polí na následucících řádcích. Jako je v Excelu //Vyplnit dolů//: | ||
+ | <code javascript> | ||
+ | var novy_sloupec; | ||
+ | if(existujici_sloupec === null) | ||
+ | {} | ||
+ | else | ||
+ | { novy_sloupec=existujici_sloupec; | ||
+ | |||
+ | =====Formula===== | ||
+ | [[pentaho> | ||
+ | Názvy sloupců se zadávají v hranatých závorkách. | ||
+ | |||
+ | '' | ||
+ | '' | ||
+ | '' | ||
+ | '' | ||
+ | '' | ||
+ | |||
+ | =====Dílčí tipy===== | ||
+ | * Nenechat prázdné řádky ve vstupním dialogu (smaž) | ||
+ | * Chyby odvádět do samostatných větví. První krok v transformaci však nemůže někam poslat chybové řádky, protože řádky ještě nejsou v PDI. | ||
+ | * Využívat krok [[hitachi> | ||
+ | * Využívat proměnné a parametry (viz výše) | ||
+ | * Relativní cesty ('' | ||
+ | * spojovat pomocí jména souboru, | ||
+ | * Skoky (šipičky – spojení dvou kroků) je možno deaktivovat (ale někdy je to způsobí nefunkčnost zdrojového kroku | ||
+ | * Ve vzdálené databázi musí být povolen přístup (JDBC) z jiného počítače | ||
+ | * Zaškrtněte: | ||
+ | * Klávesové zkratky atd. | ||
+ | * < | ||
+ | * zmáčknutím mezerníku na stepu se ukážou atributy, dvojklik prostředním tlačítkem -> description | ||
+ | * označit krok, na který chci navázat + dvojklik na nový krok v nabídce vlevo -> nový krok se přidá do transformace a vytvoří se skok (spojující šipka). | ||
+ | * málo užitečný [[https:// | ||
+ | * Dobrá praxe | ||
+ | * ukládat vstupní a výstupní soubory odděleně (složky '' | ||
+ | * Dokumentovat za pomoci poznámek | ||
+ | * Pro export do SQLite je třeba za pomoci SQL vytvořit tabulku a pak do ní až dávat data (možno však ve stejné transformaci, | ||
+ | * [[https:// | ||
+ | * [[git> | ||
+ | * [[https:// | ||
+ | * [[vid> | ||
+ | * PBA (Pentaho Server) je možno využít jako repozitář PDI (od v.7) | ||
+ | |||
+ | |||
+ | * **FAQ z již nedostupného webu** | ||
+ | * //When I start ''< | ||
+ | * Edit the ''< | ||
+ | * Replace in the last line '' | ||
+ | * Add a '' | ||
+ | * Save and try it again. | ||
+ | * //How to use JNDI?// | ||
+ | * If you look inside the PDI main directory you'll see a sub-directory called '' | ||
+ | |||
+ | < | ||
+ | |||
+ | |||
+ | ===== Literatura ===== | ||
+ | ROLDÁN, María Carina, 2017. //Learning Pentaho Data Integration 8 CE : Third Edition//. [[https:// |