Kamil Nešetřil

Geodata, informace, modely, software

Uživatelské nástroje

Nástroje pro tento web


Slovníček pojmů – převzato z Wikipedie

Produktivita

↩ Zpět

Snippet from Wikipedia: Unicode

Unicode je technická norma pro oblast výpočetní techniky definující jednotnou znakovou sadu a konzistentní kódování znaků pro reprezentaci a zpracovávání textů použitelné pro většinu písem používaných v současnosti na Zemi. Unicode je vyvíjen v součinnosti s ISO/IEC 10646 a je publikován elektronicky jako The Unicode Standard. Nejnovější verze obsahuje repertoár více než 140 000 znaků pokrývajících 159 moderních a historických písem a mnoho sad symbolů. Standard sestává ze sady tabulek pro vizuální referenci, popisu metod kódování, sady referenčních datových souborů a dalších položek, jako například vlastností znaků, pravidel pro normalizaci textů, dekompozici, řazení, vykreslování a zobrazování obousměrného textu (pro správné zobrazení textu obsahující písma psaná zprava doleva i zleva doprava, jako například arabské a hebrejské písmo). Poslední verze je Unicode 16.0 ze září roku 2024. Normu udržuje Unicode Consortium.

Snippet from Wikipedia: UTF-8

UTF-8 (zkratka pro UCS/Unicode Transformation Format) je jedním ze způsobů kódování znaků, tedy přiřazení číselných kódů znakové sadě (písmenům abecedy a dalším znakům) pro potřeby počítačového zpracování textů. Představuje rozšířený mezinárodní standard dle norem Unicode/ISO/IEC 10646 a dominantní způsob kódování na internetovém webu, který umožňuje ukládat a zobrazovat texty s použitím široké palety světových písem.

Používá proměnnou délku znaku od 1 do 4 bajtů, zatímco standardy UCS-2 a UCS-4/UTF-32 mají pevnou délku 2 a 4 bajty (16 a 32 bitů). Byl navržen pro zpětnou kompatibilitu s ASCII, které obsahuje jen základní sadu anglické abecedy a se kterým má totožný způsob kódování 7bitových znaků. UTF-8 je definováno v ISO 10646-1:2000 Annex D, v RFC 3629 a v Unicode 4.0.

Důvody vzniku, základní vlastnosti

Přirozené kódování znaků Unicode/UCS do 2 nebo 4 bajtů se nazývá UCS-2/UTF-16 a UCS-4/UTF-32.

Snippet from Wikipedia: Přípona souboru

Přípona souboru (správněji přípona názvu souboru, anglicky file name extension) je v informatice část názvu souboru, která je zpravidla oddělená znakem tečka (.) od vlastního jména souboru. Přípona souboru má zpravidla délku 1 až 4 znaky. Její význam je v určení typu a obsahu souboru (viz formát souboru). V systémech DOS a Microsoft Windows je podle přípony určena akce, která je se souborem provedena. V unixových systémech má přípona menší význam a systém obvykle zjišťuje typ souboru podle jeho obsahu (viz nástroj file).

Charakteristika

Ve starších typech souborových systémů byla přípona pevnou součástí názvu souboru a formát názvu souboru se udával ve tvaru N+M kde N je maximální počet znaků v názvu souboru a M je maximální počet znaků přípony.

Poslední úprava: