7. Čeština, její kódování a národní prostředí
Národní prostředí
-
Zobrazovaní národních znaku a jejich vkládání
z klávesnice. Obě tyto úlohy jsou spolu natolik svázané, že je vhodné
je řešit současně. Odděleně je ovsem probrána lokalizace konzole a
grafického prostředí X Window Systém. Po provedeni tohoto kroku lze
používat češtinu v programech, které nekladou zvláštní odpor, u nichž
se nepožaduje, aby komunikovaly s uživatelem česky, třídily, případně
prováděly další specifické úkoly, jako například přidávání informací o
použitém kódování do e-poštovních nebo newsových zpráv. Příkladem
takového programu je editor vi, jehož činnost je ovšem ještě vhodné
přizpůsobit pro používaní znakové sady ISO-8859-2 nainstalováním
locales.
-
Lokalizace knihovny libc nebo glibc pomocí locales.
Zajistí, ze písmena s háčky a čárkami budou považována za tisknutelné
znaky a písmena, že programy budou vědět, která písmena jsou malá a
která velká, a budou umět převádět jedna na druhá, že bude fungovat
tříděni podle abecedy, že se peněžní a časové údaje i kalendářní data a
velká čísla budou vypisovat tak, jak je v češtině zvykem. Díky tomu, že
knihovnu libc/glibc používají téměř všechny programy, projeví se její
lokalizace v téměř celém systému. S lokalizací libc úzce souvisí
katalogy zpráv, které umožňují, aby vypisována hlášení, on line
nápověda, i menu v některých programech pro X Window Systém byly ve
zvoleném jazyce.
-
Lokalizace jednotlivých programů. V některých
programech se používá širší škála jazykové závislých vlastností, než
jakou podporují locales (způsob lámaní řádků, dělení slov, mezerovaní,
hlavičky v poště a newsech apod.). Příkladem je TeX nebo Emacs. Jine
programy naopak locales nepoužívají a některé jejich vlastnosti se
nastavují pomocí konfiguračních souborů, proměnných prostředí apod.
(pine, starší verze less a joe). Je nutné sem zahrnout také lokalizaci
programů pracujících pod X Window Systém prováděná pomocí X-resources
(zpravidla překlady menu a hlášení, výběr fontů apod.).
-
Český tisk.
-
Programy pro konverze textových souborů. Linux
používá pro kódování češtiny a slovenštiny kódování ISO-8859-2. Nicméně
v jiných systémech se používají jiné znakové sady a tak je často
potřeba textové, HTML a případně i další (DBF apod.) soubory
překódovávat.
-
Kontrola pravopisu. Pomocí programu ispell,
aspell, ...
-
Možnost používání češtiny v objektech systému,
zejména ve jménech souborů.
Nicméně toto všechno se týká starších distribucí. V
dnešní době se již většinou věcí zabývat nemusíme protože to už jiní
udělali za nás. Když si nainstalujete distribuci od Redhat, Mandrake,
SUSE nebo Debian, vše už je vyřešeno.
Kódování češtiny
Operační systém |
Kódování |
Poznámka |
MS DOS |
CP852 |
latin 2
kamenických |
Win 3.x, 95, 98, SE |
CP1250
CP1252 |
postaveno na mezinárodním standartu
ISO 8859-2 bohužel nekompatibilní, liší se v několika znacích v horní
polovině ASCII tabulky |
Linux, Unix |
ISO 8859-2 |
mezinárodní standard kódování jazyka pro střední
Evropu |
Převod textu WindowsULinux
Balík Cstools
Balík Cstools
(verze 3.42) obsahuje jednak známý konverzní program cstocs , jednak modul Cz::Cstocs,
pomocí něhož je možné dělat konverze i přímo v perlovém skriptu, bez
nutnosti volání externího programu. Distribuce dále obsahuje modul Cz::Sort, který poskytuje funkce pro české
řazení uvnitř perlového skriptu bez ohledu na vytvořené a nastavené
locales. Je založen na konverzní tabulce programu csr od Petra Olšáka.
Modul Cz::Cstocs:
Objekt, pomocí něhož je možno konvertovat mezi znakovými sadami bez
nutnosti vnějšího programu -- buď formou objektovou, nebo přímými
konverzními funkcemi. Jednou ze znakových sad je i sada tex, tedy např.
\v{c}.
Program cstocs: Tato
verze konverzního programu cstocs je založena na výše uvedeném modulu.
Provádí převody kódování nad danými soubory nebo nad standardním
vstupem.
cstocs [options] src_encoding dst_encoding [files
...]
Modul Cz::Sort:
Implementuje čtyř průchodové české třídění, nezávislé na použitých
locales. Exportuje funkce czcmp a czsort, které pracují podobně jako
perlovské vestavěné cmp a sort.
Manuálové stránky cstocs,
Cz::Cstocs,
Cz::Sort
; README
; Changes
.
Použití knihovny libiconv
Knihovna libiconv
obsahuje funkciiconv(),
pro použití na systémech, které nemají nic podobného, nebo jejichž
implementace neumí převádět fonty z/do Unicode formátu.
Fonty používané na systémech Linux
Bitmapové fonty (BDF)
- biznet - velmi obsáhlý soubor fontu - Polsko
- X11 fonts - kompletní sada Times fontu (roman, italic a bold
italic) - Univerzita Kalova
- xfonts - kompletní sada Times fontu (roman, italic a bold italic)
- Univerzita Masarykova
- ....
Scalable (Type 1) fonty
- ISO Latin 2
fonts . Arial, Courier New and Times New Roman (roman, italic,
bold and bold italic). Truetype and Type 1.
- InterSoft
Brno, Česká Republika, poskytuje a kolekci Type 1, Truetype and
bitmapových fontu, připravené do balíčku RPM.
- SuSE ČR s.r.o (Czech
Republic) and URW++ Design and
Development GmbH (Německo) uzavřeli smlouvu
o spolupráci URW ekvivalentu 35 standardních PostScript fontu
používající ISO 8859-2 kódování už na České SuSE Linux 6.4 distribuci.
Fonty jsou distribuovány na základe GNU General Public Licence a jsou
ke
stažení z ftp.suse.cz .
Bližší informace najdete na