ISO 8859-1
ISO 8859-1, formalnie ISO/IEC 8859-1, potocznie Latin-1 lub zachodnioeuropejskie – pierwsza część ISO/IEC 8859, standardu kodowania znaków ustalonego przez Międzynarodową Organizację Normalizacyjną, a później wspólnie utrzymywanym przez tę organizację i Międzynarodową Komisję Elektrotechniczną. Standard po rozszerzeniu o dodatkowe przypisania znaków jest podstawą dla dwóch powszechnie używanych mapowań znaków znanych jako ISO-8859-1 (z dodatkowym łącznikiem) i Windows-1252.
Status
[edytuj | edytuj kod]W czerwcu 2004 roku trzecia grupa robocza ISO/IEC odpowiedzialna za utrzymywanie zestawów znaków kodowanych ośmiobitowo została rozwiązana i, co za tym idzie, wszelkie prace i utrzymanie ISO 8859 (w tym ISO 8859-1) zostały wstrzymane w celu skoncentrowania się nad uniwersalnym zestawem znaków i Unicode. W informatyce kodowania dostarczające pełne wsparcie dla UCS (takie jak UTF-8 czy UTF-16) coraz częściej są wybierane zamiast zestawów znaków opartych na Latin-1.
Pokrycie języków
[edytuj | edytuj kod]Przy pomocy ISO 8859-1 można zakodować to, co zwane jest alfabetem łacińskim numer 1, który składa się ze 191 znaków pisma łacińskiego. Każdy znak jest kodowany jako pojedyncza 8-bitowa wartość. Mogą one być użyte w prawie każdym systemie wymiany danych do komunikowania się w poniższych europejskich językach (z kilkoma wyjątkami, z powodu brakujących znaków):
- albańskim
- angielskim
- baskijskim
- duńskim
- estońskim (brakuje Š, š, Ž, ž dla zapożyczeń)
- Proszę zauważyć, że Windows-1252 je zawiera
- fareskim
- fińskim (brakuje Š, š, Ž, ž dla zapożyczeń)
- Proszę zauważyć, że Windows-1252 je zawiera
- francuskim (brakuje Œ, œ i rzadkiego Ÿ)
- Proszę zauważyć, że Windows-1252 je zawiera
- hiszpańskim
- irlandzkim (nowa ortografia)
- islandzkim
- katalońskim
- łacińskim
- niderlandzkim (brakuje IJ, ij)
- niemieckim
- norweskim (bokmål i nynorsk)
- portugalskim
- retoromańskim
- szkockim
- szwedzkim
- włoskim
Innymi pokrytymi językami są:
W związku z powyższym to kodowanie znaków jest używane w Amerykach, Europie Zachodniej, Oceanii i większej części Afryki, lecz dla niektórych języków brakuje poprawnych typograficznie cudzysłowów, zamiast których są dostępne « i ».
Różnice w stosunku do ISO/IEC 8859–15
[edytuj | edytuj kod]W ISO/IEC 8859-1 brakuje znaków: zaczynając od kilku francuskich liter, poprzez reprezentację „IJ” jako jednego znaku (IJ), fińskich liter używanych w transkrypcjach obcych nazw i kilku zapożyczeniach, skończywszy na braku kilku powszechnych glifów takich jak sztylet (†), typograficzne cudzysłowy („,”) i dywizów (-, –, –), a dodatkowo brak symbolu Euro (€). Z tych powodów powstało ISO/IEC 8859-15, jako uaktualnienie ISO/IEC 8859-1 dodające symbol euro i kilka innych wymaganych znaków. To jednak wymusiło usunięcie z ISO/IEC 8859-1 kilku mniej używanych znaków, takich jak ułamki i bezliterowe diakrytyki: ¤, ¦, ¨, ´, ¸, ¼, ½, i ¾. Szczegółowo przedstawia to poniższa tabela:
| Porównanie kodowań | |||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Hex | ISO 8859-1 | ISO 8859-15 | Hex | ISO 8859-1 | ISO 8859-15 | Hex | ISO 8859-1 | ISO 8859-15 | Hex | ISO 8859-1 | ISO 8859-15 |
| 0x80 | ZK | 0xA0 | 0xC0 | À | 0xE0 | à | |||||
| 0x81 | ZK | 0xA1 | ¡ | 0xC1 | Á | 0xE1 | á | ||||
| 0x82 | ZK | 0xA2 | ¢ | 0xC2 | Â | 0xE2 | â | ||||
| 0x83 | ZK | 0xA3 | £ | 0xC3 | Ã | 0xE3 | ã | ||||
| 0x84 | ZK | 0xA4 | ¤ | € | 0xC4 | Ä | 0xE4 | ä | |||
| 0x85 | ZK | 0xA5 | ¥ | 0xC5 | Å | 0xE5 | å | ||||
| 0x86 | ZK | 0xA6 | ¦ | Š | 0xC6 | Æ | 0xE6 | æ | |||
| 0x87 | ZK | 0xA7 | § | 0xC7 | Ç | 0xE7 | ç | ||||
| 0x88 | ZK | 0xA8 | ¨ | š | 0xC8 | È | 0xE8 | è | |||
| 0x89 | ZK | 0xA9 | © | 0xC9 | É | 0xE9 | é | ||||
| 0x8A | ZK | 0xAA | ª | 0xCA | Ê | 0xEA | ê | ||||
| 0x8B | ZK | 0xAB | « | 0xCB | Ë | 0xEB | ë | ||||
| 0x8C | ZK | 0xAC | ¬ | 0xCC | Ì | 0xEC | ì | ||||
| 0x8D | ZK | 0xAD | 0xCD | Í | 0xED | í | |||||
| 0x8E | ZK | 0xAE | ® | 0xCE | Î | 0xEE | î | ||||
| 0x8F | ZK | 0xAF | ¯ | 0xCF | Ï | 0xEF | ï | ||||
| 0x90 | ZK | 0xB0 | ° | 0xD0 | Ð | 0xF0 | ð | ||||
| 0x91 | ZK | 0xB1 | ± | 0xD1 | Ñ | 0xF1 | ñ | ||||
| 0x92 | ZK | 0xB2 | ² | 0xD2 | Ò | 0xF2 | ò | ||||
| 0x93 | ZK | 0xB3 | ³ | 0xD3 | Ó | 0xF3 | ó | ||||
| 0x94 | ZK | 0xB4 | ´ | Ž | 0xD4 | Ô | 0xF4 | ô | |||
| 0x95 | ZK | 0xB5 | µ | 0xD5 | Õ | 0xF5 | õ | ||||
| 0x96 | ZK | 0xB6 | ¶ | 0xD6 | Ö | 0xF6 | ö | ||||
| 0x97 | ZK | 0xB7 | · | 0xD7 | × | 0xF7 | ÷ | ||||
| 0x98 | ZK | 0xB8 | ¸ | ž | 0xD8 | Ø | 0xF8 | ø | |||
| 0x99 | ZK | 0xB9 | ¹ | 0xD9 | Ù | 0xF9 | ù | ||||
| 0x9A | ZK | 0xBA | º | 0xDA | Ú | 0xFA | ú | ||||
| 0x9B | ZK | 0xBB | » | 0xDB | Û | 0xFB | û | ||||
| 0x9C | ZK | 0xBC | ¼ | Œ | 0xDC | Ü | 0xFC | ü | |||
| 0x9D | ZK | 0xBD | ½ | œ | 0xDD | Ý | 0xFD | ý | |||
| 0x9E | ZK | 0xBE | ¾ | Ÿ | 0xDE | Þ | 0xFE | þ | |||
| 0x9F | ZK | 0xBF | ¿ | 0xDF | ß | 0xFF | ÿ | ||||
Gdzie „ZK” oznacza znak kontrolny, a „Znak” oznacza znak wspólny dla obydwu zestawów znaków.
Tablica kodów
[edytuj | edytuj kod]Zważywszy na fakt, że 191 znaków kodowanych przez ISO/IEC 8859-1 jest graficzne i zgodne z większością przeglądarek, mogą być wyświetlone w poniższej tabeli. Przez to, że znaki spacji (0x20), twardej spacji (0xA0) i miękkiego dywizu (0xAD) nie zostałyby wyświetlone w sposób widoczny, zastosowano skróty ich nazw.
| ISO/IEC 8859-1:1998 | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
| 0x | Znaki kontrolne | |||||||||||||||
| 1x | ||||||||||||||||
| 2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | Przecinek, | - | . | / |
| 3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
| 4x | @ | A | B | C | D | |||||||||||