Przejdź do zawartości

ISO 8859-1

Z Wikipedii, wolnej encyklopedii

ISO 8859-1, formalnie ISO/IEC 8859-1, potocznie Latin-1 lub zachodnioeuropejskie – pierwsza część ISO/IEC 8859, standardu kodowania znaków ustalonego przez Międzynarodową Organizację Normalizacyjną, a później wspólnie utrzymywanym przez tę organizację i Międzynarodową Komisję Elektrotechniczną. Standard po rozszerzeniu o dodatkowe przypisania znaków jest podstawą dla dwóch powszechnie używanych mapowań znaków znanych jako ISO-8859-1 (z dodatkowym łącznikiem) i Windows-1252.

Status

[edytuj | edytuj kod]

W czerwcu 2004 roku trzecia grupa robocza ISO/IEC odpowiedzialna za utrzymywanie zestawów znaków kodowanych ośmiobitowo została rozwiązana i, co za tym idzie, wszelkie prace i utrzymanie ISO 8859 (w tym ISO 8859-1) zostały wstrzymane w celu skoncentrowania się nad uniwersalnym zestawem znaków i Unicode. W informatyce kodowania dostarczające pełne wsparcie dla UCS (takie jak UTF-8 czy UTF-16) coraz częściej są wybierane zamiast zestawów znaków opartych na Latin-1.

Pokrycie języków

[edytuj | edytuj kod]

Przy pomocy ISO 8859-1 można zakodować to, co zwane jest alfabetem łacińskim numer 1, który składa się ze 191 znaków pisma łacińskiego. Każdy znak jest kodowany jako pojedyncza 8-bitowa wartość. Mogą one być użyte w prawie każdym systemie wymiany danych do komunikowania się w poniższych europejskich językach (z kilkoma wyjątkami, z powodu brakujących znaków):

Innymi pokrytymi językami są:

W związku z powyższym to kodowanie znaków jest używane w Amerykach, Europie Zachodniej, Oceanii i większej części Afryki, lecz dla niektórych języków brakuje poprawnych typograficznie cudzysłowów, zamiast których są dostępne « i ».

Różnice w stosunku do ISO/IEC 8859–15

[edytuj | edytuj kod]

W ISO/IEC 8859-1 brakuje znaków: zaczynając od kilku francuskich liter, poprzez reprezentację „IJ” jako jednego znaku (IJ), fińskich liter używanych w transkrypcjach obcych nazw i kilku zapożyczeniach, skończywszy na braku kilku powszechnych glifów takich jak sztylet (†), typograficzne cudzysłowy („,”) i dywizów (-, –, –), a dodatkowo brak symbolu Euro (€). Z tych powodów powstało ISO/IEC 8859-15, jako uaktualnienie ISO/IEC 8859-1 dodające symbol euro i kilka innych wymaganych znaków. To jednak wymusiło usunięcie z ISO/IEC 8859-1 kilku mniej używanych znaków, takich jak ułamki i bezliterowe diakrytyki: ¤, ¦, ¨, ´, ¸, ¼, ½, i ¾. Szczegółowo przedstawia to poniższa tabela:

Porównanie kodowań
Hex ISO 8859-1 ISO 8859-15 Hex ISO 8859-1 ISO 8859-15 Hex ISO 8859-1 ISO 8859-15 Hex ISO 8859-1 ISO 8859-15
0x80 ZK 0xA0   0xC0 À 0xE0 à
0x81 ZK 0xA1 ¡ 0xC1 Á 0xE1 á
0x82 ZK 0xA2 ¢ 0xC2 Â 0xE2 â
0x83 ZK 0xA3 £ 0xC3 Ã 0xE3 ã
0x84 ZK 0xA4 ¤ 0xC4 Ä 0xE4 ä
0x85 ZK 0xA5 ¥ 0xC5 Å 0xE5 å
0x86 ZK 0xA6 ¦ Š 0xC6 Æ 0xE6 æ
0x87 ZK 0xA7 § 0xC7 Ç 0xE7 ç
0x88 ZK 0xA8 ¨ š 0xC8 È 0xE8 è
0x89 ZK 0xA9 © 0xC9 É 0xE9 é
0x8A ZK 0xAA ª 0xCA Ê 0xEA ê
0x8B ZK 0xAB « 0xCB Ë 0xEB ë
0x8C ZK 0xAC ¬ 0xCC Ì 0xEC ì
0x8D ZK 0xAD 0xCD Í 0xED í
0x8E ZK 0xAE ® 0xCE Î 0xEE î
0x8F ZK 0xAF ¯ 0xCF Ï 0xEF ï
0x90 ZK 0xB0 ° 0xD0 Ð 0xF0 ð
0x91 ZK 0xB1 ± 0xD1 Ñ 0xF1 ñ
0x92 ZK 0xB2 ² 0xD2 Ò 0xF2 ò
0x93 ZK 0xB3 ³ 0xD3 Ó 0xF3 ó
0x94 ZK 0xB4 ´ Ž 0xD4 Ô 0xF4 ô
0x95 ZK 0xB5 µ 0xD5 Õ 0xF5 õ
0x96 ZK 0xB6 0xD6 Ö 0xF6 ö
0x97 ZK 0xB7 · 0xD7 × 0xF7 ÷
0x98 ZK 0xB8 ¸ ž 0xD8 Ø 0xF8 ø
0x99 ZK 0xB9 ¹ 0xD9 Ù 0xF9 ù
0x9A ZK 0xBA º 0xDA Ú 0xFA ú
0x9B ZK 0xBB » 0xDB Û 0xFB û
0x9C ZK 0xBC ¼ Œ 0xDC Ü 0xFC ü
0x9D ZK 0xBD ½ œ 0xDD Ý 0xFD ý
0x9E ZK 0xBE ¾ Ÿ 0xDE Þ 0xFE þ
0x9F ZK 0xBF ¿ 0xDF ß 0xFF ÿ

Gdzie „ZK” oznacza znak kontrolny, a „Znak” oznacza znak wspólny dla obydwu zestawów znaków.

Tablica kodów

[edytuj | edytuj kod]

Zważywszy na fakt, że 191 znaków kodowanych przez ISO/IEC 8859-1 jest graficzne i zgodne z większością przeglądarek, mogą być wyświetlone w poniższej tabeli. Przez to, że znaki spacji (0x20), twardej spacji (0xA0) i miękkiego dywizu (0xAD) nie zostałyby wyświetlone w sposób widoczny, zastosowano skróty ich nazw.

ISO/IEC 8859-1:1998
  x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x Znaki kontrolne
1x
2x SP ! " # $ % & ' ( ) * + Przecinek, - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D