Użycie Unikodu w skryptach Java'y
Skrypty Java'y (ang. java scripts) ożywiają statyczne witryny Html. Podobnie jak język Java bazują na Unikodzie.
- Domyślnym kodowaniem w tych skryptach, używanym w sytuacji, kiedy kodowanie nie zostało określone czyli przed deklaracją Meta Html'a lub w przypadku zawarcia skryptu w osobnym dokumencie, jest właśnie Unikod Utf-8.
- Innym niż Utf-8 sposobem użycia znaków narodowych w skryptach javy są sekwencje /ukod_unikodowy.
- Niezależnie od powyższych możliwe jest używanie sgml'owych encji numerycznych &kod_unikodowy, ale rozwijanie ich jest wynikiem działania interpretera Html a nie skryptów javy
Przykładem ilustrującym to zagadnienie niech będzie pakiet skryptyjavy.zip (ZIP 1KB) zawierający dwa dokumenty:
- skrypt javy zakodowany w Utf-8 używający dodatkowo sekwencji /ukod_unikodowy
- dokument Html deklarujący i używający kodowania Iso-8859-2 odwołujący się do zewnętrznego skryptu
Należy zwrócić uwagę na niebezpieczeństwa związane z ignorowaniem domyślności kodowania Utf-8 skryptów. Jednym z najczęściej spotykanych jest używanie znaków narodowych w kodowaniach stronicowanych. Ze względu na sposób konstruowania wielobajtowych sekwencji Utf-8, polegających na tym, że rozpoczynają je znaki z ustawionym najbardziej znaczącym bitem, czyli o kodach większych od 127 określające nawet długość takich sekwencji, znaki narodowe zakodowane w kodowaniach stronicowanych mogą zostać potraktowane właśnie w taki sposób. Ich użycie na końcu linii komentarza poskutkuje potraktowaniem znaków końca linii jako treści sekwencji miast jako końca linii w wyniku czego kolejne linie, np. z kodem skryptu, dolepią się i mogą również zostać objęte komentarzem, ostatecznie skrypt nie będzie działał prawidłowo.
Więcej o
Wszelkie prawa zastrzeżone © Piotr Trzcionkowski 2000-2008