Japonca çok baytlı kodlamanın temelleri

Japonca karakterler sadece çok baytlı karakter kodlaması ile gösterilebilir ve çok baytlı kodlama standartlar platforma ve kullanılan metnin amacına göre değişir. Daha da kötüsü bu kodlama standartları birbirlerinden oldukça farklıdır. Bir geliştirici, Japonca bir ortamda kullanılabilecek bir HTTP uygulaması oluşturulurken doğru karakter kodlamalarını kullanabilmek için bu karmaşayı iyi bilmek zorundadır.

  • Altı bayta kadar bayt içerebilen karakterlerin saklanması
  • Çoğu Japonca çok baytlı karakter tek baytlı karakterelerin iki katı genişliktedir. Bu karakterlere Japonca'da "zen-kaku" denir ve "tam geniş" anlamına gelir. Dar olanlarına ise "han-kaku" denir ve "yarı geniş" anlamına gelir. Karakterlerin çizgesel özellikleri, bunları göstermekte kullanılan yazı tiplerine bağlıdır.
  • Bazı karakter kodlamaları, belli bir kod bölgesine (00h .. 7fh) geçmek için ISO-2022 ile tanımlanmış kaydırma (öncelem) dizilimleri kullanır.
  • SMTP/NNTP için ISO-2022-JP kullanılmalı; başlıklar ve öğeler RFC gereksinimlerine uygun olarak yeniden kodlanmalıdır. Bunlar elzem olmasa da çoğu kullanıcı aracı başka kodlama yöntemi tanımadığından bunları kullanmak daha iyidir.
  • » i-mode veya » EZweb gibi taşınabilir telefon hizmetleri için oluşturulan sayfaların Shift_JIS kullandıkları varsayılır.
  • » i-mode veya » EZweb gibi taşınabilir telefon hizmetleri için resim-yazı (pictogram) karakterleri desteklenmektedir.

add a note add a note

User Contributed Notes 1 note

up
-14
gullevek at gullevek dot org
14 years ago
For ISO-2022-JP encoding. If you convert data into this encoding it is highly recommended you use ISO-2022-JP-MS for the extended character set, eg the 1 in a circle ①.

For the mail header on the other hand you have to use ISO-2022-JP *without* the -MS extension.
To Top