Tuesday 1st March 2011

by Lionslayer

A Myanmar language loving man asked some of us, the Unicode activists, why encoding sequence of Myanmar Unicode is not the same as Burmese script. So I tried to type a long letter (for a slow typer like me) and explained as much with my tiny wit.

##

အန်ကယ်ခင်ဗျား

အလုပ်မအားလို့ ခုမှ စာပြန်ဖြစ်ပါတယ်။ အဓိက သဝေထိုး ကိစ္စပဲ ပြောမှာပါ။ အာရပ်၊ ဟိန္ဒူ၊ မြန်မာ၊ နဲ့ အခြားသော အရှေ့တောင် အာရှစာများဟာ ဗြာဟ္မီ အနွယ်ဝင် စာများ ဖြစ်ပြီး ဗျည်းနဲ့ ဗျည်းတွဲ သရများ ပေါင်းစပ်တဲ့အခါ ပုံအမျိုးမျိုး ပြောင်းပါတယ်။ အဲဒီအခါ နီးစပ်တဲ့ ဘာသာများ ဖြစ်သည့်တိုင်အောင် တချို့ဘာသာမှာ သရဟာ အရှေ့ရောက်၊ တချို့က အပေါ်ရောက် တချို့က အောက်ရောက်ပါတယ်။ Unicode Encoding အဖြစ် တိကျသေချာတဲ့ စည်းမျဉ်းတွေ ရှိတဲ့ စနစ်တစ်ရပ် ပြုလုပ်တဲ့အခါ ဘယ်အက္ခရာဟာ အရှေ့မှာ နေပြီး ဘယ်ဟာ အနောက်မှာနေမယ်ဆိုတာ အတိအကျ စည်းမျဉ်း ချရပါတယ်။ တော်သလို ကြည့်လုပ်လို့ မရပါ။ အဲဒီစည်းမျဉ်းတွေ ချတဲ့အခါမှာ Linguistic (ဘာသာဗေဒ)ကို လိုက်နာပြီး နေရာချဖို့ ဆုံးဖြတ်ပါတယ်။ Linguistic ဆိုတာ အသံအရ စီခြင်း၊ ယုတ္တိကျအောင် စီခြင်း ဖြစ်ပါတယ်။

သဝေထိုးဟာ ဆိုရင် သရဖြစ်ပါတယ်။ အသံအရ သရဟာ ဗျည်းနောက်မှ လာတာပါ။ ဥပမာ ပြေး ဆိုတဲ့စာလုံးမှာ ပ(ဗျည်း) + ရ(ရရစ်) + သဝေထိုး(သရ) + ဝစ္စပေါက်(အသံလေး) ရယ်လို့စီပါတယ်။ စီပုံစီနည်း တစ်သမတ်တည်း ဖြစ်စေဖို့ ဖြစ်ပါတယ်။ လုံးကြီးတင်ဟာ အပေါ်မှာနေပြီး ချောင်းငင်ဟာ အောက်မှာနေပါတယ်။ ဒါပေမဲ့ စီတော့လည်း သူ့ကို နောက်မှာ သွားထားတာပါပဲ။ တခြား ဝင်းဖောင့်၊ ဇော်ဂျီဖောင့်တို့နဲ့ သွားမနှိုင်းပါနဲ့။ သူတို့မှာ အက္ခရာတွေကို ရှေ့နောက် ပြောင်းပေးနိုင်တဲ့ နည်းပညာမရှိလို့ အမြင်အရ အဆင်ပြေအောင် စီထားရခြင်းသာ ဖြစ်ပါတယ်။

ဗျည်းတွဲဟာ ပင့်ရစ်ဆွဲထိုး လေးလုံးဖြစ်ပြီး သရမလာခင် အရင်လာပါတယ်။ မေဆွိ က ဆွိမှာ ဝဆွဲ အရင်လာပြီးမှ သရ လုံးတင် လာပါတယ်။ ဗျည်းတွဲ အချင်းချင်း ယှဉ်လာရင် ပင့်ရစ်ဆွဲထိုး အစဉ်အတိုင်း ရေးပါတယ်။ ဥပမာ အမြွှာ မှာ အ + မ + ရရစ် + ဝဆွဲ + ဟထိုး + ရေးချ ရယ်လို့ ပုံသေ စီပါတယ်။ စည်းမျဉ်းမရှိ စံမလိုက်နာတဲ့ ဖောင့်တွေမှာတော့ ရေးချင်သလိုရေးပါတယ်။ အဲဒီအခါ Search Engine တွေမှာ တစ်မျိုးနဲ့ရေးရင် နောက်တစ်မျိုးကို ရှာမတွေ့နိုင်တော့ပါ။

အောက်မြစ်ဟာဆိုရင် မြန်မာစာမှာ အသံဖော့တဲ့ သင်္ကေတဖြစ်ပြီး အသတ်နောက်မှ လာပါတယ်။ ဒါပေမဲ့ ယူနီကုဒ်မှာ အောက်မြစ်ပြီးမှ အသတ် လာရပါတယ်။ ဘာဖြစ်လို့လဲ။ ကရင်စာမှာ အောက်မြစ်ဟာ သရအဖြစ်လည်း သုံးပါတယ်။ အဲဒီအခါမှာ အသတ်ရှေ့ကိုရောက်လာပြီး ဗမာစာစီပုံနဲ့ ပြောင်းပြန် ဖြစ်ပါတယ်။ ဒါပေမဲ့ ကရင်ဟာ မြန်မာယူနီကုဒ် အုပ်စုထဲမှာ ပါနေတဲ့အတွက် စီပုံ တစ်သမတ်တည်း ဖြစ်အောင် အောက်မြစ်ကို အရှေ့ပို့လိုက်ရပါတယ်။

စာလုံးစီပုံ Encoding ဟာ ကွန်ပျူတာနဲ့ဆိုင်တဲ့ ကိစ္စဖြစ်ပြီး မြန်မာစာ ရေးထုံးကို မထိခိုက်ပါ။ ရိုက်တဲ့အခါမှာ မြန်မာစာ သင်ပုန်းကြီးအတိုင်း သဝေထိုး ပစောက် ရရစ် ရေးချ ဝစ္စပေါက် = ပြောင်း ရပါတယ်။ ပေါ်ရင်လည်း အမှန်ပေါ်ပါတယ်။ အဲလိုစီတဲ့အတွက်လည်း အက္ခရာစဉ်တာမှာ အများကြီး မှန်ကန်လာပါတယ်။ (ကွန်ပျူတာစနစ်မှာ မြန်မာစာကို အထောက်အပံ့ပေးထားရင် မြန်မာအက္ခရာစဉ်တို ရှေးထုံးအတိုင်း စဉ်လို့ ရပါတယ်။ )အာရပ်စာ ဟိန္ဒူစာ အရှေ့တောင်အာရှစာတွေကို ကွန်ပျူတာစနစ်မှာ ထောက်ပံ့ပေးတဲ့အခါ အရှေ့အနောက်စီတာတွေကို လိုက်ကြည့်စရာမလိုတော့ပါ။ Selection မှတ်တဲ့အခါ ဝဏ္ဏတစ်ဖြတ်လုံးကိုသာ Select လုပ်လို့ ရပါတော့တယ်။ ဆိုလိုတာက ရရစ် အသတ် ဝစ္စပေါက် စတာတွေကို တစ်ခုစီ သတ်သတ် Select လုပ်မရတော့ပါ။ ဝဏ္ဏတစ်ဖြတ်လုံး (Syllable level) ပါလာမှာ ဖြစ်ပါတယ်။ စာရိုက်တာ မှားသွားရင် နောက်က Backspace နဲ့ အက္ခရာ တစ်ခုချင်းစီ ဖျက်လို့ရပါတယ်။ အရှေ့က ဖျက်မယ်ဆိုရင်တော့ ဝဏ္ဏတစ်ခုလုံး ပျက်မှာ ဖြစ်ပါတယ်။ အခုအခါ မြန်မာစာကို Mac နဲ့ Windows မှာ မထောက်ပံ့သေးတဲ့အတွက် အဲဒီ Feature ကို မြင်ရမှာ မဟုတ်ပါ။ Linux မှာတော့ မြန်မာစာကို အပြည့်အဝ အထောက်အပံ့ ပေးပါပြီ။

Selection, Delete နဲ့ Backspace စမ်းနိုင်အောင် ကွန်ပျူတာက အပြည့်အဝ ထောက်ပံ့ပေးထားတဲ့ ဟိန္ဒူစာနဲ့ အာရပ်စာတွေကို ထည့်ပေးလိုက်ပါတယ်။

क्षमा कीजिये أنت غبي

http://unicode.org/notes/tn11/UTN11_3.pdf ယူနီကုဒ် စာလုံးစီပုံ စည်းမျဉ်းတွေကို ယူနီကုဒ် ကွန်ဆိုတီယမ်အဖွဲ့က ဒီမှာ အတိအကျ ရေးထားပါတယ်။ ယူနီကုဒ်ဖောင့် ဖြစ်ဖို့ ကုဒ်ပွိုင့်နေရာသာမက စာလုံးစီပုံကိုလည်း အတိအကျ လိုက်နာရပါတယ်။ ဒီစည်းမျဉ်းတွေက တစ်စက်လေး လွဲချော်တာနဲ့ ယူနီကုဒ် မဟုတ်ဘူးလို့ သတ်မှတ်ပါတယ်။ မတော်တဆ လွဲချော်တာဆိုရင်တော့ ပြင်ဖို့ ထောက်ပြ ပေးနိုင်ပါတယ်။ တမင်ကို လွှဲချော်ထားတာဆိုရင်တော့ ကျွန်တော်လည်း ဘာမှ မတတ်နိုင်ပါ။ ယူနီကုဒ် မဟုတ်ပါလို့ ပြောရုံသာ ရှိပါတော့တယ် ခင်ဗျာ။

လေးစားစွာဖြင့်
##

Tags: , , , ,

· · · ◊ ◊ ◊ · · ·

One Response to “Open Letter About Unicode Sequence”

  1. […] people complained that why vowel e is behind the consonant in Unicode encoding. I tried to answered that it’s according to logical and linguistic approach for a Brahmi based script […]

· · · ◊ ◊ ◊ · · ·

Leave a Reply

*