Tuesday 1st March 2011
by LionslayerA Myanmar language loving man asked some of us, the Unicode activists, why encoding sequence of Myanmar Unicode is not the same as Burmese script. So I tried to type a long letter (for a slow typer like me) and explained as much with my tiny wit.
##
အန်ကယ်ခင်ဗျား
အလုပ်မအားလို့ ခုမှ စာပြန်ဖြစ်ပါတယ်။ အဓိက သဝေထိုး ကိစ္စပဲ ပြောမှာပါ။ အာရပ်၊ ဟိန္ဒူ၊ မြန်မာ၊ နဲ့ အခြားသော အရှေ့တောင် အာရှစာများဟာ ဗြာဟ္မီ အနွယ်ဝင် စာများ ဖြစ်ပြီး ဗျည်းနဲ့ ဗျည်းတွဲ သရများ ပေါင်းစပ်တဲ့အခါ ပုံအမျိုးမျိုး ပြောင်းပါတယ်။ အဲဒီအခါ နီးစပ်တဲ့ ဘာသာများ ဖြစ်သည့်တိုင်အောင် တချို့ဘာသာမှာ သရဟာ အရှေ့ရောက်၊ တချို့က အပေါ်ရောက် တချို့က အောက်ရောက်ပါတယ်။ Unicode Encoding အဖြစ် တိကျသေချာတဲ့ စည်းမျဉ်းတွေ ရှိတဲ့ စနစ်တစ်ရပ် ပြုလုပ်တဲ့အခါ ဘယ်အက္ခရာဟာ အရှေ့မှာ နေပြီး ဘယ်ဟာ အနောက်မှာနေမယ်ဆိုတာ အတိအကျ စည်းမျဉ်း ချရပါတယ်။ တော်သလို ကြည့်လုပ်လို့ မရပါ။ အဲဒီစည်းမျဉ်းတွေ ချတဲ့အခါမှာ Linguistic (ဘာသာဗေဒ)ကို လိုက်နာပြီး နေရာချဖို့ ဆုံးဖြတ်ပါတယ်။ Linguistic ဆိုတာ အသံအရ စီခြင်း၊ ယုတ္တိကျအောင် စီခြင်း ဖြစ်ပါတယ်။
သဝေထိုးဟာ ဆိုရင် သရဖြစ်ပါတယ်။ အသံအရ သရဟာ ဗျည်းနောက်မှ လာတာပါ။ ဥပမာ ပြေး ဆိုတဲ့စာလုံးမှာ ပ(ဗျည်း) + ရ(ရရစ်) + သဝေထိုး(သရ) + ဝစ္စပေါက်(အသံလေး) ရယ်လို့စီပါတယ်။ စီပုံစီနည်း တစ်သမတ်တည်း ဖြစ်စေဖို့ ဖြစ်ပါတယ်။ လုံးကြီးတင်ဟာ အပေါ်မှာနေပြီး ချောင်းငင်ဟာ အောက်မှာနေပါတယ်။ ဒါပေမဲ့ စီတော့လည်း သူ့ကို နောက်မှာ သွားထားတာပါပဲ။ တခြား ဝင်းဖောင့်၊ ဇော်ဂျီဖောင့်တို့နဲ့ သွားမနှိုင်းပါနဲ့။ သူတို့မှာ အက္ခရာတွေကို ရှေ့နောက် ပြောင်းပေးနိုင်တဲ့ နည်းပညာမရှိလို့ အမြင်အရ အဆင်ပြေအောင် စီထားရခြင်းသာ ဖြစ်ပါတယ်။
ဗျည်းတွဲဟာ ပင့်ရစ်ဆွဲထိုး လေးလုံးဖြစ်ပြီး သရမလာခင် အရင်လာပါတယ်။ မေဆွိ က ဆွိမှာ ဝဆွဲ အရင်လာပြီးမှ သရ လုံးတင် လာပါတယ်။ ဗျည်းတွဲ အချင်းချင်း ယှဉ်လာရင် ပင့်ရစ်ဆွဲထိုး အစဉ်အတိုင်း ရေးပါတယ်။ ဥပမာ အမြွှာ မှာ အ + မ + ရရစ် + ဝဆွဲ + ဟထိုး + ရေးချ ရယ်လို့ ပုံသေ စီပါတယ်။ စည်းမျဉ်းမရှိ စံမလိုက်နာတဲ့ ဖောင့်တွေမှာတော့ ရေးချင်သလိုရေးပါတယ်။ အဲဒီအခါ Search Engine တွေမှာ တစ်မျိုးနဲ့ရေးရင် နောက်တစ်မျိုးကို ရှာမတွေ့နိုင်တော့ပါ။
အောက်မြစ်ဟာဆိုရင် မြန်မာစာမှာ အသံဖော့တဲ့ သင်္ကေတဖြစ်ပြီး အသတ်နောက်မှ လာပါတယ်။ ဒါပေမဲ့ ယူနီကုဒ်မှာ အောက်မြစ်ပြီးမှ အသတ် လာရပါတယ်။ ဘာဖြစ်လို့လဲ။ ကရင်စာမှာ အောက်မြစ်ဟာ သရအဖြစ်လည်း သုံးပါတယ်။ အဲဒီအခါမှာ အသတ်ရှေ့ကိုရောက်လာပြီး ဗမာစာစီပုံနဲ့ ပြောင်းပြန် ဖြစ်ပါတယ်။ ဒါပေမဲ့ ကရင်ဟာ မြန်မာယူနီကုဒ် အုပ်စုထဲမှာ ပါနေတဲ့အတွက် စီပုံ တစ်သမတ်တည်း ဖြစ်အောင် အောက်မြစ်ကို အရှေ့ပို့လိုက်ရပါတယ်။
စာလုံးစီပုံ Encoding ဟာ ကွန်ပျူတာနဲ့ဆိုင်တဲ့ ကိစ္စဖြစ်ပြီး မြန်မာစာ ရေးထုံးကို မထိခိုက်ပါ။ ရိုက်တဲ့အခါမှာ မြန်မာစာ သင်ပုန်းကြီးအတိုင်း သဝေထိုး ပစောက် ရရစ် ရေးချ ဝစ္စပေါက် = ပြောင်း ရပါတယ်။ ပေါ်ရင်လည်း အမှန်ပေါ်ပါတယ်။ အဲလိုစီတဲ့အတွက်လည်း အက္ခရာစဉ်တာမှာ အများကြီး မှန်ကန်လာပါတယ်။ (ကွန်ပျူတာစနစ်မှာ မြန်မာစာကို အထောက်အပံ့ပေးထားရင် မြန်မာအက္ခရာစဉ်တို ရှေးထုံးအတိုင်း စဉ်လို့ ရပါတယ်။ )အာရပ်စာ ဟိန္ဒူစာ အရှေ့တောင်အာရှစာတွေကို ကွန်ပျူတာစနစ်မှာ ထောက်ပံ့ပေးတဲ့အခါ အရှေ့အနောက်စီတာတွေကို လိုက်ကြည့်စရာမလိုတော့ပါ။ Selection မှတ်တဲ့အခါ ဝဏ္ဏတစ်ဖြတ်လုံးကိုသာ Select လုပ်လို့ ရပါတော့တယ်။ ဆိုလိုတာက ရရစ် အသတ် ဝစ္စပေါက် စတာတွေကို တစ်ခုစီ သတ်သတ် Select လုပ်မရတော့ပါ။ ဝဏ္ဏတစ်ဖြတ်လုံး (Syllable level) ပါလာမှာ ဖြစ်ပါတယ်။ စာရိုက်တာ မှားသွားရင် နောက်က Backspace နဲ့ အက္ခရာ တစ်ခုချင်းစီ ဖျက်လို့ရပါတယ်။ အရှေ့က ဖျက်မယ်ဆိုရင်တော့ ဝဏ္ဏတစ်ခုလုံး ပျက်မှာ ဖြစ်ပါတယ်။ အခုအခါ မြန်မာစာကို Mac နဲ့ Windows မှာ မထောက်ပံ့သေးတဲ့အတွက် အဲဒီ Feature ကို မြင်ရမှာ မဟုတ်ပါ။ Linux မှာတော့ မြန်မာစာကို အပြည့်အဝ အထောက်အပံ့ ပေးပါပြီ။
Selection, Delete နဲ့ Backspace စမ်းနိုင်အောင် ကွန်ပျူတာက အပြည့်အဝ ထောက်ပံ့ပေးထားတဲ့ ဟိန္ဒူစာနဲ့ အာရပ်စာတွေကို ထည့်ပေးလိုက်ပါတယ်။
क्षमा कीजिये أنت غبي
http://unicode.org/notes/tn11/UTN11_3.pdf ယူနီကုဒ် စာလုံးစီပုံ စည်းမျဉ်းတွေကို ယူနီကုဒ် ကွန်ဆိုတီယမ်အဖွဲ့က ဒီမှာ အတိအကျ ရေးထားပါတယ်။ ယူနီကုဒ်ဖောင့် ဖြစ်ဖို့ ကုဒ်ပွိုင့်နေရာသာမက စာလုံးစီပုံကိုလည်း အတိအကျ လိုက်နာရပါတယ်။ ဒီစည်းမျဉ်းတွေက တစ်စက်လေး လွဲချော်တာနဲ့ ယူနီကုဒ် မဟုတ်ဘူးလို့ သတ်မှတ်ပါတယ်။ မတော်တဆ လွဲချော်တာဆိုရင်တော့ ပြင်ဖို့ ထောက်ပြ ပေးနိုင်ပါတယ်။ တမင်ကို လွှဲချော်ထားတာဆိုရင်တော့ ကျွန်တော်လည်း ဘာမှ မတတ်နိုင်ပါ။ ယူနီကုဒ် မဟုတ်ပါလို့ ပြောရုံသာ ရှိပါတော့တယ် ခင်ဗျာ။
လေးစားစွာဖြင့်
##
[…] people complained that why vowel e is behind the consonant in Unicode encoding. I tried to answered that it’s according to logical and linguistic approach for a Brahmi based script […]