A Myanmar language loving man asked some of us, the Unicode activists, why encoding sequence of Myanmar Unicode is not the same as Burmese script. So I tried to type a long letter (for a slow typer like me) and explained as much with my tiny wit.

##

အန်ကယ်ခင်ဗျား

အလုပ်မအားလို့ ခုမှ စာပြန်ဖြစ်ပါတယ်။ အဓိက သဝေထိုး ကိစ္စပဲ ပြောမှာပါ။ အာရပ်၊ ဟိန္ဒူ၊ မြန်မာ၊ နဲ့ အခြားသော အရှေ့တောင် အာရှစာများဟာ ဗြာဟ္မီ အနွယ်ဝင် စာများ ဖြစ်ပြီး ဗျည်းနဲ့ ဗျည်းတွဲ သရများ ပေါင်းစပ်တဲ့အခါ ပုံအမျိုးမျိုး ပြောင်းပါတယ်။ အဲဒီအခါ နီးစပ်တဲ့ ဘာသာများ ဖြစ်သည့်တိုင်အောင် တချို့ဘာသာမှာ သရဟာ အရှေ့ရောက်၊ တချို့က အပေါ်ရောက် တချို့က အောက်ရောက်ပါတယ်။ Unicode Encoding အဖြစ် တိကျသေချာတဲ့ စည်းမျဉ်းတွေ ရှိတဲ့ စနစ်တစ်ရပ် ပြုလုပ်တဲ့အခါ ဘယ်အက္ခရာဟာ အရှေ့မှာ နေပြီး ဘယ်ဟာ အနောက်မှာနေမယ်ဆိုတာ အတိအကျ စည်းမျဉ်း ချရပါတယ်။ တော်သလို ကြည့်လုပ်လို့ မရပါ။ အဲဒီစည်းမျဉ်းတွေ ချတဲ့အခါမှာ Linguistic (ဘာသာဗေဒ)ကို လိုက်နာပြီး နေရာချဖို့ ဆုံးဖြတ်ပါတယ်။ Linguistic ဆိုတာ အသံအရ စီခြင်း၊ ယုတ္တိကျအောင် စီခြင်း ဖြစ်ပါတယ်။

သဝေထိုးဟာ ဆိုရင် သရဖြစ်ပါတယ်။ အသံအရ သရဟာ ဗျည်းနောက်မှ လာတာပါ။ ဥပမာ ပြေး ဆိုတဲ့စာလုံးမှာ ပ(ဗျည်း) + ရ(ရရစ်) + သဝေထိုး(သရ) + ဝစ္စပေါက်(အသံလေး) ရယ်လို့စီပါတယ်။ စီပုံစီနည်း တစ်သမတ်တည်း ဖြစ်စေဖို့ ဖြစ်ပါတယ်။ လုံးကြီးတင်ဟာ အပေါ်မှာနေပြီး ချောင်းငင်ဟာ အောက်မှာနေပါတယ်။ ဒါပေမဲ့ စီတော့လည်း သူ့ကို နောက်မှာ သွားထားတာပါပဲ။ တခြား ဝင်းဖောင့်၊ ဇော်ဂျီဖောင့်တို့နဲ့ သွားမနှိုင်းပါနဲ့။ သူတို့မှာ အက္ခရာတွေကို ရှေ့နောက် ပြောင်းပေးနိုင်တဲ့ နည်းပညာမရှိလို့ အမြင်အရ အဆင်ပြေအောင် စီထားရခြင်းသာ ဖြစ်ပါတယ်။

ဗျည်းတွဲဟာ ပင့်ရစ်ဆွဲထိုး လေးလုံးဖြစ်ပြီး သရမလာခင် အရင်လာပါတယ်။ မေဆွိ က ဆွိမှာ ဝဆွဲ အရင်လာပြီးမှ သရ လုံးတင် လာပါတယ်။ ဗျည်းတွဲ အချင်းချင်း ယှဉ်လာရင် ပင့်ရစ်ဆွဲထိုး အစဉ်အတိုင်း ရေးပါတယ်။ ဥပမာ အမြွှာ မှာ အ + မ + ရရစ် + ဝဆွဲ + ဟထိုး + ရေးချ ရယ်လို့ ပုံသေ စီပါတယ်။ စည်းမျဉ်းမရှိ စံမလိုက်နာတဲ့ ဖောင့်တွေမှာတော့ ရေးချင်သလိုရေးပါတယ်။ အဲဒီအခါ Search Engine တွေမှာ တစ်မျိုးနဲ့ရေးရင် နောက်တစ်မျိုးကို ရှာမတွေ့နိုင်တော့ပါ။

အောက်မြစ်ဟာဆိုရင် မြန်မာစာမှာ အသံဖော့တဲ့ သင်္ကေတဖြစ်ပြီး အသတ်နောက်မှ လာပါတယ်။ ဒါပေမဲ့ ယူနီကုဒ်မှာ အောက်မြစ်ပြီးမှ အသတ် လာရပါတယ်။ ဘာဖြစ်လို့လဲ။ ကရင်စာမှာ အောက်မြစ်ဟာ သရအဖြစ်လည်း သုံးပါတယ်။ အဲဒီအခါမှာ အသတ်ရှေ့ကိုရောက်လာပြီး ဗမာစာစီပုံနဲ့ ပြောင်းပြန် ဖြစ်ပါတယ်။ ဒါပေမဲ့ ကရင်ဟာ မြန်မာယူနီကုဒ် အုပ်စုထဲမှာ ပါနေတဲ့အတွက် စီပုံ တစ်သမတ်တည်း ဖြစ်အောင် အောက်မြစ်ကို အရှေ့ပို့လိုက်ရပါတယ်။

စာလုံးစီပုံ Encoding ဟာ ကွန်ပျူတာနဲ့ဆိုင်တဲ့ ကိစ္စဖြစ်ပြီး မြန်မာစာ ရေးထုံးကို မထိခိုက်ပါ။ ရိုက်တဲ့အခါမှာ မြန်မာစာ သင်ပုန်းကြီးအတိုင်း သဝေထိုး ပစောက် ရရစ် ရေးချ ဝစ္စပေါက် = ပြောင်း ရပါတယ်။ ပေါ်ရင်လည်း အမှန်ပေါ်ပါတယ်။ အဲလိုစီတဲ့အတွက်လည်း အက္ခရာစဉ်တာမှာ အများကြီး မှန်ကန်လာပါတယ်။ (ကွန်ပျူတာစနစ်မှာ မြန်မာစာကို အထောက်အပံ့ပေးထားရင် မြန်မာအက္ခရာစဉ်တို ရှေးထုံးအတိုင်း စဉ်လို့ ရပါတယ်။ )အာရပ်စာ ဟိန္ဒူစာ အရှေ့တောင်အာရှစာတွေကို ကွန်ပျူတာစနစ်မှာ ထောက်ပံ့ပေးတဲ့အခါ အရှေ့အနောက်စီတာတွေကို လိုက်ကြည့်စရာမလိုတော့ပါ။ Selection မှတ်တဲ့အခါ ဝဏ္ဏတစ်ဖြတ်လုံးကိုသာ Select လုပ်လို့ ရပါတော့တယ်။ ဆိုလိုတာက ရရစ် အသတ် ဝစ္စပေါက် စတာတွေကို တစ်ခုစီ သတ်သတ် Select လုပ်မရတော့ပါ။ ဝဏ္ဏတစ်ဖြတ်လုံး (Syllable level) ပါလာမှာ ဖြစ်ပါတယ်။ စာရိုက်တာ မှားသွားရင် နောက်က Backspace နဲ့ အက္ခရာ တစ်ခုချင်းစီ ဖျက်လို့ရပါတယ်။ အရှေ့က ဖျက်မယ်ဆိုရင်တော့ ဝဏ္ဏတစ်ခုလုံး ပျက်မှာ ဖြစ်ပါတယ်။ အခုအခါ မြန်မာစာကို Mac နဲ့ Windows မှာ မထောက်ပံ့သေးတဲ့အတွက် အဲဒီ Feature ကို မြင်ရမှာ မဟုတ်ပါ။ Linux မှာတော့ မြန်မာစာကို အပြည့်အဝ အထောက်အပံ့ ပေးပါပြီ။

Selection, Delete နဲ့ Backspace စမ်းနိုင်အောင် ကွန်ပျူတာက အပြည့်အဝ ထောက်ပံ့ပေးထားတဲ့ ဟိန္ဒူစာနဲ့ အာရပ်စာတွေကို ထည့်ပေးလိုက်ပါတယ်။

क्षमा कीजिये أنت غبي

http://unicode.org/notes/tn11/UTN11_3.pdf ယူနီကုဒ် စာလုံးစီပုံ စည်းမျဉ်းတွေကို ယူနီကုဒ် ကွန်ဆိုတီယမ်အဖွဲ့က ဒီမှာ အတိအကျ ရေးထားပါတယ်။ ယူနီကုဒ်ဖောင့် ဖြစ်ဖို့ ကုဒ်ပွိုင့်နေရာသာမက စာလုံးစီပုံကိုလည်း အတိအကျ လိုက်နာရပါတယ်။ ဒီစည်းမျဉ်းတွေက တစ်စက်လေး လွဲချော်တာနဲ့ ယူနီကုဒ် မဟုတ်ဘူးလို့ သတ်မှတ်ပါတယ်။ မတော်တဆ လွဲချော်တာဆိုရင်တော့ ပြင်ဖို့ ထောက်ပြ ပေးနိုင်ပါတယ်။ တမင်ကို လွှဲချော်ထားတာဆိုရင်တော့ ကျွန်တော်လည်း ဘာမှ မတတ်နိုင်ပါ။ ယူနီကုဒ် မဟုတ်ပါလို့ ပြောရုံသာ ရှိပါတော့တယ် ခင်ဗျာ။

လေးစားစွာဖြင့်
##

Tags: , , , ,

· · · ◊ ◊ ◊ · · ·