ပြောလက်စနဲ့ အမုန်းခံပြီး ထပ်ပြောလိုက်ပါဦးမယ်။ ယူနီကုဒ်ဖောင့်ရေးတဲ့လူတွေ ပြင်တဲ့လူတွေ ကော်ပီရိုက်ကို လေးစားကြဖို့ပါ။ ဖောင့်ဖေ့စ်စုံတာ ကောင်းပါတယ်။ ဒါပေမဲ့ သူများခွင့်ပြုချက်မတောင်းဘဲ (မရဘဲ) ပရော်ဖက်ရှင်နယ်ဖောင့်တွေက ဂလစ်တွေကို ခပ်တည်တည်နဲ့ ယူသုံးနေတာ ရပ်ကြဖို့ တောင်းဆိုပါတယ်။ ခွင့်ပြုချက်မရဘဲ သုံးတယ်ဆိုတာ တနည်းပြောရရင် ခိုးတာပါပဲ။ ဇော်ဂျီကို Tahoma နဲ့ Arial တွေခိုးသုံးထားလို့ သူခိုးဖောင့်လို့ပြောသလို ယူနီကုဒ်ဖောင့်တွေလည်း တဖြည်းဖြည်းနဲ့ ဘာဖြစ်လာပြီလဲ စဉ်းစားကြဖို့ပါ။ ဖောင့်ဖေ့စ် မရေးနိုင်ရင် မရေးတတ်ရင် အသင့်ရေးပြီးသား ဧရာလို ပြန်သုံးခွင့်ပြုထားတဲ့ မြန်မာဖောင့်တွေ ရှိပါတယ်။ အင်္ဂလိပ်နဲ့ လက်တင်ဂလစ်တွေအတွက် အခမဲ့ သုံးခွင့် ပြုပြင်ခွင့် ပေးထားတဲ့ ဖောင့်တွေ ရှိပါတယ်။ ရှာသုံး၊ မေးသုံး၊ တောင်းသုံးကြပါ။ ငါ လုပ်တဲ့ဖောင့်လို့ ဂုဏ်ယူချင်ရင် ကော်ပီရိုက်ကို လေးစားကြပါ။ ဗြောင် ခိုးမစားကြပါနဲ့။

ယူနီကုဒ်သမားအများစုက ယူနီကုဒ်တိုးတက်ရေး နှောင့်နှေးမှာစိုးလို့ထင်ပါတယ်၊ ဘာမှ မပြောကြပေမဲ့ ကျွန်တော်ကတော့ မနေနိုင်လို့ ပြောလိုက်ပါပြီ။ မိုက်ခရိုဆော့ ဂူဂယ်နဲ့ အက်ပဲက မြန်မာနဲ့ အင်္ဂလိပ်ဖောင့်တွေကို ပြင်သုံး၊ ယူသုံးထားတဲ့ မြန်မာယူနီကုဒ်တွေ တွေ့မိလို့ပါ။ Arthouse က W01 ဖောင့်ကို ခပ်တည်တည်နဲ့ အမြီးတွေ ဆွဲရှည်ပြီး သုံးထားတဲ့ ဖောင့်ကိုလည်းတွေ့ပါတယ်။ ဖောင့်ဒီဇိုင်နာ နာမည်တောင် ခံလိုက်ပါသေးတယ်။ တချို့က ခရက်ဒစ်ပေးသလို တချို့ကလည်း ဗြောင်ပဲ ကူးပါတယ်။ ကော်ပီရိုက်ရှိရင် ခရက်ဒစ်ပေးလည်း မသုံးသင့်ဘူးဆိုတာ ဝေဖန်သုံးသပ်ဆင်ခြင်ပြီး ကိုယ့်လိပ်ပြာကိုယ်သိ၊ ကိုယ့်သိက္ခာကိုယ်ရှိကြဖို့ပါ။

#fb link here.

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

In summary, as of 2011, Myanmar Unicode fonts can correctly render in;

  • Windows (Opentype on Uniscribe)
  • OSX (Opentype on AAT) with Myanmar font built-in
  • Linux distros (Opentype, Graphite on Pango,Harfbuzz) with Myanmar font built-in or Repository available
  • iOS (Opentype on AAT).

We have a few more updates now.

(1) Nook is Android based tablet and it seems to be able to render Myanmar Unicode correctly. နွတ်(ခ်) မှာ မြန်မာယူနီကုဒ်ဖောင့် အမှန်ပေါ်ပါပြီ။
(2) Android itself started supporting Myanmar Unicode 5.0 in it’s IcecreamSandwich Android 4.0. The reshaping rules are based on Pango and are inside the system (not in the font). The most visible changes are virama u1039 and vowel e u1031. အန်းဒရွိုက် ၄.၀ မှာ မြန်မာယူနီကုဒ် ၅.၀ စာလုံးပုံဖော်တဲ့ စနစ်ပါလာပါပြီ။ ယူနီကုဒ်က ၅.၁ နောက်ပိုင်းမှာမှ ပုံသေဖြစ်တဲ့အတွက် အမှန်မပေါ်သေးပါဘူး။

Android 4.0 Myanmar Unicode Support

Android 4.0 ICS Myanmar Unicode Support. Zawgyi texts will not show correctly anymore.

(3) Windows 8 consumer preview came out a few days ago. It has improved Myanmar font (supports Burmese and Mon) and Myanmar font fallback for IE. So, it’s confirmed that Windows 8 will support Myanmar Unicode font and Keyboard in PC, mobile or tablets when it comes out. ဝင်းဒိုး ၈ စားသုံးသူအတွက် နမူနာမှာ အရင်တစ်ခါထက် ပိုမှန်လာတဲ့ မြန်မာယူနီကုဒ် ပါလာတဲ့အတွက် တကယ်ထုတ်ရင် ပါလာမှာ သေချာပါပြီ။

Shifted Unicode Keyboard on Windows8 Consumer preview

Shifted Unicode Keyboard on Windows 8 Consumer Preview (Based on Myanmar3 Layout by Myanmar NLP)

#P.S. Myanmar Wikipedia has more than 10,000 articles now.

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

တစ်နေ့သ၌ ကျွန်ုပ်မောင်သီဟကလေးသည် မရောက်သည်မှ ကြာလုပြီဖြစ်သော ဘွားပု၏ ဇာတိ မုဒုံခရိုင် စံပြရွာသို့ အလည်တစ်ခေါက် ရောက်ခဲ့ချေသည်။ ရွာထဲသို့ ဝင်လိုက်ကတည်းက ခါတိုင်းနှင့်မတူ တစ်ခုခုတော့ ထူးသည်ကို သတိပြုမိလိုက်သည်။ ပထမဆုံးဝင်တွေ့သူက ငယ်ငယ်က ခွေလှိမ့်ဘက် ဗလကြီး။ နာမည်နှင့်လိုက်အောင် လူကလည်း ထွားကြိုင်းလှသည်။

ဗလကြီးဆန်ဆိုင်သို့ ဝင်လိုက်သည်နှင့် သတိပြုမိလိုက်သည်က တင်းတောင်းမကျ ပြည်တောင်းမကသော တောင်းကြီးတွေ။

“ဟေ့ကောင် ဗလကြီး ဒီကိုးလိုးကန့်လန့် တောင်းတွေက ဘာလုပ်ဖို့လဲ။”

“ဟာကွာ ဒါ ဗလကြီးပြည်တောင်းကွ။”

“ဟင် မင့်ပြည်တောင်းတွေက အယ်စတုံကြီးတွေ။”

“အေးလေ ငါ့ဗလနဲ့ ဒါနဲ့မှ အနေတော်ပဲ။ ပြည်တောင်း ပိစိကွေးလေးတွေ အားမရပါဘူးကွာ။”

“ဟာ ဒါတွေနဲ့ ရောင်းတော့ မရှုံးဘူးလား။”

“အို ဈေးကိုလည်း ကြည့်ကြပ်တင်လိုက်တာပေါ့ ပိုတောင်မြတ်သေး။ ရွာထဲမှာဆို ငါ့တောင်းတွေကို လူကြိုက်များလို့ ဆန်မရောင်းဘဲ တောင်းရက်ရောင်းရင်တောင် စီးပွားအတော်ဖြစ်နေပြီ။”

“ဒါဆို တခြားရွာက ဆန်ကုန်သည်တွေနဲ့ ဘယ်လို အရောင်းအဝယ်လုပ်တုံး။”

“ကိုးပြည်နဲ့လေးလုံးဆို သူတို့ တစ်တင်းပဲလေ။ ဒီလိုပဲ တွက်ပြီး ရောင်းဝယ်ရတာပေါ့။”

“ဒါပေမဲ့ ခေတ်အဆက်ဆက် အစိုးရတွေ သတ်မှတ်ထားတဲ့စံ…”

“တော်တော် ဒါတွေလာမပြောနဲ့ ငါအကုန်သိတယ်။ ဒီမှာ ငသီဟ… မင်းဟာ ဘာစံကြီးပဲ ဖြစ်ဖြစ် အန်းယူဇာက အရေးကြီးဆုံးပဲကွ မှတ်ထား။ ယူဇာချွိုက် ယူဇာချွိုက်။”

ဪ… သူ့အရပ်နဲ့ သူ့ဇာတ်တော့ ဟုတ်နေတာပဲ။ တွေးလျက် မောင်သီဟသည် ဗလကြီးဆန်ဆိုင်မှ ခွာခဲ့သည်။ အနည်းငယ်လျှောက်သော် ညောင်ညိုပင်အောက်မှ အကြော်သည် ဒေါ်ဘုမ၏ ဆိုင်သို့ ရောက်၏။

ဒေါ်ဘုမ အကျော်စိုင်မဟာ ငပျောကိုကျော် မျင်းခွာကျော်လျှက် ဗူးသီးလဲကျော် ကျက်သွန်ကျော်တမြီ အကျော်ဇုံ ၇ပီ။

ထူးဆန်းသော ဆိုင်းဘုတ်သည် ကျွန်ုပ်အား ကြိုလင့်၏။ ကျွန်ုပ်ကိုမြင်သော် ဒေါ်ဘုမသည် ပြာပြာသလဲပင် ခွေးခြေတစ်လုံး ထိုးပေး၍ ရေနွေးအိုး ချလေ၏။

“အကြော်စုံ တစ်ပွဲ အချဉ်များများဗျာ… ဒါနဲ့ ဘာလို့ စာလုံးပေါင်းတွေ အမှားရေးရသတုံး။ ဘုန်းဘုန်းစွန့်ထားတဲ့ စာလုံးပေါင်း သတ်ပုံကျမ်း ရှိသေးတယ်မဟုတ်လား။”

ဒေါ်ဘုမသည် ကျွန်ုပ်အား သနားစရာ သတ္တဝါအလား ကြည့်လျက် ခေါင်းယမ်းလေ၏။

“ဒီမှာ မောင်သီဟ ၂၁ ရာစုမှာ စံတွေ စနစ်တွေ မလိုတော့ဘူး။ မော်ဒန်မှာ ကာရန်တွေ သတ်ပုံတွေ အားလုံးကို ချိုးဖျက်လိုက်ပြီ။ အဓိကက စားသုံးသူ အန်းယူဇာ နားလည်ဖို့ပဲ။ ဒီလို စတန့်ထွင်မှ ရွာမြောက်ဘက်ခြမ်းက တစ်ခုလပ်မ အကြော်ဆိုင်ကို ဖိုက်နိုင်မှာပေါ့။ အခုမြင်တဲ့အတိုင်းပဲ လူစည်နေတာတွေ့တယ်မဟုတ်လား။ ယူဇာချွိုက် ယူဇာချွိုက်။”

ဒေါ်ဘုမသည် ပြောရင်းဆိုရင်း အကြော်စုံပန်းကန်ကို အချဉ်နိုင်းချင်းနှင့် ချပေးလေ၏။ ကျွန်ုပ်လည်း ဒေါ်ဘုမ၏ ဩဝါဒကို အံ့ဩဘနန်း နားထောင်ရင်း အကြော်စုံကို အကြွေးစားခဲ့လေ၏။ ဒေါ်ဘုမအကြော်ဆိုင်မှထွက်သော် ကျောင်းဆရာလေး ကိုကြိုင်နီနှင့် တိုးလေ၏။

“ဟာ ဆရာလေး မတွေ့တာကြာပေါ့ နေကောင်းလား။”

“ကျုပ်စာမသင်တော့ဘူး ကိုသီဟ။”

“ဗျာ ဘာဖြစ်လို့လဲ။”

“ကျုပ် ယဉ်ကျေးမှုတော်လှန်ရေး လုပ်နေတယ်။ အဲ ဘောဒိုင်လည်း နည်းနည်းပါးပါးလုပ်ပါတယ်။”

ယဉ်ကျေးမှုတော်လှန်ရေး။ မောင်သီဟငယ်ခမျာ မျက်ဝိုင်းများ အလုံးသားဖြစ်သွားတော့သည်။ ကျောင်းဆရာက မျက်မှန်ကိုပင့်လျက် ဆက်ပြောသည်။

“ကျုပ် ရန်ကုန်တစ်ခေါက်သွားတော့ မုခစာအုပ်ဆိုတဲ့ အိမ်သာနက်စာမျက်နှာ တစ်ခုကို ရောက်ခဲ့တယ်။ ရောက်တုန်းရောက်ခိုက် သူများအတွင်းရေးတွေ လှန်လှောရင်းနဲ့ ယူဇာချွိုက်ဆိုတာကို ကျုပ်သဘောကျလာတာပဲ။ လူတစ်ချို့က လူနားမလည်တဲ့ ဂြိုဟ်သားစာတွေနဲ့ ရေးကြတယ်ဗျ။ ကျုပ်မေးကြည့်တော့ အန်းယူဇာတွေရဲ့ ယူဇာချွိုက်ကို နားမလည်တဲ့ သဘောက်မသား လူရမ်းကားတွေဆိုပဲ။”

မောင်သီဟလည်း ဉာဏ်မမီနိုင်။ ပါးစပ်အဟောင်းသားနှင့် ရင်သပ်ရှုမော နားထောင်ရ၏။

“ကျုပ် အဲဒါကို အရမ်းသဘောကျတယ်။ ယူဇာချွိုက်ဆိုတာ ဒီမိုကလေဇီပဲ။ အခုကျုပ် ဖိနပ်ကျွဲတစ်ဘက်နွားတစ်ဘက်စီးတယ်။ ကျုပ်မိန်းမ အတွင်းခံတွေ ယူဝတ်တယ်။ စည်းတွေ စံတွေ စနစ်တွေဆိုတာ လူတွေကို ဘောင်ခတ်ထားတာပဲ။ အခုဆို ရွာကလူတွေလည်း ကျုပ်ဟောပြောထားလို့ ယူဇာချွိုက်မှ ယူဇာချွိုက် ဖြစ်နေပြီလေ။ တခြားရွာတွေနဲ့ မတူတာကို ဒီရွာရဲ့ရွေးချယ်မှု ယူဇာချွိုက်ပေါ့။ သူကြီးတောင်မှ သူ့ပေတံအကျိုးလေး ရှစ်လက်မခွဲပဲ ရှိတာကို တစ်ပေသတ်မှတ်မလို့ လုပ်နေတယ်လေ။ ကျုပ်လည်း ပြောလိုက်တယ်လေ လုပ်သာလုပ် ဒီရွာက အများသဘူတောရင် ယူဇာချွိုက်ပဲ လို့။ သူများတွေလည်း ပေတံဘာတံ ကောင်းကောင်းရှိတာမှ မဟုတ်တာ။ လုပ်ပေးတာပဲ ကျေးဇူးတင်ရမယ်လေ။ အခုဆို သူကြီးက သူ့ပေတံနဲ့တိုင်းပြီးတော့ သစ်ဖြတ်စ အပိုင်းလေးတွေ လုပ်ပေးလိုက်တာ အားလုံးသဘောကျလို့။”

ဒီမိုကလေဇီ ဘောင်ခတ်… စကားလုံးများက မြင့်ပါဘိတောင်း။ ကျွန်ုပ်လည်း အံအားတသင့်နှင့် နုတ်ဘုတ်ငယ်ကို ထုတ်ကာ မှတ်သားသမှုပြုရ၏။

“ရွာဦးကျောင်းက ဘုန်းဘုန်းကတော့ ခေါင်းမာတယ်ဗျ ဘယ်လိုမှ ပြောမရဘူး။ ပိဋကတ်သုံးပုံ သင်္ဂါယနာမူက ကြီးလွန်းတယ်။ အခက်ဆုံး နှစ်ပုံခွဲလောက် လွှင့်ပစ်လိုက်ရင် သာမန်လူ လေ့လာလို့ရအောင် ကျုံ့သွားရင် လူတွေသဘောကျကြမှာပဲလို့၊ လူကြိုက်များလာရင် ဘုန်းဘုန်းမူက ယူဇာချွိုက်ဖြစ်လာမှာပဲလို့ ပြောမိတာဗျာ…”

ပြောရင်းဆိုရင်း ကျောင်းဆရာသည် ကျွန်ုပ်ပခုံးကို ကျော်ကြည့်ကာ ဖိနပ်နှစ်ဘက်ကို ခါးကြားကောက်ထိုးလျက် သုတ်ကနဲ ပြေးထွက်သွားလေ၏။ နောက်ပြန်လှည့်ကြည့်သော် ကျောင်းဆရာအား လိုက်ရှာနေသော ဘုန်းဘုန်းကို ကြိမ်လုံးကိုင်လျက် တွေ့လိုက်ရလေသတည်း။

Tags: , ,

· · · ◊ ◊ ◊ · · ·
Apple Sketch on Wacom Bamboo

Apple Sketch on Wacom Bamboo

Marina Boulevard က Starbucks ကော်ဖီဆိုင်ထဲဝင်လိုက်တော့ မူသူးက ရောက်နေပါပြီ။ ကျွန်တော့်ကို ဝမ်းသာအားရ နှုတ်ဆက်ပါတယ်။ သူကတော့ Apple နဲ့ iOS platform တွေမှာ မြန်မာ၊ လာအို၊ ခမာ အပါအဝင် ဘာသာစကားအမျိုးပေါင်း တစ်ဒါဇင်ကျော်အတွက် ဖောင့်ရေးသူဖြစ်ပါတယ်။ ကျွန်တော်က Lion မှာ မြန်မာစာ စပါတာ မြန်မာတွေအတွက် ဝမ်းသာစရာဖြစ်ပြီးတော့ မြန်မာ အိုင်တီလောကမှာ တော်တော်လေး လှုပ်လှုပ်ခတ်ခတ် ဖြစ်သွားတဲ့အကြောင်း ပြောပြပါတယ်။ Commercial OS တွေထဲမှာ ဒါဟာ ပထမဆုံးဖြစ်ကြောင်းလည်း ပြောပြလိုက်ပါတယ်။ သူလည်းဒါကိုသိတော့ တော်တော်ပျော်သွားပုံရပါတယ်။ မြန်မာတွေနဲ့ ဖောင့်ပြဿနာအကြောင်းပြောတော့ သူက Indian Language တွေမှာလည်း ဒီပြဿနာရှိခဲ့ကြောင်းနဲ့ အဓိက OS တွေနဲ့ Google မှာ ယူနီကုဒ်စသုံးပြီးနောက်ပိုင်း တဖြည်းဖြည်း လူတိုင်းယူနီကုဒ်သာ သုံးလာကြတော့ကြောင်း ပြောပြပါတယ်။ သူ့ဆီမှာ ကျွန်တော်ပို့ထားတဲ့ သူ့ဖောင့်အတွက် Bug တွေကို တစ်ဖိုင်တွဲလုံး ပရင့်ထုတ်ထားတာ တွေ့ပါတယ်။

သူက သူ့ဆီရောက်နေတဲ့ မြန်မာစာနဲ့ ပတ်သက်တဲ့ ကွန်ပလိန်းအီးမေးတွေကို ထုတ်ပြပါတယ်။ တစ်စောင်မှာ ယူနီကုဒ်ကို ဇော်ဂျီလက်ကွက်နဲ့ရိုက်ပြထားပြီးတော့ အမှန်မမြင်ရတဲ့အတွက် ဒီဖောင့်ဟာ “မြန်မာလူမျိုးတွေအတွက် အသုံးမကျတဲ့ဖောင့်ပါ” လို့ပြောထားပါတယ်။ နောက်စာတစ်စောင်မှာတော့ “သူ့ဖောင့်မှာပါတဲ့ Glyphs အက္ခရာပုံစံတွေဟာ ရုပ်ဆိုးကြောင်းနဲ့ အမှားအများအပြားပါကြောင်း၊ မူသူးဟာ မြန်မာမဟုတ်တဲ့အတွက် မြန်မာစာကို မြန်မာလူမျိုး သူ့ကဲ့သို့ မသိတဲ့အတွက် မြန်မာဖောင့်ကိုလုပ်တာဟာ မသင့်တော်ကြောင်း၊ သူတို့ဝက်ဘ်ဆိုက်က လုပ်နေတဲ့ဖောင့်တွေဟာ လှပပြီးတော့ အမျိုးအစားစုံလင်ပါကြောင်း” ပြောထားပါတယ်။ သူတို့ဝက်ဘ်ဆိုက်ကိုကြည့်တော့ Homepage ကစလို့ စာလုံးပေါင်းမှားနေတာ တွေ့ရပါတယ်။ မြန်မာမို့လို့ပေပဲ။ ဘယ်သူဆိုတာတော့ မှန်းလို့ ရလောက်မယ်ထင်တယ်။ ​မူသူးက သူ့ဖောင့်တွေဟာ ဒီလောက်တောင်ပဲ ရုပ်ဆိုးလား၊ မှားနေလားဆိုတော့ အဲလောက်လည်းမဟုတ်ကြောင်း လက်ခံလို့ရတဲ့အဆင့်ရှိကြောင်း ပြန်ပြောရပါတယ်။ သူ့အိတ်ထဲမှာလည်း မြန်မာဂျာနယ်တွေ တစ်ထပ်ကြီး ပါပါတယ်။ နေ့လည်ကမှ ပင်နီဆူလာပလာဇာ သွားဝယ်ထားတယ်ပြောပါတယ်။ အွန်လိုင်းမှာ ကိုးကားရှာရတာခက်တဲ့အပြင် အွန်လိုင်းက မြန်မာစာအများစုကလည်း Encoding တလွဲဖြစ်နေတာများလို့ ကိုးကားဖို့၊ တိုက်ကြည့်စစ်ဆေးဖို့ ခက်တဲ့အကြောင်း ပြောပြပါတယ်။ ကျွန်တော်က သူ့ကို Myanmar NLP နဲ့ ဆက်သွယ်လို့ရတဲ့အကြောင်း၊ အကိုးအကားလိုရင် သူတို့ဆီမှာ အကူအညီတောင်းလို့ရတဲ့အကြောင်း ပြောလိုက်ပါတယ်။

Apple မှာပါတဲ့ ဖောင့်တွေရဲ့ နာမည်အဆုံးမှာ MN ပါတဲ့ ဖောင့်တွေက သူရေးထားတာဖြစ်ပါတယ်။ MN က ဘာအဓိပ္ပါယ်လဲ မေးကြည့်တော့ သူ့နာမည် အတိုကောက်ဖြစ်တဲ့အကြောင်း ရယ်ပြီး ရှင်းပြပါတယ်။ Sangam ကတော့ သက္ကတနဲ့ ပါဠိ ဝေါဟာရဖြစ်ပြီး ဆက်သွယ်စုစည်းမှု၊ ပေါင်းစည်းမှု ပေါင်းဆုံမှု လို့ အဓိပ္ပါယ် ရပါတယ်။ Myanmar MN က Document တွေအတွက် Default ဖောင့်ဖြစ်ပြီးတော့ Myanmar Sangam MN က UI အတွက် Default ဖောင့်ဖြစ်ပါတယ်။ ဖောင့်တစ်ခုစီမှာ Regular နဲ့ Bold နှစ်ခုစီပါပြီး ဖောင့်နှစ်ခုအတွက်ဆိုရင် စုစုပေါင်း ဖောင့်လေးမျိုးရှိမယ်လို့ပြောပါတယ်။

Bugs in Myanmar Fonts

Some Bugs in Myanmar Fonts

အဓိကလွဲနေတာတွေကတော့ –
(၁) အောက်မြစ် + အသတ် ဖြစ်ပါတယ်။ ယူနီကုဒ် ၅.၂ မှာ တိုင်းရင်းသားဘာသာစကားတွေ ပါလာပါတယ်။ စကောကရင်အတွက်လည်း မြန်မာအောက်မြစ်ကို ယူသုံးပါတယ်။ အကြောင်းမှာ ယူနီကုဒ်မှာ ဒီအတွက် ကုဒ်ပွိုင့်သတ်သတ် ထပ်တောင်းလို့ မရတော့ပါ။ အောက်မြစ် (Dot below) ဟာ အောက်မြစ်သာမက သရအဖြစ်လည်း သုံးထုံးရှိပါတယ်။ Normalize လုပ်တဲ့အခါမှာ အောက်မြစ်အသတ် ရိုက်ထားသည်ဖြစ်စေ၊ အသတ်အောက်မြစ် ရိုက်ထားသည်ဖြစ်စေ အောက်မြစ်ကို အသတ်ရှေ့မှာ ထားစီဖို့ သတ်မှတ်ထားပါတယ်။ ကျွန်တော်တို့ စာရိုက်ရင်တော့ ရေးထုံးအတိုင်း အသတ်အောက်မြစ် ရိုက်နိုင်ပြီးတော့ Encoding စီတဲ့အခါမှာ အောက်မြစ်အသတ် ပြန်စီပါမယ်။ မူသူးက ဒီရှေ့က Document စာရွက်စာတမ်းတွေ ဖတ်ပြီးလုပ်တာဖြစ်တဲ့အတွက် ဒီအချက်ကို လွတ်သွားပါတယ်။ အဲဒါနဲ့ သူ့ကို စာရွက်စာတမ်းတွေ ပြန်ရှာပြရပြီး ယူနီကုဒ်က မာတင်ဟော့စ်ကင် ဆီကိုပါ အတည်ပြုချက် လှမ်းတောင်းရပါတယ်။ Apple မှာ ဒီကိစ္စအတွက် အစည်းအဝေးလုပ်ဖြစ်ပြီး အကြောင်းအကျိုးနဲ့ မနည်းရှင်းပြခဲ့ရတယ်လို့ မူသူးက ပြောပါတယ်။ ဖောင့်ပြင်ပြီးရင်တော့ အောက်မြစ်အသတ်ပဲရိုက်ရိုက် အသတ်အောက်မြစ်ပဲရိုက်ရိုက် အမှန်ပြနိုင်အောင် ပြင်ထားမယ်လို့ သိရပါတယ်။ ကီးမက်ဂျစ်သုံးရင်တော့ Normalize လုပ်ပြီးသား Encoding အတိုင်း ရပါမယ်။

(၂) နောက်တစ်ချက်ကတော့ နငယ်ဖြစ်ပါတယ်။ အောက်မြစ်နဲ့ပေါင်းရင် နငယ်ဟာ တိုသွားပါတယ်။ ပါဌ်ဆင့် ဒါမှမဟုတ် ဟထိုး၊ ချောင်းငင်၊ ရရစ်နဲ့တွေ့မှသာ နငယ်အတိုဖြစ်ကြောင်း ပြောရပါတယ်။

(၃) ရကောက်နဲ့ ဟထိုးတစ်ချောင်းငင်တွေ့ရင် တစ်ချောင်းငင်က ရကောက်အောက်မှာသာ နေပါတယ်။

(၄) မြန်မာ ပန်ဂရမ်ထဲမှာ ယူသုံးထားတဲ့ ဝဍ္ဎန က ဍ္ဎက မှားနေပါတယ်။ ဍရင်ကောက်က အပေါ်ရောက်ပြီး ဎရေမှုတ်က အောက်ကဝိုက်ထားပါတယ်။ ဘာသာဗေဒအရ အဲဒီပုံက မှန်ပါတယ်။ ဟိုးရှေးရှေးကလည်း ရေးထုံး တစ်ခုတလေ ရှိပါတယ်။ ဒါပေမဲ့ ခုခေတ်မှာ ရေးထုံးက နှစ်ခုချိတ်လျက်ဖြစ်တယ်လို့ ပြောပြရပါတယ်။

(၅) အက္ခရာဤ နဲ့ ဏကြီး မှာ မလိုအပ်ဘဲ အတက်တွေပါနေပါတယ်။ အက္ခရာဣ ကတော့ ကကြီးနှစ်လုံးဆင့်ပုံဖြစ်ပြီး အတက်ပျောက်နေပါတယ်။

(၆) စာလုံးတွေရဲ့ အပေါ်အောက် ညှိတာတွေ ရှည်တာရှည် တိုတာတို ဖြစ်နေပါတယ်။ သူ့အနေနဲ့တော့ Typeface နဲ့ ဒီဇိုင်းကိုငဲ့ပြီး စာလုံးအရွယ်ညီအောင် အတိုအရှည်တွေ အမျိုးမျိုး လုပ်ထားပါတယ်။ ကျွန်တော့်အနေနဲ့ အဲဒါက ပြဿနာမဟုတ်ပေမဲ့ တချို့က လုံးလုံးလက်ခံပေးလို့မရပါလို့ ပြောရပါတယ်။ အဲဒါ အင်မတန်လွယ်ကြောင်း၊ လက်ရေးလှလေ့ကျင့်သလို မျဉ်းလေးကြောင်းဆွဲပြီး အထဲဝင်အောင်သာ ညှိလိုက် အားလုံးအဆင်ပြေသွားမယ်လို့ အကြံပေးလိုက်ပါတယ်။
(၇) ရပ္ပ (Repha) (ကင်းစီးတင်သလို ရကောက်ကို ဗျည်းပေါ်မှာတင်တာ) က မွန် Vowel E နဲ့ ခပ်ဆင်ဆင်တူနေပါတယ်။ ဒီလိုပဲ ရှေးကသုံးလား မှားလား မှန်လား ပြောမရသေးပါ။ ပုဂံကျောက်စာတွေ ပြန်ရေးထားတဲ့ စာအုပ်ထဲမှာတော့ ရကောက်အသေးလေး အပေါ်တင်တာ တွေ့ဖူးတယ်။ Myanmar NLP ကို အကူအညီတောင်းပြီး ကိုးကား ပြန်ရှာရပါမယ်။
(#24th June 2011# Repha’s shape is confirmed to be English letter 6 or open quote above the consonant.)

ကျန်တာတွေကတော့ အောက်မြစ်၊ ဗျည်းတွဲ၊ ချောင်းငင်၊ စတာတွေရဲ့ နေရာအထားအသိုတွေဖြစ်ပါတယ်။

တော်တော်လေး စကားပြောပြီးတော့ ကိုတင်မျိုးထက် ရောက်လာပါတယ်။ သူကတော့ မာစတာပိစ်ယူနီစံရဲ့ မူလပထမ ဖန်တီးရှင် ဖြစ်ပါတယ်။ လင်းနစ်ပန်ဂိုးအတွက် အရင်ဖန်တီးခဲ့ပြီး နောက်ပိုင်းမှာ Apple အတွက်ရေးပေးသူ တစ်ဦးဖြစ်ပါတယ်။ ကိုငွေထွန်းကတော့ ရန်ကုန်မှာ ဗာဟီရများနေလို့ မလာနိုင်တော့ပါ။ မူသူးက မကြာခင်ထွက်တော့မယ့် AAT အသစ်မှာ Positioning ပါလာတော့မှာဖြစ်ပြီး မြန်မာအပါအဝင် Brahmi အခြေခံ ဘာသာစကားတွေအတွက် ဖောင့်လုပ်ရတာ ပိုအဆင်ပြေလာမှာဖြစ်ကြောင်း ပြောပြပါတယ်။ ကျွန်တော်တို့က စင်္ကာပူတစ်ခုတည်းမှာတင် မြန်မာလူမျိုး နှစ်သိန်းခွဲကျော်ရှိပြီး တော်တော်များများက အိုင်ဖုန်း အိုင်ပက်တွေသုံးကြတဲ့အကြောင်း၊ သုံးစွဲသူအရေအတွက် မနည်းလှတဲ့အကြောင်း ပြောပြတော့ သူက အဲဒီ Stats နဲ့ မြန်မာတွေရဲ့ စိတ်အားထက်သန်မှုကို Apple ကို ပြနိုင်ရင် နောက်သုံးလေးလအတွင်းမှာ ထွက်လာမယ့် iOS5 မှာ မြန်မာစာပါလာအောင် သူကြိုးစားပေးလို့ရကြောင်း ဝမ်းသာအားရ ပြောပါတယ်။ ဒီ့အတွက် Ornagai နဲ့ iMyanmar ဒေါင်းလုဒ်အရေအတွက်ဟာ မြန်မာ iOS အသုံးပြုသူအများစုရဲ့ အရေအတွက်ကို ရောင်ပြန်ဟပ်နိုင်မယ်ထင်တယ်။ ဒီလို Apple က Developer တစ်ယောက်နဲ့ တိုက်ရိုက်တွေ့ရတာ သူနဲ့ကိုယ်နဲ့ ဘာတွေလိုနေလဲ၊ ဘယ်လို ဆက်သွယ်ရမလဲ ဘာတွေကူညီနိုင်သလဲ ဆိုတာတွေသိသွားလို့ တော်တော် အကျိုးရှိတယ် ပြောနိုင်ပါတယ်။ Lion မှာတင်မက iOS မှာပါ မြန်မာစာပါလာတော့မယ်ဆိုရင် အတို်ငး်ထက်အလွန် တံခွန်နဲ့ ကုက္ကားပါပဲဗျား။

Tags: , , , , , , ,

· · · ◊ ◊ ◊ · · ·

Download PDF here.

ဒီပို့စ်က မြန်မာယူနီကုဒ် လက်ရှိ တိုးတက်မှု ဘယ်လောက်ရှိပြီဆိုတာ မှတ်သားထားတာဖြစ်ပါတယ်။

Unicode Keyboard on iOS by ttkz

Myanmar Keyboard on iOS by ttkz (မှတ်ချက် - ယူနီ မကုတ်တော့ဘဲ ဒဒွေးဖြင့်သတ်ကာ ယူနီကုဒ်ကြပါတော့ရန်။)

၁။ ဒီလင့်က ယူနီကုဒ်စည်းမျဉ်းကို သုံးနေတဲ့ ဖောင့်စာရင်းဖြစ်ပါတယ်။ OSX Lion မှာ ဖောင့်နှစ်မျိုးထပ်ပါပေမဲ့ Publish မလုပ်မချင်း ဖောင့်နာမည်နဲ့ အရေအတွက် ကို အတည်ပြုမရသေးတာကြောင့် ထပ်မဖြည့်ထားသေးပါ။ နောက်ပိုင်း ဖောင့်တိုင်းက ယူနီကုဒ်စည်းမျဉ်းကို လိုက်နာလာရင် ဒီစာရင်းကို အမီလိုက်ဖြည့်နိုင်ဖို့တောင် လွယ်မယ်မထင်ပါ။ လောလောဆယ် ဖောင့်စာရင်းက Myanmar3, Padauk, Parabaik, MyMyanmar, Xenotype, Yunghkio, Masterpiece Uni Sans, Thanlwin တို့ ဖြစ်ပါတယ်။

၂။ ဒါကတော့ လက်ရှိယူနီကုဒ်ဖောင့်တွေအတွက် သုံးနေတဲ့ နည်းပညာ တွေကို စာရင်းပြုစုထားတာဖြစ်ပါတယ်။ အနည်းဆုံး Basic Opentype Features တွေ ကို ထောက်ပံ့ရင် ဘယ် OS ဘယ် ပလက်ဖောင်းမှာမဆို အလုပ်လုပ်တဲ့ ယူနီကုဒ်ဖောင့် ရှိပါပြီ။

Burmese Support in OSX Lion

Burmese Support in OSX Lion

(က) အားလုံးသိတဲ့အတိုင်း OSX Lion က မြန်မာစာကို Support လုပ်ပါပြီ။ Lion သုံးရင် မြန်မာစာဖတ်ဖို့ ဖောင့်သွင်းတယ်ဆိုတာ မလိုတော့ပါ။ Masterpiece Uni Sans, MyMyanmar, Xenotype နဲ့ Myanmar3 တို့လည်း OSX နဲ့ iPhone iPod နဲ့ iPad တွေအတွက်သုံးတဲ့ iOS မှာ သုံးနိုင်ပါပြီ။

(ခ) Myanmar3, Padauk, Parabaik, MyMyanmar, Yunghkio, Thanlwin တို့ Windows XP sp3 နဲ့အထက်မှာ ရပါတယ်။

(ဂ) Linux Distros တွေအတွက် Pango Module ပါရင် Windows မှာ ရတဲ့ ဖောင့်တွေ အကုန်သုံးလို့ ရပါတယ်။ Pango ကို နောက်ပိုင်းထွက်တဲ့ Linux Desktop ဗားရှင်းတွေ အားလုံးလိုလိုမှာ Built-in ထည့်ပေးထားပါတယ်။ Masterpiece Uni Sans က Pango အတွက် Native Version ရှိပါတယ်။

Myanmar Unicode on Adobe Photoshop

Myanmar Unicode on Adobe Photoshop

(ဃ) Adobe က ဘယ် OS မှာမဆို သူ့ထုတ်ကုန်တွေမှာ Basic Opentype Features တွေသာ သုံးခွင့်ပြုပါတယ်။ အဲဒီကန့်သတ်ချက်ကြောင့် ရှေ့နောက်ပြန်စီစဉ်ဖော်ပြရတဲ့ ယူနီကုဒ်တွေ (ခမာ၊ မြန်မာ) ယူနီကုဒ်တွေ Adobe CS မှာ အမှန်မပေါ်ပါ။ Thanlwin ဖောင့်ကတော့ Opentype တစ်မျိုးတည်းသာ သုံးထားတဲ့ဖောင့်ဖြစ်တာကြောင့် Windows နဲ့ OSX က Adobe CS Suite တွေမှာ ကောင်းကောင်း အလုပ်လုပ်ပါတယ်။ ဆိုလိုတာက Opentype တစ်မျိုးတည်းသာ ထောက်ပံ့တဲ့ Environment မှာတောင် ယူနီကုဒ် အလုပ်လုပ်ပါပြီ။

(င) Android, Nook, Kindle မှာ ယူနီကုဒ်အမှန်မပေါ်သေးပါ။ ဘယ်နေရာ ယူနီကုဒ် သုံးလို့ရပြီ၊ ဘယ်နေရာမှာ မရသေး စတာတွေအတွက် သိသာအောင် ဖော်ပြပေးတာ ဖြစ်ပါတယ်။

၃။ MyanmarLanguage.Org ကတော့ ယူနီကုဒ် Developers တွေ၊ မြန်မာစာတိုးတက်ရေးကိုအားပေးသူတွေနဲ့ မြန်မာ NLP Lab ကလူတွေနဲ့ တိုက်ရိုက်ချိတ်ဆက်ထားတဲ့ ဝက်ဘ်ဆိုက် ဖြစ်ပါတယ်။ အကူအညီလိုရင် အဲမှာ ဝင်မေးနိုင်ပါတယ်။

၄။ ဒါကတော့ Mysteryzillion က ပြုစုထားတဲ့ Unicode Package ဖြစ်ပါတယ်။ ယူနီကုဒ်သုံးရာမှာ ကြုံတွေ့နိုင်တဲ့ ပြဿနာတွေ၊ ဖြေရှင်းနည်းတွေကို အစုံအလင်ထည့်ပေးထားရုံမက ဖောင့်နဲ့ ကီးဘုတ်တွေလည်း ထည့်ပေးထားပါတယ်။

၅။ ICU ကို အခုနောက်ဆုံးထွက်တဲ့ Firefox 4, Chrome, Chrome OS, OSX Lion, iOS5 တွေမှာ Support လုပ်ပါပြီ။ ICU ဆိုတာ အတိုပြောရရင်ဆော့ဝဲတွေမှာ မြန်မာစာကို မြန်မာလိုအသင့်သုံးလို့ရအောင် Implement လုပ်ပေးထားတဲ့ Library လို့ ပြောနိုင်ပါတယ်။ ဆိုလိုတာကတော့ ယူနီကုဒ်ဆိုတာ စာမြင်ရအောင်လုပ်တဲ့ ဖောင့်သက်သက် မဟုတ်ဘဲ ကွန်ပျူတာကို ဘယ်ပလက်ဖောင်းမှာမဆို မြန်မာစာနဲ့ တွက်ချက်နိုင်အောင် လုပ်ပေးထားတဲ့ စံစနစ်တစ်မျိုးဖြစ်ကြောင်း ဖော်ပြချက်တစ်ခု ဖြစ်ပါတယ်။

(က) ICU support လုပ်ထားရင် မြန်မာစာလုံးတွေကို ဝဏ္ဏအလိုက် Select မှတ်နိုင်၊ Delete လုပ်နိုင်ပါပြီ။ OSX နဲ့ Linux တွေမှာ OS Level မှာ ဘယ်ဆော့ဝဲမဆို အလွယ်သုံးနိုင်ပါတယ်။ Windows မှာတော့ Firefox 4 နဲ့ Chrome ဘရောက်ဆာတွေမှာ စမ်းကြည့်နိုင်ပါတယ်။ အဲဒီ Feature ကြောင့် စာလုံးကို Select မှတ်လိုက်တဲ့အခါ အောက်မြစ် အသတ်တွေ ကျန်ခဲ့တဲ့ ကိစ္စမျိုး မဖြစ်တော့ပါဘူး။

Linux Myanmar Sorting

Linux Myanmar Sorting

Burmese Sorting on OSX

Burmese Sorting on OSX

(ခ) မြန်မာလို အက္ခရာစဉ်နိုင်ပါပြီ။ Linux နဲ့ OSX Lion  မှာ OS Level မှာ အလွယ် မြန်မာလို စဉ်နိုင်ပါပြီ။ မြန်မာစာ၊ စာအုပ်စာရင်း၊ စာကြည့်တိုက်၊ လူစာရင်း စတာတွေနဲ့ အလုပ်လုပ်နေသူတွေအတွက် အလွန်အသုံးဝင်တဲ့ Feature ဖြစ်ပါတယ်။ လောလောဆယ် Windows မှာ မြန်မာလို မရသေးပေမဲ့ Myanmar Locale ကိုသွင်းလို့ဖြစ်စေ၊ OpenOffice/LibreOffice ကို သုံးလို့ဖြစ်စေ၊ မြန်မာလို အလိုအလျောက်စဉ်နိုင်ပါပြီ။

Calculate With Myanmar Digits

Calculate With Myanmar Digits

(ဂ) OS Level မှာ မြန်မာလို တွက်နိုင်ပါပြီ။ ဒီ Feature ကြောင့် ယူနီကုဒ်သာမက ယူနီကုဒ်ပွိုင့်တွေကို ယူသုံးထားတဲ့ ယူနီကုဒ်မဟုတ်တဲ့ ဖောင့်တွေနဲ့လည်း ဂဏန်းတွက်လို့ရပါပြီ။ အချိန်၊ နေ့၊ လ တွေကိုတော့ ယူနီကုဒ် စည်းမျဉ်းကို လိုက်နာထားတဲ့ ဖောင့်တွေနဲ့သာ တွက်ချက်နိုင်မှာ ဖြစ်ပါတယ်။ OSX, Linux မှာ Native သုံးနိုင်ပြီးတော့ Windows မှာတော့ Locale သွင်းလို့ဖြစ်စေ၊ OpenOffice/LibreOffice သုံးလို့ဖြစ်စေ သုံးနိုင်ပါပြီ။

(ဃ) မိမိ ကွန်ပျူတာမှာ ရက် လ ဂဏန်း နိုင်ငံ စတာတွေကို မြန်မာလို မြင်နိုင်ပါပြီ။ ထုံးစံအတိုင်း OSX နဲ့ Linux မှာ ရပြီးတော့ Windows မှာတော့ Loc​ale သွင်းဖို့ လိုပါတယ်။

Myanmar Unicode Texts Justified

Myanmar Unicode Texts Justified (screenshot credit by ttkz)

(င) စာလုံး စာပိုဒ်တွေ Justify လုပ်တဲ့အခါမှာ Unicode မဟုတ်ရင် ရုပ်ဆိုးပါတယ်။ ယူနီကုဒ်မှသာ သူနဲ့သက်ဆိုင်ရာ ဝဏ္ဏတွေ အုပ်စုလိုက်ရှိပါတယ်။ သဝေထိုးရရစ်တွေ ရှေ့မှာရှိနေတဲ့ ယူနီကုဒ်မဟုတ်တဲ့ ဖောင့်တွေကိုသုံးရင် ရှေ့မှာ သတ်သတ်ကွဲထွက်ကုန်ပါတယ်။

၆။ OSX နဲ့ Linux မှာ မြန်မာစာပါတာဟာ သူတို့ကို ထည့်ပေးပါလို့ တောင်းဆိုလို့ ပါလာတာ မဟုတ်ပါဘူး။ သူတို့သဘောနဲ့ သူတို့ ထည့်ပေးတာသာ ဖြစ်ပါတယ်။ ဒါပေမဲ့ ဒီလိုထည့်ပေးလို့ရအောင် ယူနီကုဒ် Developers တွေနဲ့ မြန်မာ NLP တို့က ယူနီကုဒ်စံများ အဆိုပြုခြင်း သတ်မှတ်ခြင်း၊ ICU CLDR စတဲ့ Library များကို သတ်မှတ်ခြင်း၊ ယူနီကုဒ်စံကို အခြေခံပြီး ဖောင့်ဖန်တီးရင် လိုအပ်မယ့် အချက်တွေ၊ ဖြစ်ပေါ်နိုင်တဲ့ စာလုံးပုံစံတွေ ပြုစုပေးခြင်း စတဲ့ ဖန်တီးပေးတဲ့ အခြေအနေတွေကြောင့်လို့ ပြောနိုင်ပါတယ်။ လောလောဆယ် Main Vendors နှစ်ခုဖြစ်တဲ့ မိုက်ကရိုဆော့ဖ်နဲ့ ဂူးဂဲလ်မှာ လည်း မြန်မာစာ စပါဖို့ နီးစပ်နေပြီလို့ သတင်းကောင်းပါးလိုပါတယ်။ မြန်မာစာကို Support လုပ်ဖို့အတွက် သူတို့မှာ ဘာလိုလဲ၊ ဘာကြောင့်မလုပ်ပေးသေးတာလဲ၊ ကိုယ့်ဘက်က ဘာလုပ်ပေးရမလဲ၊ တိုက်ရိုက်မသွားဘဲ ကွေ့ဝိုက်သွားလို့ရတဲ့ နည်းတွေရှိလားဆိုတာကို ကြည့်ပြီး ကိုယ့်ဘက်က လိုအပ်တာတွေ ဖြည့်ဆည်းထားပေးဖို့ပဲ လိုပါတယ်။ အချိန်တန်ရင် ဒီ ကုမ္ပဏီနှစ်ခုသာမက ဘယ် Platform ဘယ် ကုမ္ပဏီ မဆို မြန်မာစာကို Support လုပ်တော့မှာ ဖြစ်ပါတယ်။ ၁၀ နှစ်လား၊ အနှစ် ၂၀ လား လောက်အထိ တွေးမျှော်စရာ မလိုတော့တဲ့ အချိန် ရောက်နေပါပြီ။

Burmese Wikipedia Logo

Burmese Wikipedia Logo

၇။ ယူနီကုဒ်နဲ့တော့ တိုက်ရိုက်မဆိုင်ပါဘူး။ ဝီကီပီးဒီးယားမှာ ဒီနေ့ ဆောင်းပါး ၆၀၀၀ (ခြောက်ထောင်) ပြည့်ပြီး ဝစ်ရှင်နရီမှာ ၁၁၃၀၀၀ (တစ်သိန်းတစ်သောင်းသုံးထောင်) ရှိပြီဆိုတာ တစ်ခါတည်း စာရင်းတို့ထားတာဖြစ်ပါတယ်။ အကြောင်းအရာတွေကို အချင်းချင်းချိတ်ဆက်ထားပြီး ကိုးကားချက် အပြည့်အစုံ ဖော်ပြထားတဲ့ လွတ်လပ်စွယ်စုံကျမ်းတစ်ခုဖြစ်လာဖို့၊ အသံထွက်၊​ရင်းမြစ်၊ အသုံးအနှုန်း၊ ဘာသာပြန် အပြည့်အစုံပါတဲ့ လွတ်လပ်အွန်လိုင်းအဘိဓာန် ဖြစ်လာဖို့ကလည်း တတ်နိုင်သလောက် ဝင်ကူကြဖို့ပါ။ ဒါကိုလည်း ကြုံရင် ကြုံသလို ဘွန္တောလုပ်ပါတယ်။

Tags: , , , , , , ,

· · · ◊ ◊ ◊ · · ·

ယူနီကုဒ်သုံးသူများ ချမ်းသာသုခနှင့် ပြည့်ဝမည်။ မသုံးလျင် ဆင်းရဲဒုက္ခ ရောက်မည်။ ဤစာကို ရသူတိုင်း မိမိအသိမိတ်ဆွေ ငါးယောက်၏ FB Wall ပေါ်တွင် ပြန် Share ပါ။ သို့မဟုတ် နီးစပ်ရာ ယူနီကုဒ်မရှိသေးသော ကွန်ပျူတာငါးလုံးကို ယူနီကုဒ်အတင်းအကြပ်သွင်းပါလေ။ (လိုအပ်လာပါက လက်နက်ကြီး လက်နက်ငယ်သုံးပါ။)

 

ဒလမှ အကြော်သည် ဒေါ်ဘုမ ယူနီကုဒ်သုံးသဖြင့် အကြော်ရောင်းကောင်းသည်။ (ဟင် ဘာဆိုင်လို့လဲ)။

စင်ပူမှ ကိုကျောက်လုံး ယူနီကုဒ်သုံးသဖြင့် ပီအာအလွယ်ရသည်၊ တိုတို လေးသန်းဖိုးပေါက်သည်။

 

ရန်ကုန်မှ ဦးပု မသုံးသဖြင့် ခွေးဆွဲခံရသည်။

တောင်ကြီးမှ လျောင်ကီး မသုံးသဖြင့် ခေါက်ဆွဲဆိုင်လူမကျ။

 

ဤသည်ကား ပထမံဆြာဆန်း တစ်ရေးနိုးမက်သော အိပ်မက်အလိုတည်း။

Tags: , , , , ,

· · · ◊ ◊ ◊ · · ·

Consonant+Medial+Vowel“.

Burmese Unicode sequence

Burmese vowel “e” (​ေ) is up-side-down of English “e” shape and is a dependent vowel. Some people complained why vowel e is behind the consonant in Unicode encoding. I tried to answered that it’s according to logical and linguistic approach for a Brahmi based script and it doesn’t affect on how we type the character sequences. But some really conservative and stubborn people keep saying that it’s not “Myanmar’s Way”. They think that Burmese script was invented by ancient genius Burmese last 2000 years ago. Geez!

Pallava family branches

Pallava family branches

Well, the more the resistant, the more the motivation I get to learn new things. Burmese language was originally based on Mon and Arakan scripts. Mon and Arakan scripts came from Grantha scripts which was a southern family of Brahmi script. Brahmi script was the origin of most of south and west Asian scripts.

As you can see in the image, vowel e was originally just a modifier to the consonant. All the vowels stayed on top of or below the consonants. People changed writing styles in time. Sometimes, when time passed, people started forgetting the origin of certain history. But in internet age, we can research and dig up easily when we couldn’t do it two decades ago.

Brahmi script 3rd century BC

Brahmi script 3rd century BC. The original form of vowel e was very simple, a stick on top left side of consonant.

Vowel E for Indian Languages 2nd century -7th century AD

Vowel E for Indian Languages 2nd century -7th century AD. Vowel e in all branches still maintained top left position.

Arakan Vowel "e" 2nd century - 6th century

Arakan Vowel "e" 2nd century - 6th century AD. The vowel e was clearly still on top and scripts were not very much different from original southern family Grantha

Pyu script 4th century - 6th century AD

Pyu script 4th century - 6th century AD. Vowel e was still near to it's original form.

Pallava - a Pyu equivalent script

Pallava - a Pyu equivalent script. Many of it's original shapes and forms were still maintained.

Pyu script proposal to Unicode

Pyu script proposal to Unicode by an individual. In Brahmi based script Unicode encoding models, all independent vowels stay behind consonant

Myazedi 12th Century AD

Myazedi Inscription 12th Century AD. Finally, vowel e was completely moved in front of consonant.

 

Read more:

  • http://skyknowledge.com/pallava.htm
  • http://anshumanpandey.blogspot.com/2010/08/pyu-ancient-script-of-burma.html
  • http://www.myanmartutorials.com/articles/logical-order-or-non-logical-order/
  • http://en.wikipedia.org/wiki/Grantha_script
  • http://en.wikipedia.org/wiki/Br%C4%81hm%C4%AB_script
  • Arakan Coins by U San Tha Aung, The Buddhist Art of Ancient Arakan by U San Tha Aung.

Tags: , , , , , , , , , , , ,

· · · ◊ ◊ ◊ · · ·
Linux Myanmar Sorting

Linux Myanmar Sorting

 

This is a quick guide to sorting Burmese (မြန်မာ အက္ခရာစဉ်). If you are using Unicode for Burmese, you can auto-sort Burmese texts and files in Linux OS distros and OpenOffice suite in any OS. You can develop applications with Burmese sorting supported using ICU library. Even so, there are times you cannot rely on machines when you are working with non-Unicode fonts or on paper. Here is the shortcut for you to quickly memorize how the Burmese sorting works.

Burmese Consonants

  • က ခ ဂ ဃ င
  • စ ဆ ဇ ဈ ဉ ည
  • ဋ ဌ ဍ ဎ ဏ
  • တ ထ ဒ ဓ န
  • ပ ဖ ဗ ဘ မ
  • ယ ရ လ ဝ သ
  • ဟ ဠ အ

Dependent Vowels

  • အ အာ အိ အီ အု အူ အေ အဲ အော အော် အံ အို

Independent Vowels

  • ဣ ဤ ဥ ဦ ဥ ဩ ဪ

Medials

  • ျ ြ ွ ှ (ပင့်ရစ်ဆွဲထိုး)

See the complete list of Burmese characters in Unicode chart.

 
 
 
 
 

The Burmese Sorting Formula

(1) Consonant*+ Vowel**

(2) Consonant*+ Vowel***+ (Consonant+Asat)**

(3) Consonant*+ Medial**+

– (a) Vowel***

– (b) Vowel****+ (Consonant+Asat)***

– (c) (another) Medial*** + Vowel****

– (d) (another) Medial*** + Vowel***** + (Consonant+Asat)****

– (e) (another) Medial*** + (another) Medial**** + Vowel*****  (There is only one for this; မြွှာ)

– (f) (another) Medial*** + (another) Medial**** + Vowel******+ (Consonant+Asat)***** (There is only one for this; မြွှင်း)

#The less the stars(*), the higher the priority.

 

Notes:

(1) Asat and Virama are assumed as equal. E.g. စက္က and စက်က are the same. Kinzi (ကင်းစီး) is equal to Nga+Asat (ငသတ်). E.g. အင်္ဂလိပ် is equal to အင်ဂလိပ်.

(2) ည (Double Nya or Nya) comes after ဉ(Nya lay). ယျ (Double Ya) comes after ယ (Ya).

(3) Dot below (အောက်မြစ်) and Visaga (ဝစ္စပေါက်) come after related vowels. E.g. က ကာ ကာ့ ကား ကာ့း.

(4) Independent vowels are equal to A(အ)+Dependent vowels. E.g. ဧ = အေ, ဦ = အူ, ဥုမ် = အုမ် = အုံ etc. မ် (Ma+asat) is equal to သေးသေးတင် (Anusvara).

(5) There is no special mentioning about number sorting. So numbers will comes before consonants as other languages do.

#See the original reference from Burmese dictionary of Myanmar Language Commission.

#See the pre-sorted Burmese Orthography in Wiktionary.

More Links:

Tags: , , , , , , , , ,

· · · ◊ ◊ ◊ · · ·

“Today, Myanmar Wiktionary reaches 100,000 words!”

Myanmar Wiktionary 100K plus

I started contributing to Wiktionary at the end of last year. It was difficult to maintain a nearly inactive Wiktionary with a couple of regular members. So I decided to make the Wiktionary usable to certain extents first while I tried to recruit new contributors. I collected opensourced dictionary data online such as Ornagai, electrical engineering dictionary porject and Sealang Burmese dictionary. Online community generated data such as Ornagai has a lot of spelling mistakes in it and the format and definitions are inconsistent which need to be improved greatly. Then Myanmar NLP kindly provided me with the Myanmar lexicon database.

Pywikipediabot is a very handy and useful application. I used to run it for fixing minor encoding mistakes in Burmese. Now I used it to upload dictionary data. I spent the Myanmar new year (13th-17th April) formatting the data to Wiki markup. Now Myanmar Wiktionary is available in two languages as English-Burmese and Burmese-Burmese. While bot was uploading data, we tried to improve the homepage design and to add more words which were not in the collected dictionary data. Today, Myanmar Wiktionary reaches 100,000 words.

Unicode Font Usability

It might be confusing that why there are not a lot of Burmese Wikipedians or Wiktionarians. It was a complex drama that there were several pseudo Unicode fonts (they use Unicode codepoints for Burmese, but never follow the codepoints exactly or the encoding order) when standard Unicode fonts were still in development, and one of the pseudo Unicode font named Zawgyi became popular. Unicode fonts are used in Government offices and international projects such as Wikipedia. Yet a normal Burmese online citizen would only use Zawgyi font. We, the Unicode activists, tried to make awareness of Unicode standard and got some achievements as popular IT forums such as MyanmarITPros, Mystery Zillion and Mmitd between 2011 English new year and Burmese new year.

Change to Unicode

Before major OS vendors such as Apple and Microsoft support Burmese language in OSX and Windows, there should be solution for usability of WikiMedia projects for OS unsupported languages.

1. Font embedding

Burmese Unicode sequence

Burmese script is  one of many branches of Brahmi script. It needs complex shaping and reordering of glyphs. So Unicode fonts with proper contextual rendering are necessary. Most of the people don’t have Burmese font or have Burmese font but Zawgyi. They wouldn’t be able to see the Wikipedia or Wiktionary texts or wouldn’t see them properly. So embedded font is needed for reading purpose. There are several opensourced fonts for Burmese in multiple platforms such as Windows, Linux, OSX and iOS. Some of them are cross-OS enabled. OS and browser detection javascripts were developed and TTF, compressed TTF, eot and woff can be embedded accordingly. As I am not a coder, I would be very glad if someone were to develop a font embedding module for mediawiki and implement in local wikis.

2. Build-in keyboard

Even after texts are readable, editing texts in local languages needs special keyboard inputs. Languages such as Burmese needs keyboards with reordering capability. People usually don’t have keyboard installed in their computer or mobile devices. There is a project called Narayam which is a build-in keyboard plugin for mediawiki and I helped writing Myanmar Unicode keyboard for it. There is also a Burmese local project called Keymagic and one of it’s effort was web keyboard. I hope with the help of them, editing Wikipedia even in local language would be possible.

 

Recruiting for Wiktionary

ဒီနေ့ မြန်မာဝစ်ရှင်နရီ ဝေါဟာရ တစ်သိန်း ပြည့်တဲ့နေ့ဖြစ်ပါတယ်။ လောလောဆယ် ပုံမှန်ဝင်ရေးနေတာ Trh နဲ့ ကျွန်တော် နှစ်ယောက်ပဲ ရှိပါတယ်။ Myanmar NLP က ပေးတဲ့ မြန်မာစာ ဒေတာဘေ့စ် ကို ဝီကီပီးဒီးယားဘော့သုံးပြီး အဓိပ္ပါယ် သတ်မှတ်ချက်တွေကို တင်ပါတယ်။ မြန်မာ ဝီကီပီးဒီးယားနဲ့ မြန်မာ ဝစ်ရှင်နရီ နှစ်ခုအတွက် MgSunBot run ထားတဲ့ Dedicated ကွန်ပျူတာ တစ်လုံး သတ်သတ်ထားပါတယ်။ Encoding ပြင်တာတွေ၊ အင်တာဝီကီလင့် ထည့်တာတွေ၊ ဆောင်းပါးတွေ အလိုအလျောက်တင်တာတွေ လုပ်ပါတယ်။ ဆောင်းပါးတစ်သိန်းမှာ အများစုက အင်္ဂလိပ် ဝေါဟာရတွေဖြစ်ပြီး ငါးပုံတစ်ပုံလောက်က မြန်မာဝေါဟာရဖြစ်ပါတယ်။ မပြောပလောက်တဲ့ ပမာဏကတော့ အခြား ဘာသာစကားတွေ ဖြစ်ပါတယ်။ ဝစ်ရှင်နရီရဲ့ အဓိကရည်ရွယ်ချက်က ကမ္ဘာပေါ်မှာရှိတဲ့ ဘာသာစကားတွေကို ကိုယ့်ရဲ့ Local Language ကို ပြန်ဆိုဖို့ ဖြစ်ပါတယ်။

ဒီမှာ ရှိတဲ့ ဒေတာတွေဟာ Open Content ဖြစ်ပြီး မည်သူမဆို ပြင်ခြင်း၊ ထပ်ထည့်ခြင်း ပြုလုပ်နိုင်ပါတယ်။ XML database dump ကို Download လုပ်ပြီးလည်း ကြိုက်တဲ့နေရာမှာ ယူသုံးနိုင်ပါတယ်။ ကျွန်တော်ကတော့ Wiktionary ကို ဗဟိုထားပြီး Contribute လုပ်ဖို့ အကြံပြုပါတယ်။ Wiktionary ဟာ လက်ရှိမှာ အစုံလင်ဆုံးနဲ့ အလွတ်လပ်ဆုံး မြန်မာ-မြန်မာ-အင်္ဂလိပ် ဒေတာတွေ ဖြစ်ပါတယ်။

Wiktionary ဟာ စာလုံးတွေများနေပြီဖြစ်ပြီး မြန်မာဝေါဟာရတွေဟာ ခိုင်ခိုင်မာမာ အသုံးပြုလို့ရပြီ ဖြစ်ပေမဲ့ အင်္ဂလိပ် ဝေါဟာရ အဓိပ္ပါယ် ဖွင့်ဆိုချက်တွေ၊ Encoding အမှားတွေ၊ အသံထွက်နဲ့ ပြုပြင်စရာ ရှိတာတွေ အများအပြား ရှိတာကြောင့် ပုံမှန်နဲ့ ရေရှည်အကူအညီပေးမယ့် contributor အများအပြား လိုအပ်နေပါတယ်။ ဝစ်ရှင်နရီကို ကူညီဖို့အတွက် အချိန်အများကြီးပေးဖို့၊ ဘာသာရပ်ဆိုင်ရာမှာ တစ်ဘက်ကမ်းခတ် ကျွမ်းကျင်ဖို့ မရှိမဖြစ် မလိုအပ်ပါဘူး။ အောက်ပါနည်းလမ်းများနဲ့ ဝစ်ရှင်နရီကို ကူညီအားဖြည့်နိုင်ပါတယ်။

၁။ IPA  အသံထွက် ပေါင်းထည့်ခြင်း

ရှိပြီးသား မြန်မာစာလုံးတွေအတွက် နိုင်ငံတကာ အသံထွက်သင်္ကေတစံ ဖြစ်တဲ့ အိုင်ပီအေ သင်္ကေတတွေ ပေါင်းထည့်ပေးနိုင်ပါတယ်။ အိုင်ပီအေထည့်ဖို့ ဘာသာဗေဒကျွမ်းကျင်သူ ဖြစ်စရာ မလိုပါ။ မြန်မာ အသံထွက်ရေးနည်းကို ဒီမှာ လေ့လာပြီး ဒီကွန်ဗာတာကို သုံးပြီး အိုင်ပီအေ သင်္ကေတတွေ Generate လုပ်နိုင်ပါတယ်။ ပြီးရင် ဒီပုံစံအတိုင်း အသံထွက်နေရာမှာ တစ်ကြောင်း ဝင်ဖြည့်ပေးနိုင်ပါတယ်။ xxx နေရာမှာ ကိုယ် generate လုပ်ထားတဲ့ အိုင်ပီအေသင်္ကေတကို ဖြည့်ရမှာ ဖြစ်ပါတယ်။

{{IPA|/xxx/}}

၂။ Encoding ပြင်ခြင်း

မြန်မာစာနဲ့ရေးထားတဲ့နေရာတွေမှာ ရရစ်၊ သဝေထိုးစတာတွေ ရှေ့ရောက်နေတာ၊ ဉလေး နဲ့ အက္ခရာဥ စလုံးယပင့်နဲ့ ဈမျဉ်းဆွဲစတာတွေ လွဲနေတာ တွေကို တွေ့ရင် တွေ့သလို ပြင်ပေးနိုင်ပါတယ်။

၃။ စာလုံးပေါင်းပြင်ခြင်း

အွန်လိုင်းကရတဲ့ ဒေတာတွေဟာ ဗြောက်သောက်ဖြစ်နေတာအပြင်၊ ဝစ်ရှင်နရီမှာ အရင်ကထည့်ထားတဲ့ ဒေတာတော်တော်များများမှာ စာလုံးပေါင်းတွေ မှားနေတာ တွေ့ရပါတယ်။ စာလုံးပေါင်းတွေကိုလည်း ကြုံရင်ကြုံသလို ဝင်ပြင်ပေးသွားနိုင်ပါတယ်။ စာလုံးပေါင်း အကိုးအကားအတွက် ဒီနေရာမှာ မြန်မာသတ်ပုံကျမ်းအတိုင်း တင်ပေးထားပါတယ်။

၄။ စာလုံးအသစ် ထပ်ထည့်ခြင်း

မရှိသေးတဲ့ စာလုံးတွေထည့်မယ်ဆိုရင် ရှိပြီးသား ဝေါဟာရတွေရဲ့ အရင်ရေးထားတဲ့ Format တွေကို ကြည့်ပြီး လိုက်တင်နိုင်ပါတယ်။ အကူအညီမှာ ဝင်ကြည့်နိုင်သလို၊ အကူအညီလိုရင်လည်း ဝင်မေးနိုင်ပါတယ်။

၅။ လင့်ထည့်ခြင်း

ဝီကီတွေရဲ့ အားသာချက်ကတော့ ဝီကီအတွင်းမှာရှိတဲ့ ခေါင်းစဉ်တွေကို အလွယ်တကူ လင့် နိုင်တာပါပဲ။ ဆောင်းပါးတစ်ခုကို တည်းဖြတ်နေစဉ် ကိုယ်လင့်ချင်တဲ့ စာသားကို လေးထောင့်ကွင်းနှစ်ထပ် ခတ်ပေးလိုက်ရုံနဲ့ လင့်ဖန်တီးပြီးသား ဖြစ်သွားပါတယ်။ ဥပမာ [[xxx]]။ ဝီကီစာသားတွေကို လိုအပ်မယ်ထင်တဲ့နေရာတွေမှာ လိုက်လင့်ပေးခြင်းအားဖြင့် ဖတ်ရှုရှာဖွေရ လွယ်ကူပြီး ဆောင်းပါးတစ်ခုနဲ့ တစ်ခု ချိတ်ဆက်မှုလည်း ပိုမို အားကောင်းလာမှာ ဖြစ်ပါတယ်။

၆။ လက်တွေ့သုံးခြင်း

Myanmar wiktionary searchbox

ဝစ်ရှင်နရီမှာ လက်တွေ့သုံးခြင်း၊ မိမိရဲ့ အသိမိတ်ဆွေများကို သတင်းစကားဖြန့်ခြင်းနဲ့လည်း ကူညီနိုင်ပါတယ်။ ဝစ်ရှင်နရီဟာ Opensearch enabled ဖြစ်တာကြောင့် ဝစ်ရှင်နရီ Homepage ကိုသွား၊ ဘရောက်ဆာရဲ့ Search box မှာ Wiktionary (my)  ကို ပေါင်းထည့်ခြင်းဖြင့် ဝစ်ရှင်နရီကို အလွယ်တကူ သုံးနိုင်ပါတယ်။

Tags: , , , , , , , , , , ,

· · · ◊ ◊ ◊ · · ·

ဒီရက်ပိုင်းမှာ ဧရာဖောင့်ကို ယူနီကုဒ်အဖြစ် ရည်ညွှန်းပြောဆိုနေကြတာ တွေ့ရလို့ ဧရာဟာ ယူနီကုဒ် မဖြစ်ကြောင်းနဲ့ ဘာလို့မဖြစ်ရတာလဲဆိုတာ အတိုပဲ ရှင်းပါမယ်။ ယူနီကုဒ်ဖြစ်ဖို့ –

၁။ ယူနီကုဒ် ကုဒ်ပွိုင့်နဲ့ ကိုက်ညီရပါမယ်။

၂။ ယူနီကုဒ် စာလုံးစီပုံ (Encoding) နဲ့ ကိုက်ညီရပါမယ်။

 

အပြည်ပြည်ဆိုင်ရာ ယူနီကုဒ်ဇယားမှာ မြန်မာနိုင်ငံအတွင်းမှာရှိတဲ့ ဗမာစာနဲ့ တခြားတိုင်းရင်းသားစာတွေအတွက်လည်း နေရာ ၁၆၀ လောက် ပေးထားပါတယ်။ အဲဒီအက္ခရာတွေကို အပြည်ပြည်ဆိုင်ရာ စံသတ်မှတ်ရေးအဖွဲ့ဖြစ်တဲ့ ISO က စံသတ်မှတ်ပေးပြီး ယူနီကုဒ် ကွန်ဆိုတီယမ် အဖွဲ့ကြီးက လက်တွေ့အသုံးချလို့ရအောင် Encoding စည်းမျဉ်းတွေကို ချမှတ်ပေးပါတယ်။ ချမှတ်ထားတဲ့ စည်းမျဉ်းအသေးစိတ်ကို ဒီမှာ သွားဖတ်နိုင်ပါတယ်။

 

ယူနီကုဒ်စံနဲ့အညီ ဖန်တီးထားတဲ့ ဖောင့်စာရင်းက –

  • Myanmar3
  • Padauk
  • Parabaik
  • WinUniInnwa
  • Masterpiece Uni Sans
  • MyMyanmar
  • Xenotype
  • Yunghkio
  • Tharlon

တို့ ဖြစ်ပြီးတော့ ယူနီကုဒ်စံနဲ့ ပြည့်ပြည့်ဝဝ ကိုက်ညီတယ်၊ သို့မဟုတ် ကိုက်ညီအောင် အတတ်နိုင်ဆုံး ကြိုးစားထားတဲ့ ဖောင့်တွေလို့ ပြောလို့ ရပါတယ်။ ဒီစာရင်းထဲမှာပါတဲ့ ဖောင့်တစ်ခုနဲ့ ရေးထားတဲ့စာတွေကို ကျန်တဲ့ဖောင့်တစ်ခုနဲ့ တိုက်ရိုက်ဖတ်နိုင်ပါတယ်။ Times New Roman နဲ့ ရိုက်ထားတဲ့စာတွေကို Arial ဖောင့်နဲ့ ဖတ်လို့ ရသလိုပါပဲ။ ဖောင့်စာရင်းအသေးစိတ်ကို ဒီမှာ သွားကြည့်နိုင်ပါတယ်။

 

၁။ ယူနီကုဒ် ဖြစ်ဖို့ ကုဒ်ပွိုင့်နဲ့ ကိုက်ညီရမယ်ဆိုတဲ့အချက်မှာ အခုချိန်မှာ လူတော်တော်များများသုံးနေကြတဲ့ ဇော်ဂျီက မကိုက်ညီတော့ပါ။ ဧရာဖောင့်ကတော့ ကိုက်ညီပါတယ်။

၂။ ယူနီကုဒ်ဖြစ်ဖို့ ယူနီကုဒ် Encoding အတိုင်းစီရမယ်ဆိုတဲ့နေရာမှာ ဇော်ဂျီရော ဧရာပါ မကိုက်ညီတော့ပါ။

 

Encoding ဆိုတာကို အတိုချုံးပြီး ပြောရမယ်ဆိုရင် ဗြဟ္မီအနွယ်ဝင် စာတွေကို ယူနီကုဒ် Encoding စီတဲ့အခါ အက္ခရာ ရှေ့နောက်ပြောင်းလဲပုံတွေဟာ ရှုပ်ထွေးလွန်းတာကြောင့် ပုံသေ စည်းမျဉ်းတစ်ခု သတ်မှတ်ပြီး စီရပါတယ်။ ဗျည်း – ဗျည်းတွဲ – သရ ဆိုတဲ့ စီပုံပါပဲ။ ဗမာစာ(မြန်မာစာ) ဟာလည်း ဗြဟ္မီအနွယ်ဝင်ဖြစ်တဲ့အတွက် ယူနီကုဒ်စည်းမျဉ်းကို လိုက်နာပြီး စီရပါတယ်။ မြန်မာစာမှာဆိုရင် “မြဲ” ဆိုတဲ့ စာလုံးကို ယူနီကုဒ်မှာ မ(ဗျည်း) ရရစ်(ဗျည်းတွဲ) နောက်ပစ်(သရ) ဆိုပြီး စီပါတယ်။ “မြေ” ဆိုတဲ့ စာလုံးမှာ မ(ဗျည်း) ရရစ်(ဗျည်းတွဲ) သဝေထိုး(သရ) ဆိုပြီး စီပါတယ်။ အသးစိတ်ကို ဒီမှာ ဖတ်နိုင်ပါတယ်။

ယူနီကုဒ်အစစ်ဟာ စာလုံးပုံ ပြောင်းလဲမှုတွေကို ပြည့်ပြည့်ဝဝမလုပ်နိုင်တဲ့အတွက်ကြောင့် (ဧရာအဖွဲ့ကအဲလိုထင်တဲ့အတွက်ကြောင့်) ဧရာဟာ ယူနီကုဒ်စာလုံးစီပုံကို မလိုက်နာတော့ဘဲ ကိုယ်ပိုင် Encoding ကို ထွင်ရေးပါတယ်။

၁။ အမြင်အတိုင်း စာလုံးစီတာ ဖြစ်တဲ့အတွက်ကြောင့် ဝဏ္ဏတစ်ခုမှာ သဝေထိုးဟာ ဗျည်းထက်အရင် ရှေ့ဆုံးကိုလာပါတယ်။

၂။ ဗျည်းတွဲ ပင့်ရစ်ဆွဲထိုးလေးခုအနက် ရရစ်ကလည်း ဗျည်းရှေ့ကို ရောက်လာပါတယ်။

၃။ ကင်းစီး (ငသတ်အသေး) က ဒုတိယ ဗျည်းနောက်ကို ရောက်သွားပါတယ်။ ဥပမာ သင်္ကေတ ဆိုတဲ့ စာလုံးမှာ ကင်းစီးဟာ သ နဲ့သာ ဆိုင်ပါတယ်။ ဒါပေမဲ့ ဧရာမှာ ကကြီးနောက်မှာမှ ကင်းစီးလာပါတယ်။

သဝေထိုး၊ ရရစ်နဲ့၊ ကင်းစီး သုံးမျိုးသာ ယူနီကုဒ် Encoding နဲ့ ကွဲတဲ့အတွက်ကြောင့် ဧရာဟာ ယူနီကုဒ်နဲ့ သိပ်မကွာပါဘူးလို့ ပြောချင်တဲ့သူ ရှိကောင်းရှိပါမယ်။ ဒါပေမဲ့ ဒီနေရာမှာ Stats နဲ့ ပြောရမယ်ဆိုရင် အဲဒီသုံးမျိုး လွဲနေတဲ့အတွက်ကြောင့် ပျမ်းမျှ ၁၂ ရာနှုန်းသော ဝဏ္ဏတွေ လွဲပါတယ်။ ၇၀ ရာနှုန်းသော ဝေါဟာရတွေ လွဲပါတယ်။ ဒါ့အပြင် ဧရာကနေ ယူနီကုဒ်ပြန်ပြောင်းဖို့ လိုအပ်တဲ့အကူအညီတွေ ကိရိယာတွေ လုံလောက်အောင် ထောက်ပံ့မပေးထားပါ။ ယူနီကုဒ်လို့လည်း တောက်လျှောက် Claim လုပ်ပါတယ်။ ယူနီကုဒ်အစစ်တောင် သူ့လောက်မစစ်ဘူးလို့ ပြောချင်သလိုပါပဲ။

ယူနီကုဒ်စည်းမျဉ်းကို မလိုက်နာပါလျက်နဲ့ ကိုယ့်ဖောင့်ကို ယူနီကုဒ်ရယ်လို့ ကြော်ငြာထားခြင်းဟာ အသုံးပြုသူတွေကို ဇဝေဇဝါနဲ့ စိတ်ရှုပ်ထွေးစေပြီး သတင်းအချက်အလက်မှားတွေ ဖြန့်ဝေရာလည်း ရောက်ပါတယ်။ ဒီတော့ ဒီနေရာမှာ ကျွန်တော်မေတ္တာရပ်ခံချင်တာက –

၁။ ယူနီကုဒ်မဟုတ်ရင် ယူနီကုဒ်ဆိုတဲ့ စာလုံးကို ထည့်မသုံးပါနဲ့။ ဥပမာ – ဇော်ဂျီယူနီကုဒ်၊ ဧရာယူနီကုဒ် စသည် မသုံးပါနဲ့။ သုံးပြီးသား ကိုယ့် ဘလော့ထဲမှာ၊ ပို့(စ်) ထဲမှာ၊ ဆိုက်ဘားထဲမှာ၊ လင့်ထဲမှာ တင်ထားတွေရှိရင် ဖြုတ်ပေးကြပါ။

၂။ Mediawiki, WordPress, Google, Drupal စတဲ့ Localization Projects တွေမှာ ယူနီကုဒ်စံသတ်မှတ်ချက်ကိုသာ သုံးပေးပါ။ ဖေ့(စ်)ဘုတ်မှာ ကိုယ်ပိုင်ဘလော့မှာ ကိုယ်သုံးချင်တဲ့ဖောင့်သုံးတာ ပြဿနာမရှိပါ။ နိုင်ငံတကာပရောဂျက်တွေမှာတော့ သုံးလည်း ကျွန်တော်တို့ ယူနီကုဒ်ဖြစ်အောင် ပြန်ပြောင်းမှာ ဖြစ်ပါတယ်။ မယုံမရှိပါနဲ့။

၃။ ယူနီကုဒ်ဆိုတဲ့ ဝေါဟာရကို ဆက်သုံးဖို့ ဆန္ဒရှိတယ်ဆိုရင် ဧရာဖောင့်တွေကို ယူနီကုဒ်အဆင့်မီအောင် ပြင်ဆင်ပေးကြပါ။

ဒါဟာ အပျော့ပြောင်းဆုံးနဲ့ ကျိုးကြောင်းဆီလျော်မှု အရှိဆုံးဖြစ်အောင် ကြိုးစားထားတဲ့ သတိပေးချက်ဖြစ်ပါတယ်။ ဒီသတိပေးချက်ကို ဆက်လျစ်လျူရှုနေမယ်ဆိုရင်တော့ Unicode Consortium နဲ့ ISO ကို အသိပေးပြီး သင့်တော်သလို ကိုင်တွယ်သွားပါမယ်လို့ ပြောချင်ပါတယ်။ ကျေးဇူးတင်ပါတယ်။

Differences between Ayar encoding and standard Unicode encoding

Differences between Ayar encoding and standard Unicode encoding

——————-

This is the brief English section of this article. Ayar font which claimes itself as Unicode font never follows Unicode encoding standard. It wrongly encodes in u1031, u103c and kinzi(u1004 u103A u1039) which results in 12 percents of syllable mistakes and 70 percents of word mistakes. We, Myanmar Unicode activists, demand Ayar group either to remove “Unicode” usage from all of their websites or to fix all of their fonts to follow Unicode standard.Thanks to all and special thanks to Gerard of Wikimedia Foundation’s Language Committee who encouraged me to write this article.

——————-

မှတ်ချက်။  ။ ဒီနေရာမှာ “ဘာလို့ တစ်ယောက်တစ်ပေါက်ကွဲနေကြတာလဲ၊ စုစုစည်းစည်းဆွေးနွေးကြပါလား၊ နှစ်ယောက်ရှိရင်သုံးဖွဲ့ကွဲတယ်” စတဲ့ ဝေဖန်မှုများ မပြုလုပ်ကြဖို့ ကြိုတင် တားမြစ်ပါတယ်။ ပညာရှင်တွေ စုစည်း ကြိုးစား သတ်မှတ်ခဲ့လို့ ၂၀၀၈ က စပြီး  မြန်မာဘာသာအစုအဝေးကြီးအတွက် ယူနီကုဒ် အတည်ဖြစ်ပြီးသွားပါပြီ။ ဒီမူ မပြည့်စုံဘူး၊ လိုနေတယ်၊ ဘယ်နေရာကတော့ဖြင့် မကျေနပ်ဘူး စတာတွေကို ဒီဆောင်းပါးအောက်မှာတင် ကွန်းမန့် ပေးခဲ့နိုင်ပါတယ်။ သို့မဟုတ် Facebook စာမျက်နှာပေါ်မှာ ဝင်ရေးသွားနိုင်ပါတယ်။ သံသယတွေ ရှိရင် ဝိုင်းရှင်းပေးပါမယ်။ ဒီ စံသတ်မှတ်ချက်ဆိုတာကြီးကို စိတ်တိုင်းကျမဖြစ်ရင် မိမိက ကောင်းတယ်ထင်တဲ့ မူကို သက်သေအထောက်အထား အပြည့်အစုံနဲ့တကွ ယူနီကုဒ် ကွန်ဆိုတီယမ်မှာ တင်ပြပါ။ ကျွန်တော်တို့ကတော့ အတည်ဖြစ်တဲ့ စံကို ဝိုင်းဝန်းထောက်ခံသွားမှာပါပဲ။

Tags: , , , , , , , , , ,

· · · ◊ ◊ ◊ · · ·