Copyright Converter

29 Mar 2015

သူတပါးကြိုးစားအားထုတ်ထားသည့်အရာကို အသိအမှတ်မပြုသည့်နေရာတွင် နှစ်ယောက်မရှိဟု အပေါင်းအသင်းများက ရှုံ့ချကြသည်။ မှန်လောက်သည်။ Fb တွင် Like ပေးရန်ပင် တွန့်တိုတတ်သူ တစ်ဦးဖြစ်သည်။

I was being condemned for not easily appreciating other people’s efforts. They might be right since I rarely click “Like”s on Fb posts.

မြန်မာယူနီကုဒ်အတွက် js ကွန်ဗာတာ သုံးခုရှိသည်။ ကိုငွေထွန်း၏ ပါရဂူ၊ ကိုစိုးမင်း၏ ဘားဂလစ်ရှ်နှင့် ကိသ်၏ သံလွင်ဆော့ဖ်တို့ ဖြစ်သည်။ အခြားကွန်ဗာတာများသည် ယင်းတို့မှ တိုက်ရိုက် သို့မဟုတ် သက်ဆိုင်ရာ ပရိုဂရမ်းမင်းဘာသာရပ်သို့ ပြန်ဆိုထားကြခြင်း ဖြစ်သည်။ ယူနီကုဒ်နှင့် ဇော်ဂျီအကြား အဆင်ပြေစွာ ပြောင်းလဲနိုင်ဖို့ ကြိုးစားခဲ့ကြခြင်းကို ဤနေရာမှ အသိအမှတ်ပြုသည်။ ဤနှစ်ပိုင်းတွင် သတိပြုမိသည်မှာ ကိုသူရလှိုင်တင်ထားသော ပေတံ ကွန်ဗာတာသစ် ဖြစ်သည်။

There are 3 main js converters for converting to/from Unicode/Zawgyi which are Paragu converter by Ko Ngwe Tun, Burglish converter by Ko Soe Min, Thanlwinsoft converter by Keith. Other converters are just direct or indirect translations to respective languages. I salute their efforts from this blog. The new kid in town in recent years is Paytan Python converter by Thura Hlaing.

မည်သို့ဖြစ်စေ ကော်ပီထားလျှင် ထားကြောင်း ခွင့်တောင်းကြသည်၊ ခရက်ဒစ်ပေးရသည်။ အချို့က မပေးပေ။ အယ်လော်ဂရစ်သမ်ကို မိမိကိုယ်တိုင် ရေးသယောင်ယောင် ဖိန့်ကြသည်။ သို့သော် ယင်းတို့၏ ကုဒ်ဒင်းကို သုံးလေးကြောင်းမျှ စစ်ကြည့်လိုက်လျှင် သိနိုင်သည်။ အကယ်၍ ကွန်ပိုင်းလုပ်ပြီးသားဆိုလျှင် စစ်၍ မရနိုင်တော့ပြီလော။ မဟုတ်ပါ၊ reverse engineering လုပ်၍ဖြစ်စေ၊ အခြားနည်း အချို့ဖြင့်ဖြစ်စေ စစ်ကြည့်နိုင်သည်။ ကွန်ဗာတာတစ်ခုချင်းစီတွင် မိမိတို့ကိုယ်ပိုင် ဝိသေသများ၊ အမှားအယွင်း Bug များ၊ အယ်လော်ဂရစ်သမ်များ ရှိသည်။ ယူသုံးခဲ့လျှင် ခရက်ဒစ်တစ်ကြောင်းပေးလိုက်ခြင်းသည် ပင်ပန်းသော အလုပ်မဟုတ်ပါ။

Regardless of the usage, we need to requests and give credits to original creators. Some just don’t. Some pretend their products to be of their own brainchild. But they can be exposed by checking a few lines of code. And if it’s already been compiled? We can also check by reverse engineering or some complicated methods. Each converter has it’s own uniqueness such as bugs and algorithm. It’s not a big deal to just give a single line of credit.

MM Font Converter Mobile App သည် ပါရဂူအယ်လော်ဂရစ်သမ်ကို (ယဉ်ကျေးအောင်ပြောလျှင်) သုံးကောင်းသုံးထားနိုင်သည် (သို့) သုံးထားရန်ရာနှုန်း ၉၉.၉၉၉% ခန့် ရှိသည်။ မဖြစ်နိုင်သော ၀.၀၀၁ ရာခိုင်နှုန်းမှာ အစအဆုံးအိုင်ဒီယာတူသွားခြင်း ဖြစ်သည်။

To simply put, MM Font Converter is most certainly likely using Paragu’s coding or algorithm.

အခြားသော နည်းလမ်းတို့ကို ချန်၍ အလွယ်နည်းပြောပါမည်။ ရှုပ်ထွေးသော စာတစ်ကြောင်းကို ငါးကြိမ်မျှ ထပ်ခါထပ်ခါ ကွန်ဗတ်လုပ်ကြည့်လိုက်ပါ။ ကွန်ဗာတာတစ်ခုချင်းစီမှ ထွက်လာသော ရလဒ်များ အယ်လော်ဂရစ်သမ် မတူညီသည်နှင့် အမျှ ကွဲပြားစွာ ထွက်လာသည်ကို တွေ့ရမည်။ အငြိမ်မနေနိုင်၍ ဘလော့မှ တဆင့် ပြောမိပါသည်။

I will present you an easy and safe way to check which converter is which. Convert a complex phrase. Copy the result. Convert it again. Repeat 5 times. Results from each converter are similar at first conversion but unquestionably different after fifth conversion. This is my third rant about credits on this blog.

#Updates 31/03/2015

  • MM Font Converter developer Myat Min Soe decleared he created all function by himself in this fb post.
  • He later said that he took Zg->Uni function from Paytan converter but wrote Uni->Zg function by himself in this post. He also declear Paytan is GNU/GPL one of Open Source licenses, so he can use freely. The case here is when someone is using under GNU/GPL license, he must deliver his derivative work under same license along with proper credits. For that, I haven’t found the source code of his app anywhere yet (The source code for a version popped up this morning in this link http://www.myatminsoe.com/ifyouvisitthisyouaremyson). Beside, he “copyrighted” the app in “About” page.
  • And he said again he “forgot” to credit Paytan but not others in this post.
  • And then he claimed again that he wrote the first two versions on his own and the last version was using Paytan in this fb post. He has no explanation for his “own” versions which I used as test-app and I don’t see any major differences in conversion results between versions.

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

Some might wonder why there are little written forms of brief history of Zawgyi and Unicode. It seems that many people just don’t want to dig the past. If that’s the case, I might as well be the villain again digging up the old pasts. If there is any mistake written here, it’s the responsibility of me alone.

Brief

ယူနီကုဒ်လက်ရှိ စွဲစွဲမြဲမြဲသုံးနေသူတွေထဲမှာ ဇော်ဂျီဖောင့် မသုံးဖူးတာ၊ မသုံးတတ်တာ တစ်ယောက်မှမရှိလို့ ပြောရင် ရမယ်။ ယူနီကုဒ်ထက် ဘာပိုကောင်းလဲမေးရင် (၁) ရှေးဦးပိုင်း ယူနီကုဒ်ဖောင့် တချို့ထက် စာလုံးပုံစံ ကြည့်ရတာ ပိုအဆင်ပြေတယ်။ (၂) မြန်မာတွေ ကွန်ပျူတာစသင်ရင် ရင်းနှီးပြီးသားဖြစ်တဲ့ ဝင်းဖောင့်တွေနဲ့ အလားတူ အမြင်အရ စာလုံးစီတာဖြစ်တဲ့အတွက် အရင်လာ အရင်ရိုက် နောက်မှလာ နောက်မှရိုက်စနစ်ဖြစ်တဲ့အတွက် ပိုနားလည်လွယ်တယ်။ (၃) လူသုံးများတယ်။ ဘာပိုမကောင်းလဲမေးရင် (၁) စံ စတန်းဒတ်ကို မလိုက်နာဘဲ တိုင်းရင်းသား အက္ခရာနေရာတွေယူသုံးတဲ့အတွက် တခြားတိုင်းရင်းသားဘာသာတွေ သုံးမရဘူး။ (၂) Apple, Windows, Linux စတဲ့ အဓိက ပလက်ဖောင်းတွေမှာ အသင့်ပါလာပြီးသားဖြစ်တဲ့ စံစနစ်နဲ့ မကိုက်ညီဘူး။ ရှင်းအောင်ပြောရရင် ဇော်ဂျီဖောင့်သွင်းမထားရင်၊ စာသားကို ဇော်ဂျီတိုက်ဖေ့စ်အဖြစ် သတ်မှတ်မထားရင် ဖတ်မရဘူး။ (၃) စာအုပ်စာရင်း၊ လူစာရင်း၊ ဆောင်းပါးစာရင်း အစရှိတာတွေအတွက် မြန်မာလို အက္ခရာ စီမရဘူး။ (၄) ရရစ်ရှစ်မျိုး၊ ရကောက်သုံးမျိုး၊ ဘကုန်းသုံးမျိုး အစရှိသဖြင့် ကုဒ်ပွိုင့်အများကြီး ထပ်နေတဲ့အတွက် ရှာတဲ့နေရာ၊ သတ်ပုံစစ်တဲ့နေရာတွေမှာ အဆင်မပြေဘူး။ (၅) ယူနီကုဒ်ကို အခြေခံသတ်မှတ်ထားတဲ့ ICU စနစ်သုံး OS, ဘရောက်ဇာ တွေမှာ Select မှတ်တာ၊ တွက်ချက်တာတွေ အဆင်မပြေဘူး။ (၆) ဇော်ဂျီမှာ ဇော်ဂျီစာလုံးပုံစံတစ်မျိုးသာ ရှိတယ်။

လက်ရှိကြုံနေတာတော့ နိုင်ငံတကာ စံအတိုင်းသွားနေတဲ့ လူသုံးများတဲ့ဆော့ဝဲတွေ ဝန်ဆောင်မှုတွေကို မြန်မာမှုပြုရာမှာ တွေ့ရတဲ့ ပြဿနာပါ။ ကိုယ်က ယူနီကုဒ်နဲ့ ပြန်ထားတယ်။ နောက်တစ်ယောက်က ဇော်ဂျီနဲ့ လာပြင်သွားတယ်။ ဒါမှမဟုတ် Google Map လိုနေရာမျိုးမှာ ဇော်ဂျီနဲ့လာရေးသွားတယ်။ Approve လုပ်တဲ့ Member တွေက မြန်မာစာမတတ်တော့ ဟုတ်ပြီဆိုပြီး Publish လုပ်ပေးလိုက်တယ်။ ဆာဗာက ပုံဖော်တော့ ပဲပင်ပေါက်လိုစာတွေ ထွက်လာတယ်။ ကိုယ်ကနောက်ပိုင်း တွေ့မိလို့ သွားပြင်တော့ မေးခွန်းထုတ်ခံရတယ်။ သက်သေပြရတယ်။ စောင့်ရတယ်။ တစ်ကြိမ်လည်းမဟုတ်၊ နှစ်ကြိမ်လည်းမဟုတ်၊ ကြာတော့ တစ်ယောက်ချင်း ရှင်းပြနေရတာ စိတ်ကုန်လာတယ်။ ယူနီကုဒ် နဲ့ ဇော်ဂျီ ဘာကွာလဲ မသိတဲ့လူတွေက မြန်မာစာ အွန်လိုင်းသုံးတဲ့သူတွေရဲ့ ၉၀ ရာနှုန်းကျော်ရှိမယ်ထင်တယ်။ တချို့လည်း ကြားဖူးနားဝရှိမယ်။ တချို့လည်း ယူနီကုဒ်စသုံးကြည့်လို့ အပေါင်းအသင်းတွေနဲ့ ဆက်ဆံရတာ အဆင်မပြေတာ၊ ကိုယ့်စာကို လူမဖတ်တော့တာ ရှိလို့ စိတ်ပျက်ပြီး ဇော်ဂျီပြန်သုံးတာရှိမယ်။ ဘာပဲဖြစ်ဖြစ် ဒါဟာ အနှေးနဲ့အမြန် အွန်လိုင်းသုံးတဲ့ မြန်မာတိုင်းလိုလို နဖူးတွေ့ ဒူးတွေ့ ကြုံတွေ့ရတော့မယ့် အရာဖြစ်လို့ ကြိုက်သည်ဖြစ်စေ၊ မုန်းသည်ဖြစ်စေ၊ လွယ်သည်ဖြစ်စေ၊ ခက်သည်ဖြစ်စေ၊ သုံးတတ်အောင် စမ်းကြည့်ထားဖို့ နီးစပ်ရာ အပေါင်းအသင်းတွေကို တိုက်တွန်းပါတယ်။

အခုဆို မြန်မာ၃ နဲ့ ပိတောက် လောက်သာ ယူနီကုဒ်ဖောင့် ရှိတော့တာမဟုတ်ဘဲ Microsoft နဲ့ Apple အပါအဝင် မိမိကိုယ်ပိုင် နည်းပညာအမျိုးမျိုးနဲ့ ချဉ်းကပ်ပုံအမျိုးမျိုးနဲ့ လုပ်ထားတဲ့ ယူနီကုဒ်စနစ်ကို လိုက်နာထားတဲ့ ဖောင့်တွေ ရှိနေပြီဖြစ်လို့ စာလုံးမလှခြင်းဟာ ပြဿနာအကြီးကြီး မဟုတ်တော့ပါဘူး။ စံတစ်ရပ်တည်းကို လိုက်နာထားတဲ့အတွက် ဖောင့်တစ်မျိုးနဲ့ ရေးထားတာကို နောက်ဖောင့်တစ်မျိုးနဲ့ ကြည့်ရင် အမှန်မမြင်ရတဲ့ ပြဿနာလည်း မရှိတော့ပါဘူး။ မြန်မာစာ သင်ပုန်းကြီးရေးသလို ရိုက်လို့ရတဲ့ လက်ကွက်စနစ်(အိုင်တီဇင်က ဆရာ ဦးတင်ညွန့်ပြောတာတော့ စာမရိုက်တတ်တဲ့ ဦးဇင်းတစ်ပါး နာရီဝက်အတွင်း မြန်မာလိုရိုက်တတ်သွားတယ် ပြောတယ်။)၊ ဝင်းဖောင့်လို ရိုက်လို့ရတဲ့စနစ်၊ ဇော်ဂျီလို ရိုက်လို့ရတဲ့ စနစ်၊ Logical အတိုင်း ရိုက်လို့ရတဲ့စနစ်စသည်ဖြင့် အမျိုးမျိုးသော လက်ကွက်တွေ ရှိနေပြီဖြစ်လို့ လက်ကွက်ပြောင်းသွားလို့ ဆိုတဲ့ အခက်အခဲလည်း မရှိတော့ပါဘူး။ ဒါပေမဲ့ အနည်းနဲ့ အများဆိုသလို အဆင်မပြေမှုတွေကတော့ ကျန်နေတုန်းပါပဲ။

There is no Unicode user who can’t use Zawgyi-One. Pros of Zawgyi:
(1) Beautiful and neat fontface.
(2) Visual sequence is easier to understand.
(3) Popular.

Cons:
(1) Non-standard. We can’t use Ethnic languages with Zawgyi.
(2) Not compatible with Burmese standard fonts from Microsoft, Apple and Linux community.
(3) Cannot sort correctly.
(4) Lots of repeated codepoints to save up for non-reshaping such as 8 codepoints for medial Ra.
(5) Not compatible with ICU. Selection and calculation are difficult.
(6) Only one typeface.

We are having problems in localization since many Zawgyi-One users are unaware of usage of Unicode. That makes conflicts in localization and translations in such as Google Maps and Wikipedia. It’s important that every Myanmar online should have knowledge of Unicode whether they practice Unicode or not.

Now, there are many Unicode fonts for Burmese compatible to each other including fonts from OSX Lion and Windows 8. There are many Unicode layouts for different OSes including Zawgyi layout.

History

၁၉၉၅ မှာ Michael Everson က ယူနီကုဒ်မှာ မြန်မာစာ (ဗမာစာ) ပါအောင် စအဆိုပြုတယ်။ ၉၇ နဲ့ ၉၈ မှာ Proposal နဲ့ ပြင်ဆင်ချက်တွေကို သူပဲ တင်သွင်းတယ်။ ၉၉ ကစပြီး မြန်မာ ကိုယ်စားလှယ်အဖွဲ့ပါတယ်။ ၂၀၀၃ မှာ NLP ကို စ ဖွဲ့တယ်။ ၂၀၀၅ မှာ မြန်မာ၁ ဖောင့်ကို စဖြန့်တယ်။ အားနည်းချက်တွေ အများကြီးတွေ့ရတယ်။ လက်တွေ့လုပ်ငန်းခွင် သုံးနိုင်တဲ့ အခြေအနေ မရှိဘူး။ အဲဒီချိန်မှာ Solveware က မြစေတီဖောင့် ထွက်လာတယ်။ Web ပေါ်မှာ ပထမဦးဆုံးသော အဆင်ပြေပြေသုံးလို့ရတဲ့ ဖောင့် ဖြစ်လာတယ်။ အခြေခံအက္ခရာတွေမှာ ယူနီကုဒ်စနစ်ကို လိုက်နာထားပေမဲ့ စာလုံးပုံပြောင်းတဲ့နေရာတွေအတွက် Private use အတွက် ချန်ထားတဲ့ ကုဒ်ပွိုင့်တွေထဲက ယူသုံးတယ်။ ဆိုလိုတာက ယူနီကုဒ်စနစ်နဲ့ အပြည့်အဝ မကိုက်ညီဘူး။ သို့သော် မြန်မာစာကို Web ပေါ်မှာ ဒီလိုသုံးလို့ရပါလားဆိုတာ လူတွေ သိသွားကြတယ်။ တနည်းပြောရရင် ကိုလမ်ဘတ် ကြက်ဥထောင်သလိုပဲ။ ဒီလို အဆင်ပြေပြေသုံးလို့ရပေမဲ့ သုံးစွဲခ ဈေးကြီးတာကြောင့် အခမဲ့ သုံးလို့ရမယ့် နည်းတွေ ရှာကြံလာကြတယ်။ အလွယ်ဆုံးကတော့ မြစေတီဖောင့်ကို ဖောင့် Editor တစ်ခုမှာ စာလုံးပုံပြောင်းထည့်လိုက်တာပါပဲ။ ၂၀၀၅ ဝန်းကျင်မှာ Alpha, Geocomp, MyMyanmar နဲ့ ပြည်ပက Bit ဖောင့်တွေ ထွက်လာတယ်။ ရည်ရွယ်ချက်တွေကတော့ ကောင်းကြပါတယ်။ လက်ရှိအချိန်မှာ မြန်မာစာကို သုံးလို့ရနိုင်တဲ့ပုံစံမျိုးနဲ့ တသမတ်တည်း သုံးနိုင်အောင် ဖြစ်ပါလိမ့်မယ်။ ဒါပေမဲ့ တချို့ဖောင့်တွေမှာ မြစေတီရဲ့ ကုဒ်ပွိုင့်အတိုင်း လိုက်ရေးထားရုံမက ဖောင့်ကိုပါ နင်းပြီး မြန်မာစာပြောင်းထည့်ထားတာ အထဲက Font Info တွေပါ နဂိုအတိုင်း ပြန်ပါလာတယ်။ Solveware က နို့တစ်စ်ထုတ်တယ်။ ဇော်ဂျီ ကုဒ်ပွိုင့်တွေ ပြောင်းရေးတယ်၊ Alpha Font ကနေ Alpha Zawgyi, Zawgyi1, Zawgyi-One စသည်ဖြင့် (နာမည်) တဖြည်းဖြည်း ပြောင်းသွားတယ်။ MyMyanmar က စံအတိုင်းလိုက်နာတဲ့ ယူနီကုဒ်ဖောင့် လုပ်ပြသွားတယ်။ ၂၀၀၆ ဇူလိုင် မှာ ယူနီကုဒ် ၅.၁ စံနဲ့ မြန်မာ၂ ထွက်တယ်။ မြန်မာစာနဲ့ မွန်စာအတွက် လိုအပ်ချက်တွေ အများကြီးရှိနေတဲ့အတွက် Proposal တွေ ထပ်တင်တယ်။ မြန်မာသုံး Model ကို လက်ခံပြီး စံအဖြစ် သတ်မှတ်တဲ့အတွက် ၂၀၀၇ မှာ ယူနီကုဒ် ၅.၂ အတည်ဖြစ်တယ်။ ၂၀၀၇ ဒီဇင်ဘာ ၁၄ မှာ မြန်မာ၃ ကို အများပြည်သူသုံးနိုင်အောင် Publish လုပ်လိုက်တယ်။

ဇော်ဂျီ ၂၀၀၆ ဗားရှင်းကို ၂၀၀၆ ဇူလိုင်မှာ မြန်မာ၂ နဲ့ အပြိုင်ထုတ်တယ်။ ယူနီကုဒ် ၄.၀ သော်လည်းကောင်း၊ ၅.၁ သော်လည်းကောင်း မကိုက်ညီပါ။ စံကို အတည်ပြုချက်မရခင် လက်ဦးမှုရအောင် ထုတ်လိုက်ပုံရတယ်။ Private use area ကို မသုံးဘဲ တိုင်းရင်းသားဘာသာတွေအတွက် ချန်ထားတဲ့ နေရာတွေထဲက ယူသုံးတယ်။ Planet.com.mm မှာ စသုံးတယ်။ အလကားပေးတယ်။ ဖိုရမ်ထဲမှာ လက်ကွက်သွင်းစရာမလိုဘဲ ရိုက်လို့ရအောင်လုပ်ပေးထားတယ်။ ချက်လို့ရတယ်။ မီဒီယာသမားတွေ လုပ်တာဖြစ်တဲ့အတွက် ကြော်ငြာအားကောင်းတယ်။ သုံးရတာအဆင်ပြေတယ်။ တိုတိုပြောရရင် ပေါက်သွားတယ်။ ဖိုရမ်မာတွေ ဘလော့ရေးတော့ ဇော်ဂျီဝမ်းပဲ သုံးကြတယ်။ အချင်းချင်းကူညီကြတယ်။ ဖောင့်ရဲ့ အားနည်းချက်တွေကို ဝိုင်းဝန်းကူညီ ပြင်ဆင်ပေးကြတယ်။ ၂၀၁၀ မြန်မာအွန်လိုင်းအသိုင်းအဝိုင်းမှာ ဖေ့စ်ဘုတ် စ ခေတ်စားတယ်။ ဇော်ဂျီပဲအဓိကသုံးကြတယ်။

Michael Everson proposed codepoints for Burmese in 1995. He proposed again in 1997 and amended in 1998. Myanmar representatives started involving as observers in Unicode consortium in 1999. NLP was founded in 2003. Myanmar1 was published in 2005. It had weaknesses in practical usages. Solveware published Myazedi font in the same year. It was a non-standard font using Private Use codepoints for alternative shapings, yet became the first usable font for web. It was like Columbus’s egg. Many fonts including Zawgyi cloned Myazedi. Solveware published legal notice in local newspaper which force the other fonts to change their codepoints. According to Unicode standard 5.1, Myanmar2 was published in July 2006. Zawgyi-One font was published at the same time. But it didn’t followed neither Unicode 4.0 or Unicode 5.1 standards (probably to compete in publishing date with Myanmar2)and used reserved codepoints for minority languages. There were major updates in Unicode 5.2 and updated font Myanmar3 was published in Dec 14 2007.

Zawgyi-One font was published as freeware and used on popular www.planet.com.mm website in 2006. It became a major hit since the advertising was enormous and most online users are waiting for a usable Burmese font. Bloggers started using Zawgyi-One font and they helped each other. Since then, majority of Burmese online users used Zawgyi-One as primary font and unaware of Unicode standard.

Zawgyi’s Copyright Holder And Recognition

ဇော်ဂျီစာလုံးပုံစံက ASCII ဖောင့်တွေဖြစ်တဲ့ Arthouse ဖောင့်တွေထဲက တစ်ခုဖြစ်တယ်။ ဇော်ဂျီအဖွဲ့ထဲက တစ်ယောက် (လို့ထင်ရသူတစ်ယောက်) က Arthouse ဆီက ဖောင့်နဲ့ဆိုင်တဲ့ အခွင့်အရေး အားလုံး ဝယ်လိုက်တယ် ဆိုပါတယ်။ ခက်တာက ဇော်ဂျီအဖွဲ့ထဲက ပညာရှင်ငါးဦးဆိုတာ ဘယ်သူမှန်း မသိရပါ (သို့မဟုတ် ဝန်မခံပါ)။ MyMyanmar က ထုတ်တဲ့ MyMyanmar ဆော့ဖ်ဝဲမှာ Zawgyi-One/Two/Three စသည်ဖြင့်ပါလာတယ်။ ကွန်ပျူတာဂျာနယ်မှာ Zawgyi-One ကို မိုင်မြန်မာက ဝယ်လိုက်တယ်လို့ ပါလာတယ်။ ဒါပေမဲ့ Arthouse က ကိုဇော်ဝင်းမြတ်နဲ့ အင်တာဗျူးတစ်ခုမှာ Font ပုံစံနဲ့ ပတ်သက်တဲ့ အခွင့်အရေးအားလုံးကို သူသာပိုင်တယ်လို့ ပြောပါတယ်။ ဇော်ဂျီဝမ်းရဲ့ မြန်မာမဟုတ်တဲ့ အက္ခရာတွေမှာတော့ Microsoft ရဲ့ Tahoma ဖောင့်ကို တိုက်ရိုက်ယူသုံးထားပါတယ်။ ယာယီလို့ ပြောပေမဲ့ ခုထိပြင်သေးတာ မတွေ့ပါ။ ၂၀၀၈ Arial ဗားရှင်းမှာ Microsoft ပိုင် Arial ဖောင့်ကို ယူသုံးတယ်။ ၂၀၀၇ မှာ ဇော်ဂျီအဖွဲ့ MCPA Excellence Award ဆုရတယ်။

Zawgyi-One typeface was taken from Arthouse(Mandalay) font package. A member of Zawgyi team unofficially said that they bought all rights of Zawgyi font from font’s designer. One big confusion is that the “five” main founders of Zawgyi font are unknown of (at least did not declared themselves). MyMyanmar software package included Zawgyi-One, Zawgyi-Two and Zawgyi-Three fonts and said it owned Zawgyi font in Computer Journal(Myanmar). Again, Zaw Win Myat of Arthouse said in an interview that he still owned all rights of Zawgyi typeface and he just simply allowed the usage of the font. All other characters of Zawgyi font apart from Burmese codepoints are directly copied from Tahoma font of Microsoft. Zawgyi-Arial version uses Arial font owned by Microsoft too. Zawgyi team won 2007 MCPA Excellence award.

Future Upgrade

ဇော်ဂျီကို ယူနီကုဒ်ဖြစ်အောင် ဇော်ဂျီအဖွဲ့က ပြောင်းပေးမယ့် အချိန်ကို စောင့်နေသူတွေ ရှိတာတွေ့တယ်။ စောင့်မနေပါနဲ့။ ဇော်ဂျီ ကို ဘယ်နည်းနဲ့မှ နဂိုအတိုင်းလည်းဖြစ်အောင် (ဖတ်လို့ရအောင်)၊ ယူနီကုဒ်စနစ်နဲ့လည်း ကိုက်ညီအောင် ပြောင်းလို့မရပါ။ ယူနီကုဒ်ဖောင့်ကို ဇော်ဂျီစာလုံးပုံနဲ့ လိုချင်တယ်ဆိုတော့ ဖြေရှင်းနည်းက လွယ်ပါတယ်။

There are some who waiting for the “right” time when the Zawgyi team would upgrade Zawgyi font to Unicode standard and still compatible with old Zawgyi. But it’s just logically impossible to co-exist since Zawgyi characters and Unicode characters cross-exit. If it’s simply the changing of one of Unicode font’s typeface to Zawgyi typeface, it’s pretty easy.

Ref:

  • http://www.myanmarnlp.org.mm/
  • http://www.unicodeconference.org/
  • http://unicode.org/conference/about-conf.html
  • http://www.zawgyi.net
  • http://www.myanmaritpro.com/
  • http://my.wikipedia.org/wiki/မြန်မာယူနီကုဒ်နေ့ရက်စဉ်သမိုင်း

 

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

In summary, as of 2011, Myanmar Unicode fonts can correctly render in;

  • Windows (Opentype on Uniscribe)
  • OSX (Opentype on AAT) with Myanmar font built-in
  • Linux distros (Opentype, Graphite on Pango,Harfbuzz) with Myanmar font built-in or Repository available
  • iOS (Opentype on AAT).

We have a few more updates now.

(1) Nook is Android based tablet and it seems to be able to render Myanmar Unicode correctly. နွတ်(ခ်) မှာ မြန်မာယူနီကုဒ်ဖောင့် အမှန်ပေါ်ပါပြီ။
(2) Android itself started supporting Myanmar Unicode 5.0 in it’s IcecreamSandwich Android 4.0. The reshaping rules are based on Pango and are inside the system (not in the font). The most visible changes are virama u1039 and vowel e u1031. အန်းဒရွိုက် ၄.၀ မှာ မြန်မာယူနီကုဒ် ၅.၀ စာလုံးပုံဖော်တဲ့ စနစ်ပါလာပါပြီ။ ယူနီကုဒ်က ၅.၁ နောက်ပိုင်းမှာမှ ပုံသေဖြစ်တဲ့အတွက် အမှန်မပေါ်သေးပါဘူး။

Android 4.0 Myanmar Unicode Support

Android 4.0 ICS Myanmar Unicode Support. Zawgyi texts will not show correctly anymore.

(3) Windows 8 consumer preview came out a few days ago. It has improved Myanmar font (supports Burmese and Mon) and Myanmar font fallback for IE. So, it’s confirmed that Windows 8 will support Myanmar Unicode font and Keyboard in PC, mobile or tablets when it comes out. ဝင်းဒိုး ၈ စားသုံးသူအတွက် နမူနာမှာ အရင်တစ်ခါထက် ပိုမှန်လာတဲ့ မြန်မာယူနီကုဒ် ပါလာတဲ့အတွက် တကယ်ထုတ်ရင် ပါလာမှာ သေချာပါပြီ။

Shifted Unicode Keyboard on Windows8 Consumer preview

Shifted Unicode Keyboard on Windows 8 Consumer Preview (Based on Myanmar3 Layout by Myanmar NLP)

#P.S. Myanmar Wikipedia has more than 10,000 articles now.

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

A New Page or Is It?

15 Sep 2011

So, this is my turn to test the infamous Windows8 developer preview. I felt it was quite unattractive until I found out about Myanmar Language support in it. Mg Pyone said there was a Myanmar font in Win8 and I knew it was Unicode once I saw character points and dotted circle. It has all the character for Myanmar and ethnic character points.

Install startup had Myanmar input method but not inside the system

Install startup had Myanmar input method but not inside the system.

The install startup has Myanmar keyboard in it’s option, and strangely not in the system. I guess it’s because it’s still the dev preview. You need to choose it while installing to be able to use later. The switch for Burmese and English layout is the familiar Ctrl+Shift shortcut.

This is the font - Myanmar Text

This is the font - Myanmar Text (name is lame.. hummm?)

For the die-hard Zawgyi fans, you need to look no further. Just delete this font and install Zawgyi. Ta da… Win8 is all yours.

The font family is “Myanmar Text”, quite boring name for Microsoft. But it does the work. Most of the programs recognize it as fallback font while IE doesn’t. (Well you can set manually though.)

My Website seems ok

My Website seems ok.

It seems like existing Unicode fonts are usable but a few of them have a few errors

It seems like existing Unicode fonts are usable but a few of them have a few errors.

After installing firefox, the viewing of Burmese seems fine. Well, yes, it has a lot of mistakes and positioning errors. What the hell, they can be fixed once we submit the detailed bug report. The thing is that “Microsoft supports Burmese”. Windows 8 intends for not only desktop platform but also for the tablet and mobiles. So anything related with Windows 8 will come with Burmese support.

Some characters in Myanmar text's positioning are not consistent

Some characters in Myanmar text's positioning are not consistent

Funny thing is that some people used to say that they don’t use Unicode standard because Windows doesn’t support Unicode. The fact is that only Burmese Unicode fonts developed by Burmese people is the most bug-free of all time while OS vendors release Burmese fonts with full of bugs upon not fully understanding of the language. Please keep in mind that latest Unicode model for Myanmar is 200% based on Myanmar3 font. Myanmar3 was made as a proposal model to Unicode consortium. So any Unicode font developer has full responsibility to follow Myanmar3 encoding or so we call the Unicode standard.

Sorting just fine

Sorting is just fine.

Sorting is just fine but not everywhere. Calculation is also fine in command prompt. But all Burmese texts are shown as question marks. Yes, any characters other than ASCII is shown as question mark in cmd. So, basically, Windows supports ICU for Burmese which enable Burmese texts to be calculable. So it’s supposed to be most likely fine in spreadsheet applications too. (#Note: Sorting is not using ICU engine, Ko Ngwe Tun pointed out in below comment and I agreed.)

Myanmar Keyboard  in Windows 8

There is a Myanmar Keyboard hidden in Windows 8 dev preview which is mostly in Myanmar3 input layout. It needs to be typed in sequential order though.

So I see Windows 8 as a new page for Myanmar Unicode revolution which is even bigger than OSX Lion supporting Burmese considering Windows has majority of userbase. But, hell no, I don’t believe people will change using Unicode any time soon. Most users are still not that smart or ready to accept the change yet I dare say. It’s not the main point that you are able type Unicode texts, but the most important thing is to have the guts to use Unicode no matter what against all odds of people around you not practicing standard. At least, as some of my friends say, “No more square boxes”.

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

Failed Stories

02 Sep 2011

(1) Failed Unicode

ဒီနှစ် ၂၀၁၁ ကို ယူနီကုဒ်နှစ်အဖြစ်သတ်မှတ်ပြီး အားကြိုးမာန်တက်လုပ်ကြမယ်လို့ ယူနီကုဒ် Developer တွေနဲ့ Contributor တွေ ၂၀၁၀ နှစ်ကုန်ပိုင်းမှာ အကြံပြုကြပါတယ်။ အဲဒီအချိန်က MITP မှာ လတ်တလော တာဝန်ယူနေတဲ့ Admin တစ်ယောက်နဲ့ ပြဿနာဖြစ်လို့ MITP ကထွက်ထားတဲ့ အချိန်ဖြစ်ပါတယ်။ အကြောင်းရင်းက တချို့က ယူနီကုဒ်နဲ့ ရေးချင်တယ်၊ MITP က ယူနီကုဒ်ကို ထောက်ခံတယ်ပြောပေမဲ့ Zawgyi-One, Zawgyi1 ကို Default လုပ်ထားလို့ အလွယ်ရေးမရတဲ့ အတွက် ကျွန်တော်က Post တစ်ခုရေးပြီး ဘာမြန်မာဖောင့်ကိုမှ Default လုပ်မထားဘဲ ထားလိုက်ရင် ကြိုက်တဲ့လူက ကြိုက်တဲ့ဖောင့်နဲ့ရေးလို့ဖတ်လို့ရမယ်လို့ အကြံပြုပါတယ်။ ယူနီကုဒ်နဲ့ရေးချင်ရင် ကိုယ့်ဆိုက်ကိုယ်ထောင်ပြီးရေးလို့ အက်ဒမင်ကပြောလို့ အကျယ်ကျယ် မဖြစ်ချင်လို့ အဲဒီက ထွက်ခဲ့ပါတယ်။ နောက်ပိုင်း MITP မှာ ယူနီကုဒ်နဲ့ပတ်သက်ပြီး မေးတာတွေကို ဖြေသူမရှိတဲ့အတွက် မျက်နှာပြောင်ပြောင်နဲ့ပဲ အကောင့်ပြန်ဝင်ပြီး ဖြေခဲ့ပါတယ်။

အခုနောက်ပိုင်းမှာ တွေ့လာတာက ယူနီကုဒ်ဆိုရင် စံအဖြစ်သတ်မှတ်ထားတဲ့ ကွန်ပျူတာသုံး မြန်မာစာရယ်လို့ မမြင်နိုင်တော့ဘဲ ယူနီကုဒ်ရယ်၊ စံရယ် စကားတစ်ခုခုကိုပြောလိုက်တာနဲ့ တီဆားတို့သလို ဖြစ်သွားနေတာကို တွေ့ပါတယ်။ ကိုယ်ကလည်း မသိတဲ့လူတွေ့ရင် အလိုက်မသိ ပညာပေးချင်နေတာဆိုတော့ တောက်ညင့်ကတ်ခံရပေါင်းလည်း များပြီ။ အမှတ်မရှိ ကိုယ့်ကိုမမေးပေမဲ့ စံအရေးမကြီးကြောင်း ပြောနေတဲ့ နေရာတစ်ခုမှာ သွားကွန်းမန့်ပေးမိပါတယ်။ ချက်ချင်းပဲ ဖောင့်အကြောင်းရောက်သွားပြီး ယူနီကုဒ်က ဘာလို့ ဇော်ဂျီအရင် မထွက်တာလဲ၊ ဘာလို့ ယူနီကုဒ်တွေ အများကြီးဖြစ်နေတာလဲဆိုတာကို “သောက်” တပ်ပြီး ပြောလာတာကြောင့် ဝမ်းနည်းစွာနဲ့ပဲ တစ်စုံတစ်ခုကို သတိပြုလိုက်မိပါတယ်။ ယူနီကုဒ်မအောင်မြင်ပါ။ ယူနီကုဒ်ဟာ မြန်မာတွေအတွက် ကောင်းလွန်းနေပါတယ်၊ စနစ်ကျလွန်းနေပါတယ်။ ဗြဲလရမ်းရေးတတ်တဲ့ စာလုံးပေါင်းမမှန်တဲ့ လူတွေနဲ့ ဘယ်လိုမှ မကိုက်ပါဘူး။ “ယူနီကုဒ်သမား” “အဲဒီအုပ်စု” ဆိုတဲ့ အမြင်ရှိနေတာလည်း စိတ်မကောင်းစွာ တွေ့လိုက်ရပါတယ်။ လက်ရှိယူနီကုဒ်သုံးနေသူ ယူဇာတွေအနေနဲ့လည်း ဒီ”ယူနီကုဒ်သမား”တွေကို အမြင်မကြည်မှုတွေ ရှိနေပြီး အချိန်မရွေး မသုံးတော့မယ့် အနေအထားမှာ ရှိပါတယ်။

အားလုံးက ခုချိန်မှာ ယူနီကုဒ်ကို တပြေးညီ စနစ်တကျသုံးရင် နောက်လေးငါးဆယ်နှစ်အတွင်းမှာ အသားကျသွားပြီး မြန်မာစာဆိုတာ ဒီလိုပါလား ဆိုတဲ့ ရလဒ်တစ်ခုနဲ့ နောင်လာနောက်သားတွေအတွက် တည်ငြိမ်တဲ့ စနစ်တစ်ခု ဖန်တီးနိုင်မှာ သိပါတယ်။ အဲလို မဟုတ်ဘူးဆိုရင် ခုလာမယ့် Windows8 မှာ Unicode ထည့်ပေးလည်း ဖောင့်ပြင်သုံးကြမယ်၊ Patches တွေလုပ်ပြီး ပါလာတဲ့ ယူနီကုဒ်ဖောင့် ပျက်သွားအောင်လုပ်မယ်ဆိုတာ မြေကြီးလက်ခတ်မလွဲ သိပါတယ်။ ဒါက နည်းနည်း ရှေ့ရောက်နေတဲ့ အိုင်တီသမားတိုင်းပါဝင်လာရင် ဖြစ်နိုင်မှာပါ။ သို့သော်…။ မဖြစ်နိုင်တော့ပါ။ ဒီလိုပဲ ကိုယ်ကြိုက်တဲ့ဖောင့်ကိုယ်သုံးပြီး ရှေ့လျှောက်လည်း တရွတ်ဆွဲသွားနေဦးမယ်ဆိုတာ မြင်ပါတယ်။

(2) Failed Burmese

သတ်ပုံမှားတယ်ဆိုတာ အွန်လိုင်းမှာ ဆိုက်တိုင်းလိုလို ဘလော့တိုင်းလိုလို ဖြစ်နေတဲ့ ထမင်းစားရေသောက် ကိစ္စဖြစ်နေပါပြီ။ သတ်ပုံမမှားအောင် ဂရုစိုက်ပြီးရေးတဲ့ဆိုက်ဆိုတာ လက်ချိုးရေလို့ ရပါတယ်။ သတ်ပုံမှားလေ၊ နောက်ကြည့်တဲ့လူက လိုက်မှားလေဆိုတော့ မြန်မာအွန်လိုင်းလောကကြီးတစ်ခုလုံးဟာ သတ်ပုံအမှားတွေနဲ့ ပြည့်နေတယ်လို့ ပြောရင် လွန်မယ်မထင်ပါဘူး။ သတ်ပုံမှာလည်း စံရှိပါတယ်။ စံကိုလိုက်နာတာ ကိုယ့်စာပေ ကိုယ့်ဘာသာကို မြှင့်တင်ရာရောက်သလို ကိုယ့်စာကိုဖတ်မယ့် နောင်လာနောက်သားတွေအတွက် သာဓကပြုစရာ အမှန်တစ်ရပ်ကို ချန်ခဲ့တယ်ဆိုတာ သတိပြုမိသူ နည်းမယ်ထင်ပါတယ်။ သတ်ပုံအမှန်အမှားဆိုတာ မိမိရဲ့ စာပေရေချိန်နဲ့ ဆိုင်ပါတယ်။ သတ်ပုံမှန်တဲ့ စာတွေကို များများဖတ်တဲ့လူဟာ မသိစိတ်မှာ အဲဒီစာလုံးပေါင်းတွေကို ရင်းနှီးပြီးဖြစ်တဲ့အတွက် သတ်ပုံအလိုလို မှန်လာပါတော့တယ်။ ထို့နည်းတူစွာ စာပေရေချိန်နည်းတဲ့လူတွေအတွက် အွန်လိုင်းကဖတ်တဲ့စာတွေဟာ စိတ်ထဲမှာ စွဲပြီး ရေးတိုင်းရေးတိုင်း စာလုံးပေါင်းအမှားတွေ ဖြစ်လာပါတော့တယ်။ အထူးသဖြင့် အွန်လိုင်းမှာ Active ဖြစ်တယ်ဆိုတာ အိုင်တီသမားတွေများပါတယ်။ အိုင်တီသမားအများစု သတ်ပုံဂရုမစိုက်ကြဘူး၊ သတ်ပုံဂရုစိုက်ခြင်းဟာ မြန်မာစာကို ထိန်းသိမ်းခြင်းဖြစ်တယ်လို့လည်း ခံယူထားပုံမပေါ်ပါဘူး လို့ပြောရင် မှန်မယ်ထင်တယ်။ ဒီမိုကရေစီရဖို့ လူတိုင်းမှာ တာဝန်ရှိတယ်လို့ခံယူရင် မြန်မာစာ အရှည်တည်တံ့ဖို့ သတ်ပုံလေးတော့ မှန်အောင်ရေးဖို့လိုတယ်ဆိုတဲ့ ခံယူချက်တော့ အများစုမှာ မရှိကြပါ။ အင်္ဂလိပ်လိုသာ မှန်အောင်ကြိုးစားရေးကြပေမဲ့ မြန်မာစာကိုတော့ အဲလိုခံယူချက် ရှိတာနည်းပါတယ်။

မြန်မာစာကို မြတ်နိုးတဲ့ လူတစ်စုပေါင်းပြီး သတ်ပုံအမှန်ပြင်ပေးရေး ကော်မတီဆိုပြီး ဖွဲ့ထားကြပါတယ်။ ပထမတော့ တွေ့ရာနေရာမှာကွန်းမန့်ပေးပြီး လိုက်ပြင်ကြပေမဲ့ အမြင်ကတ်ခံရတာ များလာတာ​ေကြာင့် သူများကို အမှန်ပြင်ခြင်း လျှော့လိုက်ကြပါတယ်။ တလောက မြန်မာကျူတိုရီရယ်မှာ ကိုသီဟက သတ်ပုံအမှားတွေ့ရင်လည်း ပြင်ပေးပါဗျာဆိုလို့ ဝမ်းသာအားရနဲ့ ပြင်ပေးကြပါတယ်။ ဟုတ်ပါတယ်၊ ဒီလို လူဖတ်များတဲ့ ဆိုက်တစ်ခုက စပြင်လို့ တဖြည်းဖြည်းနဲ့ လူတွေကို သတ်ပုံမှန်လာအောင် ဆွဲဆောင်နိုင်မယ်လို့ ယုံကြည်မိတာကိုး။ အမှန်ပြင်တယ်ဆိုရာမှာလည်း အမှားနဲ့ အမှန်ကို တွဲပြပြီး ကွန်းမန့်ပေးတာကို နှစ်သက်ပါတယ်။ အဲဒါက မြင်လွယ်ပြီး စိတ်ထဲကို ဒိုင်းကနဲ့ ရောက်သွားစေတဲ့အတွက် ဖြစ်ပါတယ်။ အဲဒီအချိန်မှာ ဘာသာရပ်နဲ့မဆိုင်ဘဲ သတ်ပုံလာပြင်တာ မကြိုက်ဘူး၊ မှားလည်းအရေးမကြီး ဖတ်သူနားလည်ရင်ပြီးတာပဲဆိုတဲ့ အပေါက်မျိုး အပြောခံလိုက်ရပါတယ်။ အဲဒီစိတ်ဓာတ်ကို မကြိုက်ပါ။ ဗမာစာသည် တို့စာရယ်လို့ဖြစ်အောင် အင်္ဂလိပ်လက်အောက်မှာ ပြန်တူးဆွ ထိန်းသိမ်းခဲ့ရတာ နှစ်တစ်ရာ မပြည့်သေးပါ။ ဒီလိုစိတ်ဓာတ်တွေက မြန်မာစာ ပျောက်သွားအောင်၊ ပျက်သွားအောင် တွန်းချနေတယ်လို့ ခံစားရပါတယ်။ ကျွန်တော်သွားကြည့်တော့ ကွန်းမန့်ပိတ်သွားပါပြီ။ ဒါကြောင့် FB မှာ Status တင်ပါတယ်။ ကိုယ်ပြောတဲ့ အပေါက်က အချိုးမပြေတော့ ပြဿနာမီးထွန်းရှာသလို ဖြစ်ပါတယ်။

အဲဒီကစ အကျယ်အကျယ်မငြိမ်းဖွယ်တွေဖြစ်ပြီး ညောင်မြစ်တူးလို့ ပုတ်သင်ဥပေါ်တဲ့ ကိစ္စတွေ ဖြစ်ကုန်ပါတယ်။ ဘာမဆိုင်ညာမဆိုင် ယူနီကုဒ်လည်း ပတ်ရမ်းခံလိုက်ရသလို “ယူနီကုဒ်အဖွဲ့” ဆိုတဲ့ အမြင်က ယူနီကုဒ်သုံးသူယူဇာတွေ ကြားထဲမှာရှိတာလည်း တွေ့လိုက်ရပါတယ်။ ဒီဆိုက်အကြောင်းပြောချင်ရင် ဒီဆိုက်မှာ Contribute လုပ်မှပြောဆိုတဲ့ အမြင်ရယ်၊ သတ်ပုံပြင်ခြင်းသည် သိပ်အရေးမကြီး ဆိုတဲ့အမြင်ရယ်၊ စံတစ်ခုသတ်မှတ်သုံးစွဲစရာမလိုကြောင်းဆိုတဲ့ အမြင်တွေရယ် တွေ့လိုက်ရတော့ ကျွန်တော်တို့ပြောပြောနေတဲ့ စံဆိုတာရယ်၊ မြန်မာစာကို တန်ဖိုးထားဖို့ရယ်ဆိုတာတွေက ပြောသာပြော၊ ဒီဘက်နားကဝင် ဟိုဘက်နားကထွက်သွားပါလားလို့ သိလိုက်ရပါတယ်။ သူတပါးနားဝင်အောင် မပြောတတ် မပြောနိုင်၊ ပြောတိုင်းလည်း ဆရာကြီးလေသံတွေဖြစ်ဖြစ်နေတတ်တဲ့ ကိုယ့်ရဲ့ ရေးပုံရေးပေါက်ကိုပဲ အပြစ်တင်မိပါတော့တယ်။

(3) Failed Credit

ဘာသာစကားမှာ ရင်းမြစ်ဒေတာတွေက အရေးကြီးတယ်၊ နည်းပညာက နောက်မှလာတယ်ဆိုတာ ဘာသာဗေဒကို လုပ်နေသူတိုင်းသိပါတယ်။ အခု အွန်လိုင်းမှာ ခေတ်စားနေတာ အဘိဓာန်ပါ။ ဟိုလူအဘိဓာန်လုပ်တယ်၊ ဒီလူအဘိဓာန်လုပ်တယ်နဲ့လည်း တွေ့တွေ့နေရတာပါ။ ကောင်းတဲ့စိတ်ကို အခြေခံကြပြီးလုပ်တာဖြစ်ပေမဲ့ Credit ပေးဖို့ကိစ္စကိုတော့ သိပ်အရေးထားကြတာ မတွေ့ပါဘူး။ အခုအွန်လိုင်းမှာ အများဆုံး ယူသုံးနေတာက Ornagai ရယ် Saing dict က ဒေတာတွေဖြစ်ပါတယ်။ အဲဒီက ဒေတာတွေ ဘယ်ကရလဲ ဆိုတာ အသေးစိတ် Credit ထားဖို့တော့ မေ့နေလို့ပဲဖြစ်ဖြစ်၊ မအားကြလို့ပဲဖြစ်ဖြစ် ဖြစ်ပါလိမ့်မယ်။ Ant ပုရွက်ဆိတ်ဆိုတာ လူတိုင်းက ဒီလိုပဲ ပြန်မှာပါပဲ။ ဒါပေမဲ့ ဒီထက်ပိုတဲ့ ဖွင့်ဆိုချက်တွေ ရှိလာမယ်ဆိုရင် အဘိဓာန်တစ်ခုနဲ့ တစ်ခု ကွဲသွားမှာပါ။ အဘိဓာန်ပြုစုတယ်ဆိုတာ ဆယ်စုနှစ်နဲ့ ချီပြီး ကြာတဲ့ ကိစ္စပါ။ ကိုယ်က ပြန်ကူးယူပြီးဖြန့်တယ်ဆိုရင် ကိုယ်လက်ညောင်းပေမဲ့ မူရင်းပြုစုသူတွေ အဆပေါင်းများစွာ ပင်ပန်းခဲ့တယ်ဆိုတာ သတိရဖို့ပါ။

အစက မပါတဲ့ စာလုံးတွေလည်း နောက်ပိုင်းကိုယ့်ဟာကိုယ်စဉ်းစားပြီး ထပ်ဖြည့်ရင်း ကြာတော့ ဘယ်သူဘာလုပ်ခဲ့တယ်ဆိုတာ အမှတ်အသား မရှိတော့ပါ။ မူရင်း သာလွန်လား၊ မြန်မာနိုင်ငံ အင်္ဂလိပ်စာအဖွဲ့လား စကားလုံးတစ်လုံးချင်းမှာ Ref လုပ်ဖို့ လိုတာ အမှန်ပဲ။ အကျဉ်းချုပ်မဟုတ်တဲ့ အဘိဓာန်တွေမှာ ရှုပ်ထွေးတဲ့စာလုံးတွေ၊ တခြားက ကိုးကားယူရတဲ့ စာလုံးတွေဆိုရင် အောက်မှာ footnote နဲ့ Ref တွေ ထည့်ပေးကြပါတယ်။ ကိုးကားအစုံကတော့ အဘိဓာန်နောက်ဆုံးမှာ အမြဲပါပါတယ်။ အစက ref တပ်တာကို မလုပ်ခဲ့ရင်တောင် နောက်ပိုင်းမှာ field တစ်ခုအနေနဲ့ တပ်သွားဖို့ အကြံပြုချင်ပါတယ်။ လောလောဆယ်တော့ သောင်းချီသိန်းချီနေတဲ့ Data တွေနဲ့ မဖြစ်နိုင်တော့ဘူး ထင်ပါတယ်။ ဒီအတွေးတွေးမိတာကလည်း အခုရက်ပိုင်း VOA သတင်းမှာ မြင်လိုက်တဲ့ Gtalk ပါဠိ-မြန်မာ-အင်္ဂလိပ် အဘိဓာန်ဆိုတာမှာ ဦးဟုတ်စိန်နာမည်တစ်လုံး မတွေ့မိလို့ ဖြစ်ပါတယ်။

Conclusion

Prediction လုပ်တာ ဝါသနာပါလို့ ပြောချင်ပါတယ်။ ဒီစာရေးတဲ့အချိန်ကစလို့ နောက်ဆယ်နှစ်အတွင်း ၁။ မြန်မာပြည်ဒီမိုကရေစီ(အစစ်အမှန်)ရဖို့လည်းမမြင်၊ ၂။ ယူနီကုဒ်ကို လူကြိုက်များလာဖို့လည်းမမြင်၊ ၃။ မြန်မာစာစာလုံးပေါင်းလည်း ပိုမှန်လာဖို့လည်းမမြင်မိ။ ဒီယူနီကုဒ်ကိစ္စ၊ သတ်ပုံကိစ္စ၊ ဝီကီကိစ္စတွေလုပ်နေတယ်ဆိုတာလည်း မြန်မာစာကို ချစ်တဲ့စိတ်တစ်ခုနဲ့ လုပ်နေတာပါ။ အချိန်အရမ်းကုန်ပါတယ်။ အချိန်ကုန်သလောက် ရလာတဲ့ Feedback နဲ့ အမြင်တွေကလည်း အားရစရာ မကောင်းပါ။ ဒီတော့ ဒီကိစ္စတွေ (ကျွန်တော့်အနေနဲ့) မအောင်မြင်ဘူးလို့ ဝမ်းနည်းစွာနဲ့ပဲ ကိုယ့်ဟာကိုယ် သုံးသပ်ပါတယ်။ မြန်မာဝီကီမှာ အားကြိုးမာန်တက် တစ်ကိုယ်တော် ကြဲခဲ့တဲ့ ကိုဟင်္သာ ဘာလို့ထွက်သွားသလဲဆိုတာ ရိပ်ခနဲ မြင်လိုက်သလို ရှိပါတယ်။ ယူနီကုဒ်ကိစ္စကို လက်ရှိ Developer တွေအနေနဲ့ ဆက်လုပ်ကြပါလိမ့်မယ်။ ကျွန်တော့်အနေနဲ့ စိတ်ပါရင် ပါသလို တိုးတိုးတိတ်တိတ်နဲ့ ဒီဘလော့လေးမှာ ရေးသွားပါဦးမယ်။ ယူနီကုဒ်နဲ့ သတ်ပုံကိစ္စကိုတော့ အမြင်ကတ်ခံ လူမုန်းခံပြီး ဘယ်နေရာမှာမှ သွားရောက်ပြောကြား ကွန်းမန့်ထားတော့မှာ မဟုတ်တော့ပါ။ ဒါပါပဲ။

Tags: , ,

· · · ◊ ◊ ◊ · · ·

Tall Tales

09 Aug 2011

    * ယူနီကုဒ်သည် ဖောင့် ဖြစ်သည်။     * ယူနီကုဒ်သည် ဖောင့်အများကြီးထဲမှ တစ်ခုဖြစ်သည်။     * ယူနီကုဒ်သည် မြန်မာ၃ ဖောင့် ဖြစ်သည်။     * ယူနီကုဒ်သမားဆိုသည်မှာ ယူနီကုဒ်ဖောင့်လုပ်သူများဖြစ်သည်။     * ယူနီကုဒ်သုံးရတာ ဇော်ဂျီထက် ခက်သည်။     * ယူနီကုဒ် Install လုပ်ရတာ ခက်သည်။     * ယူနီကုဒ်ရိုက်ရတာ ခက်သည်။     * ယူနီကုဒ်နှင့်ပတ်သက်သော လိုင်စင်ကို ငွေထွန်းပိုင်သည်။     * ယူနီကုဒ်နှင့်ပတ်သက်သော လိုင်စင်ကို မြန်မာ NLP ပိုင်သည်။     * ယူနီကုဒ်ကို မြန်မာ NLP မှ တီထွင်သည်။     * မြန်မာယူနီကုဒ်သည် အစိုးရပိုင် ပရောဂျက်ဖြစ်သည်။     * မြန်မာယူနီကုဒ်သည် မြန်မာများအတွက်သာ ဖြစ်သည်။     * ယူနီကုဒ်သည် သုံးရန်အဆင်သင့်မဖြစ်သေး၊ ပြင်ရဦးမည်။     * ယူနီကုဒ်သမားများ မြန်မာစာ ကောင်းကောင်းမတတ်ကြ၊ အဘယ်ကြောင့် ရရစ်ကို ဗျည်းနောက်က ရိုက်ရသနည်း။     * ယူနီကုဒ်အကြောင်းကို မိမိဘာသာ လေ့လာမရနိုင်။ ကိုယ်ဖိရင်ဖိ စောင်မကြည့်ရှု လေ့လာသင်ကြားပေးသူ ရှိမှသာလျှင် ယူနီကုဒ်အကြောင်း နားလည်နိုင်သည်။     * ယူနီကုဒ်သုံးနေသူ End Users များသည် ယူနီကုဒ်သမားများ၏ နားလှည့်ပါးရိုက် လှည့်ပတ်မှုကို မလည်မဝယ် ခံထားရခြင်းဖြစ်သည်။     * Sorting စီခြင်းသည် ဘာမှအသုံးမဝင်။     * စံဆိုသည်မှာ စာရွက်ပေါ်ကအရာဖြစ်သည်။ မလိုက်နာလည်း အရေးမကြီး။ လတ်တလောအဆင်ပြေဖို့ ပိုအရေးကြီးသည်။     * ဗမာစာသည် တို့စာဖြစ်သည်။ တိုင်းရင်းသားစာများမြင်ချင်လျှင် ကိုယ့်ဖောင့်ကိုယ်ထွင်သုံးကြ။     * ယူနီကုဒ်ကို ဇော်ဂျီနောက်မှ ထွင်ခြင်းဖြစ်သည်။     * ဇော်ဂျီသည် Opensource ဖြစ်သည်။     * ယူနီကုဒ်သမားများ ယူနီကုဒ်ပရောဂျက်များဖြင့် Proposal များတင်ပြီး ဒေါ်လာများ မချိမဆန့် စားကြသည်။     * ယူနီကုဒ်မကောင်းကြောင်းကို ကိုယ့် Wall ပေါ်မှာ ကိုယ်အော်ခြင်းသည် ဒီမိုကရေစီဖြစ်သည်။ မိမိအပေါင်းအသင်းများ၏ ဝရုန်းသုန်းကား Like လုပ်မှုကို မဟားဒယား ခံရနိုင်သည်။ လူမလာသော၊ ယူနီကုဒ် အကြောင်း Feedback ပေးနိုင်သော၊ Developer များရှိသော ဆိုက်များတွင် သွားရောက်ဝေဖန်ရန် မလို။     * ဤစာရေးသူသည် ဘယ်သူဘာဖောင့်သုံးသုံး သောက်ဂရုမစိုက်။ ထို့နည်းတူ မိမိဘာလုပ်လုပ် အများက သောက်ဂရုစိုက်မည်ဟုလည်း မထင်။ ထို့ကြောင့် ဤစာကို ဤနေရာတွင်ရေးသည်။      ပုံ/ အပြိန်းတကာ့ထိပ်ခေါင်လူပြိန်းနောင်

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

Windows အတွက် Uniscribe ဆိုတဲ့ Shaping Engine ရှိတယ်။ ဒါပေမဲ့ သူက မြန်မာစာအတွက် Support လုပ်ပေးမထားဘူး။ ဒါကြောင့် လက်ရှိမြန်မာစာအတွက် သုံးလို့မရရအောင် Microsoft Volt သုံးပြီး တခြား Opentype Rule တွေနဲ့ Shaping Rule တွေကို အဆင်ပြေသလို တီထွင်ကြံဆပြီး သုံးထားရတာ။ ဂျပန်က နှစ်ထပ်ကားတွေကို မြန်မာပြည်ရောက်တော့ အမိုးဖြတ်၊ တံခါးပေါက် ဘယ်ညာပြောင်းတပ်ပြီး သုံးရတဲ့သဘောပေါ့။ Windows က မြန်မာစာအတွက် Uniscribe မှာ Support ပေးရင် အဲလို Hack စရာမလိုတော့ဘဲ အလွယ်သုံးနိုင်မယ်။ Shaping အတွက်သုံးရတဲ့ CPU usage လည်း သိသိသာသာ လျော့သွားမယ်။ မြန်မာ၂၊ ၃၊ ပုရပိုဒ်၊ ပိတောက်၊ ယွန်းချို၊ မိုင်မြန်မာ နဲ့ ဝင်းယူနီကုဒ်ဖောင့်တွေ Uniscribe သုံးတယ်။

 

Uniscribe Font တွေကို လင်းနက်မှာ ပန်ဂိုးက ဘာသာပြန်ပြီး Shaping ပြန်လုပ်တယ်။ ဆိုလိုတာက လင်းနက်မှာ Shaping က Windows မှာထက်တောင် နှေးနိုင်တယ်၊ သူက နှစ်ဆ အလုပ်လုပ်ရတာကိုး။ ဒါပေမဲ့ Pango မှာ Graphite အတွက် အပြည့်အဝ ထောက်ပံ့ပေးထားတယ်။ Padauk ဖောင့်က Uniscribe နဲ့ Graphite နှစ်ခုလုံး Apply လုပ်ထားတဲ့အတွက် Pango က Graphite ကို ဦးစားပေးပြီး Shaping လုပ်တဲ့အတွက် Padauk သုံးရတာ ပိုပေါ့ပြီး မြန်တယ်။ Masterpiece Uni Sans ကတော့ Pango ကို တိုက်ရိုက်သုံးတဲ့အတွက် အပေါ့ဆုံးနဲ့ အမြန်ဆုံး ဖြစ်မယ်။ Linux မှာ တိုင်းရင်းသားစာတွေ ဖတ်ဖို့လိုရင် Padauk ကိုသုံးပြီး၊ မလိုရင် Masterpiece Uni Sans ကိုသုံးဖို့ Recommend လုပ်ပါတယ်။ MyMyanmar လည်း Graphite သုံးတယ်ထင်တယ်။ Pango က Graphite ကို Support လုပ်ပေမဲ့ Shaping rule တွေက ဖောင့်ထဲမှာပဲ ရှိတယ်။ Masterpiece သွင်းလိုက်လို့ ပိတောက် အလုပ်မလုပ်ဘူးဆိုတာ မဖြစ်နိုင်ဘူးထင်တယ်။ သေချာစမ်းကြည့်ရဦးမယ်။

 

သံလွင်ဖောင့်ကတော့ 1mb လောက်ရှိတဲ့အတွက် ဖောင့်ဆိုဒ်အကြီးဆုံးဖြစ်မယ်။ Opentype နဲ့ Graphite ရဲ့ Ligature ပြောင်းတဲ့ Rule တစ်ခုပဲသုံးထားလို့ CPU Usage အနည်းဆုံးဖောင့် ဖြစ်မယ်။ Windows မှာရော Linux ရဲ့ Harfbuzz နဲ့ Pango Module တွေမှာပါ အလုပ်လုပ်တယ်။ Windows နဲ့ OSX က Adobe Software တွေမှာ အသုံးပြုလို့ရတဲ့ တစ်ခုတည်းသော ဖောင့် ဖြစ်မယ်။ (Character Toolbox က English default ဖြစ်နေတာကို Off ပေးဖို့တော့ လိုပါတယ်။) Adobe က အခြေခံ Opentype Rule တွေကို နားလည်ပေမဲ့ Complex Shaping မှာ Uniscribe နဲ့ အလုပ်မလုပ်ဘူး။  Adobe က သူ့ကိုယ်ပိုင် အင်ဂျင်နဲ့ အလုပ်လုပ်တယ်။ AFDKO နဲ့ ရေးထားတဲ့ ဖောင့်တွေမှ အပြည့်အဝ Support လုပ်တယ်။

 

Mac ရဲ့ Native က AAT ၊ သူက Graphite နဲ့ အလုပ်လုပ်ပုံချင်းတူတယ်။ Masterpiece Uni Sans က အရှေ့တောင်အာရှ ဘာသာစကားတွေမှာ ကိုယ့်အားကိုယ်ကိုး Develop လုပ်ပြီး ပထမဆုံး AAT သုံးနိုင်တဲ့ Opensource Mac Font ဖြစ်မယ်။ သူ့ရှေ့မှာ စီးပွားဖြစ်ဖောင့်တွေဖြစ်တဲ့ Xenotype နဲ့ MyMyanmar နှစ်ခုရှိတယ်။ တိုတိုပြောရရင် မြန်မာစာကို Linux ကလွဲပြီး ဘယ် OS ကမှ Support မလုပ်ပေးသော်ငြား အပတ်တကုပ်နဲ့ အားထုတ်ခဲ့တဲ့ ပညာရှင်တွေကြောင့် မြန်မာယူနီကုဒ်ဖောင့်တွေ ဒီလောက်ထိ အဆင့် မြင့်မြင့် သုံးနေနိုင်တာလို့ ပြောရမယ်။

 

ဒီဖောင့်က မပေါ်ဘူးဆိုရင် ဘယ်နေရာမှာ ဘယ်လိုမပေါ်တာ၊ အလုပ်မလုပ်ဘူးဆိုရင် ဘယ် OS ရဲ့ ဘယ် Software မှာ အလုပ်မလုပ်တာ၊ ဘယ်လို ဘယ်လိုရိုက်လိုက်လို့ မမှန်တာ ဘယ်နေရာမှာ မမှန်တာ စသည်ဖြင့် အသေးစိတ် Bug Report တွေကို Screenshot နဲ့တကွ အကြောင်းကြားပေးရင် Font Developer တွေ Troubleshoot လုပ်ရတာ ပိုအဆင်ပြေမှာ ဖြစ်ပါတယ်။ ကျေးဇူးတင်ပါတယ်။

 

View Unicode font list here.

Download Myanmar unique syllable list here.

Myanmar unique syllable list ဖိုင်ထဲမှာ ပါတဲ့ ဝဏ္ဏ၊ ဝဏ္ဏတွဲ အကုန်လုံးနဲ့ အမှန်အတိုင်းမြင်ရတယ်ဆိုရင် အဲဒီဖောင့် ၁၀၀ ရာခိုင်နှုန်း အလုပ်လုပ်တယ်လို့ အကြမ်းဖျင်း ပြောလို့ ရပါတယ်။

Tags: , , , , , , , ,

· · · ◊ ◊ ◊ · · ·