Some might wonder why there are little written forms of brief history of Zawgyi and Unicode. It seems that many people just don’t want to dig the past. If that’s the case, I might as well be the villain again digging up the old pasts. If there is any mistake written here, it’s the responsibility of me alone.

Brief

ယူနီကုဒ်လက်ရှိ စွဲစွဲမြဲမြဲသုံးနေသူတွေထဲမှာ ဇော်ဂျီဖောင့် မသုံးဖူးတာ၊ မသုံးတတ်တာ တစ်ယောက်မှမရှိလို့ ပြောရင် ရမယ်။ ယူနီကုဒ်ထက် ဘာပိုကောင်းလဲမေးရင် (၁) ရှေးဦးပိုင်း ယူနီကုဒ်ဖောင့် တချို့ထက် စာလုံးပုံစံ ကြည့်ရတာ ပိုအဆင်ပြေတယ်။ (၂) မြန်မာတွေ ကွန်ပျူတာစသင်ရင် ရင်းနှီးပြီးသားဖြစ်တဲ့ ဝင်းဖောင့်တွေနဲ့ အလားတူ အမြင်အရ စာလုံးစီတာဖြစ်တဲ့အတွက် အရင်လာ အရင်ရိုက် နောက်မှလာ နောက်မှရိုက်စနစ်ဖြစ်တဲ့အတွက် ပိုနားလည်လွယ်တယ်။ (၃) လူသုံးများတယ်။ ဘာပိုမကောင်းလဲမေးရင် (၁) စံ စတန်းဒတ်ကို မလိုက်နာဘဲ တိုင်းရင်းသား အက္ခရာနေရာတွေယူသုံးတဲ့အတွက် တခြားတိုင်းရင်းသားဘာသာတွေ သုံးမရဘူး။ (၂) Apple, Windows, Linux စတဲ့ အဓိက ပလက်ဖောင်းတွေမှာ အသင့်ပါလာပြီးသားဖြစ်တဲ့ စံစနစ်နဲ့ မကိုက်ညီဘူး။ ရှင်းအောင်ပြောရရင် ဇော်ဂျီဖောင့်သွင်းမထားရင်၊ စာသားကို ဇော်ဂျီတိုက်ဖေ့စ်အဖြစ် သတ်မှတ်မထားရင် ဖတ်မရဘူး။ (၃) စာအုပ်စာရင်း၊ လူစာရင်း၊ ဆောင်းပါးစာရင်း အစရှိတာတွေအတွက် မြန်မာလို အက္ခရာ စီမရဘူး။ (၄) ရရစ်ရှစ်မျိုး၊ ရကောက်သုံးမျိုး၊ ဘကုန်းသုံးမျိုး အစရှိသဖြင့် ကုဒ်ပွိုင့်အများကြီး ထပ်နေတဲ့အတွက် ရှာတဲ့နေရာ၊ သတ်ပုံစစ်တဲ့နေရာတွေမှာ အဆင်မပြေဘူး။ (၅) ယူနီကုဒ်ကို အခြေခံသတ်မှတ်ထားတဲ့ ICU စနစ်သုံး OS, ဘရောက်ဇာ တွေမှာ Select မှတ်တာ၊ တွက်ချက်တာတွေ အဆင်မပြေဘူး။ (၆) ဇော်ဂျီမှာ ဇော်ဂျီစာလုံးပုံစံတစ်မျိုးသာ ရှိတယ်။

လက်ရှိကြုံနေတာတော့ နိုင်ငံတကာ စံအတိုင်းသွားနေတဲ့ လူသုံးများတဲ့ဆော့ဝဲတွေ ဝန်ဆောင်မှုတွေကို မြန်မာမှုပြုရာမှာ တွေ့ရတဲ့ ပြဿနာပါ။ ကိုယ်က ယူနီကုဒ်နဲ့ ပြန်ထားတယ်။ နောက်တစ်ယောက်က ဇော်ဂျီနဲ့ လာပြင်သွားတယ်။ ဒါမှမဟုတ် Google Map လိုနေရာမျိုးမှာ ဇော်ဂျီနဲ့လာရေးသွားတယ်။ Approve လုပ်တဲ့ Member တွေက မြန်မာစာမတတ်တော့ ဟုတ်ပြီဆိုပြီး Publish လုပ်ပေးလိုက်တယ်။ ဆာဗာက ပုံဖော်တော့ ပဲပင်ပေါက်လိုစာတွေ ထွက်လာတယ်။ ကိုယ်ကနောက်ပိုင်း တွေ့မိလို့ သွားပြင်တော့ မေးခွန်းထုတ်ခံရတယ်။ သက်သေပြရတယ်။ စောင့်ရတယ်။ တစ်ကြိမ်လည်းမဟုတ်၊ နှစ်ကြိမ်လည်းမဟုတ်၊ ကြာတော့ တစ်ယောက်ချင်း ရှင်းပြနေရတာ စိတ်ကုန်လာတယ်။ ယူနီကုဒ် နဲ့ ဇော်ဂျီ ဘာကွာလဲ မသိတဲ့လူတွေက မြန်မာစာ အွန်လိုင်းသုံးတဲ့သူတွေရဲ့ ၉၀ ရာနှုန်းကျော်ရှိမယ်ထင်တယ်။ တချို့လည်း ကြားဖူးနားဝရှိမယ်။ တချို့လည်း ယူနီကုဒ်စသုံးကြည့်လို့ အပေါင်းအသင်းတွေနဲ့ ဆက်ဆံရတာ အဆင်မပြေတာ၊ ကိုယ့်စာကို လူမဖတ်တော့တာ ရှိလို့ စိတ်ပျက်ပြီး ဇော်ဂျီပြန်သုံးတာရှိမယ်။ ဘာပဲဖြစ်ဖြစ် ဒါဟာ အနှေးနဲ့အမြန် အွန်လိုင်းသုံးတဲ့ မြန်မာတိုင်းလိုလို နဖူးတွေ့ ဒူးတွေ့ ကြုံတွေ့ရတော့မယ့် အရာဖြစ်လို့ ကြိုက်သည်ဖြစ်စေ၊ မုန်းသည်ဖြစ်စေ၊ လွယ်သည်ဖြစ်စေ၊ ခက်သည်ဖြစ်စေ၊ သုံးတတ်အောင် စမ်းကြည့်ထားဖို့ နီးစပ်ရာ အပေါင်းအသင်းတွေကို တိုက်တွန်းပါတယ်။

အခုဆို မြန်မာ၃ နဲ့ ပိတောက် လောက်သာ ယူနီကုဒ်ဖောင့် ရှိတော့တာမဟုတ်ဘဲ Microsoft နဲ့ Apple အပါအဝင် မိမိကိုယ်ပိုင် နည်းပညာအမျိုးမျိုးနဲ့ ချဉ်းကပ်ပုံအမျိုးမျိုးနဲ့ လုပ်ထားတဲ့ ယူနီကုဒ်စနစ်ကို လိုက်နာထားတဲ့ ဖောင့်တွေ ရှိနေပြီဖြစ်လို့ စာလုံးမလှခြင်းဟာ ပြဿနာအကြီးကြီး မဟုတ်တော့ပါဘူး။ စံတစ်ရပ်တည်းကို လိုက်နာထားတဲ့အတွက် ဖောင့်တစ်မျိုးနဲ့ ရေးထားတာကို နောက်ဖောင့်တစ်မျိုးနဲ့ ကြည့်ရင် အမှန်မမြင်ရတဲ့ ပြဿနာလည်း မရှိတော့ပါဘူး။ မြန်မာစာ သင်ပုန်းကြီးရေးသလို ရိုက်လို့ရတဲ့ လက်ကွက်စနစ်(အိုင်တီဇင်က ဆရာ ဦးတင်ညွန့်ပြောတာတော့ စာမရိုက်တတ်တဲ့ ဦးဇင်းတစ်ပါး နာရီဝက်အတွင်း မြန်မာလိုရိုက်တတ်သွားတယ် ပြောတယ်။)၊ ဝင်းဖောင့်လို ရိုက်လို့ရတဲ့စနစ်၊ ဇော်ဂျီလို ရိုက်လို့ရတဲ့ စနစ်၊ Logical အတိုင်း ရိုက်လို့ရတဲ့စနစ်စသည်ဖြင့် အမျိုးမျိုးသော လက်ကွက်တွေ ရှိနေပြီဖြစ်လို့ လက်ကွက်ပြောင်းသွားလို့ ဆိုတဲ့ အခက်အခဲလည်း မရှိတော့ပါဘူး။ ဒါပေမဲ့ အနည်းနဲ့ အများဆိုသလို အဆင်မပြေမှုတွေကတော့ ကျန်နေတုန်းပါပဲ။

There is no Unicode user who can’t use Zawgyi-One. Pros of Zawgyi:
(1) Beautiful and neat fontface.
(2) Visual sequence is easier to understand.
(3) Popular.

Cons:
(1) Non-standard. We can’t use Ethnic languages with Zawgyi.
(2) Not compatible with Burmese standard fonts from Microsoft, Apple and Linux community.
(3) Cannot sort correctly.
(4) Lots of repeated codepoints to save up for non-reshaping such as 8 codepoints for medial Ra.
(5) Not compatible with ICU. Selection and calculation are difficult.
(6) Only one typeface.

We are having problems in localization since many Zawgyi-One users are unaware of usage of Unicode. That makes conflicts in localization and translations in such as Google Maps and Wikipedia. It’s important that every Myanmar online should have knowledge of Unicode whether they practice Unicode or not.

Now, there are many Unicode fonts for Burmese compatible to each other including fonts from OSX Lion and Windows 8. There are many Unicode layouts for different OSes including Zawgyi layout.

History

၁၉၉၅ မှာ Michael Everson က ယူနီကုဒ်မှာ မြန်မာစာ (ဗမာစာ) ပါအောင် စအဆိုပြုတယ်။ ၉၇ နဲ့ ၉၈ မှာ Proposal နဲ့ ပြင်ဆင်ချက်တွေကို သူပဲ တင်သွင်းတယ်။ ၉၉ ကစပြီး မြန်မာ ကိုယ်စားလှယ်အဖွဲ့ပါတယ်။ ၂၀၀၃ မှာ NLP ကို စ ဖွဲ့တယ်။ ၂၀၀၅ မှာ မြန်မာ၁ ဖောင့်ကို စဖြန့်တယ်။ အားနည်းချက်တွေ အများကြီးတွေ့ရတယ်။ လက်တွေ့လုပ်ငန်းခွင် သုံးနိုင်တဲ့ အခြေအနေ မရှိဘူး။ အဲဒီချိန်မှာ Solveware က မြစေတီဖောင့် ထွက်လာတယ်။ Web ပေါ်မှာ ပထမဦးဆုံးသော အဆင်ပြေပြေသုံးလို့ရတဲ့ ဖောင့် ဖြစ်လာတယ်။ အခြေခံအက္ခရာတွေမှာ ယူနီကုဒ်စနစ်ကို လိုက်နာထားပေမဲ့ စာလုံးပုံပြောင်းတဲ့နေရာတွေအတွက် Private use အတွက် ချန်ထားတဲ့ ကုဒ်ပွိုင့်တွေထဲက ယူသုံးတယ်။ ဆိုလိုတာက ယူနီကုဒ်စနစ်နဲ့ အပြည့်အဝ မကိုက်ညီဘူး။ သို့သော် မြန်မာစာကို Web ပေါ်မှာ ဒီလိုသုံးလို့ရပါလားဆိုတာ လူတွေ သိသွားကြတယ်။ တနည်းပြောရရင် ကိုလမ်ဘတ် ကြက်ဥထောင်သလိုပဲ။ ဒီလို အဆင်ပြေပြေသုံးလို့ရပေမဲ့ သုံးစွဲခ ဈေးကြီးတာကြောင့် အခမဲ့ သုံးလို့ရမယ့် နည်းတွေ ရှာကြံလာကြတယ်။ အလွယ်ဆုံးကတော့ မြစေတီဖောင့်ကို ဖောင့် Editor တစ်ခုမှာ စာလုံးပုံပြောင်းထည့်လိုက်တာပါပဲ။ ၂၀၀၅ ဝန်းကျင်မှာ Alpha, Geocomp, MyMyanmar နဲ့ ပြည်ပက Bit ဖောင့်တွေ ထွက်လာတယ်။ ရည်ရွယ်ချက်တွေကတော့ ကောင်းကြပါတယ်။ လက်ရှိအချိန်မှာ မြန်မာစာကို သုံးလို့ရနိုင်တဲ့ပုံစံမျိုးနဲ့ တသမတ်တည်း သုံးနိုင်အောင် ဖြစ်ပါလိမ့်မယ်။ ဒါပေမဲ့ တချို့ဖောင့်တွေမှာ မြစေတီရဲ့ ကုဒ်ပွိုင့်အတိုင်း လိုက်ရေးထားရုံမက ဖောင့်ကိုပါ နင်းပြီး မြန်မာစာပြောင်းထည့်ထားတာ အထဲက Font Info တွေပါ နဂိုအတိုင်း ပြန်ပါလာတယ်။ Solveware က နို့တစ်စ်ထုတ်တယ်။ ဇော်ဂျီ ကုဒ်ပွိုင့်တွေ ပြောင်းရေးတယ်၊ Alpha Font ကနေ Alpha Zawgyi, Zawgyi1, Zawgyi-One စသည်ဖြင့် (နာမည်) တဖြည်းဖြည်း ပြောင်းသွားတယ်။ MyMyanmar က စံအတိုင်းလိုက်နာတဲ့ ယူနီကုဒ်ဖောင့် လုပ်ပြသွားတယ်။ ၂၀၀၆ ဇူလိုင် မှာ ယူနီကုဒ် ၅.၁ စံနဲ့ မြန်မာ၂ ထွက်တယ်။ မြန်မာစာနဲ့ မွန်စာအတွက် လိုအပ်ချက်တွေ အများကြီးရှိနေတဲ့အတွက် Proposal တွေ ထပ်တင်တယ်။ မြန်မာသုံး Model ကို လက်ခံပြီး စံအဖြစ် သတ်မှတ်တဲ့အတွက် ၂၀၀၇ မှာ ယူနီကုဒ် ၅.၂ အတည်ဖြစ်တယ်။ ၂၀၀၇ ဒီဇင်ဘာ ၁၄ မှာ မြန်မာ၃ ကို အများပြည်သူသုံးနိုင်အောင် Publish လုပ်လိုက်တယ်။

ဇော်ဂျီ ၂၀၀၆ ဗားရှင်းကို ၂၀၀၆ ဇူလိုင်မှာ မြန်မာ၂ နဲ့ အပြိုင်ထုတ်တယ်။ ယူနီကုဒ် ၄.၀ သော်လည်းကောင်း၊ ၅.၁ သော်လည်းကောင်း မကိုက်ညီပါ။ စံကို အတည်ပြုချက်မရခင် လက်ဦးမှုရအောင် ထုတ်လိုက်ပုံရတယ်။ Private use area ကို မသုံးဘဲ တိုင်းရင်းသားဘာသာတွေအတွက် ချန်ထားတဲ့ နေရာတွေထဲက ယူသုံးတယ်။ Planet.com.mm မှာ စသုံးတယ်။ အလကားပေးတယ်။ ဖိုရမ်ထဲမှာ လက်ကွက်သွင်းစရာမလိုဘဲ ရိုက်လို့ရအောင်လုပ်ပေးထားတယ်။ ချက်လို့ရတယ်။ မီဒီယာသမားတွေ လုပ်တာဖြစ်တဲ့အတွက် ကြော်ငြာအားကောင်းတယ်။ သုံးရတာအဆင်ပြေတယ်။ တိုတိုပြောရရင် ပေါက်သွားတယ်။ ဖိုရမ်မာတွေ ဘလော့ရေးတော့ ဇော်ဂျီဝမ်းပဲ သုံးကြတယ်။ အချင်းချင်းကူညီကြတယ်။ ဖောင့်ရဲ့ အားနည်းချက်တွေကို ဝိုင်းဝန်းကူညီ ပြင်ဆင်ပေးကြတယ်။ ၂၀၁၀ မြန်မာအွန်လိုင်းအသိုင်းအဝိုင်းမှာ ဖေ့စ်ဘုတ် စ ခေတ်စားတယ်။ ဇော်ဂျီပဲအဓိကသုံးကြတယ်။

Michael Everson proposed codepoints for Burmese in 1995. He proposed again in 1997 and amended in 1998. Myanmar representatives started involving as observers in Unicode consortium in 1999. NLP was founded in 2003. Myanmar1 was published in 2005. It had weaknesses in practical usages. Solveware published Myazedi font in the same year. It was a non-standard font using Private Use codepoints for alternative shapings, yet became the first usable font for web. It was like Columbus’s egg. Many fonts including Zawgyi cloned Myazedi. Solveware published legal notice in local newspaper which force the other fonts to change their codepoints. According to Unicode standard 5.1, Myanmar2 was published in July 2006. Zawgyi-One font was published at the same time. But it didn’t followed neither Unicode 4.0 or Unicode 5.1 standards (probably to compete in publishing date with Myanmar2)and used reserved codepoints for minority languages. There were major updates in Unicode 5.2 and updated font Myanmar3 was published in Dec 14 2007.

Zawgyi-One font was published as freeware and used on popular www.planet.com.mm website in 2006. It became a major hit since the advertising was enormous and most online users are waiting for a usable Burmese font. Bloggers started using Zawgyi-One font and they helped each other. Since then, majority of Burmese online users used Zawgyi-One as primary font and unaware of Unicode standard.

Zawgyi’s Copyright Holder And Recognition

ဇော်ဂျီစာလုံးပုံစံက ASCII ဖောင့်တွေဖြစ်တဲ့ Arthouse ဖောင့်တွေထဲက တစ်ခုဖြစ်တယ်။ ဇော်ဂျီအဖွဲ့ထဲက တစ်ယောက် (လို့ထင်ရသူတစ်ယောက်) က Arthouse ဆီက ဖောင့်နဲ့ဆိုင်တဲ့ အခွင့်အရေး အားလုံး ဝယ်လိုက်တယ် ဆိုပါတယ်။ ခက်တာက ဇော်ဂျီအဖွဲ့ထဲက ပညာရှင်ငါးဦးဆိုတာ ဘယ်သူမှန်း မသိရပါ (သို့မဟုတ် ဝန်မခံပါ)။ MyMyanmar က ထုတ်တဲ့ MyMyanmar ဆော့ဖ်ဝဲမှာ Zawgyi-One/Two/Three စသည်ဖြင့်ပါလာတယ်။ ကွန်ပျူတာဂျာနယ်မှာ Zawgyi-One ကို မိုင်မြန်မာက ဝယ်လိုက်တယ်လို့ ပါလာတယ်။ ဒါပေမဲ့ Arthouse က ကိုဇော်ဝင်းမြတ်နဲ့ အင်တာဗျူးတစ်ခုမှာ Font ပုံစံနဲ့ ပတ်သက်တဲ့ အခွင့်အရေးအားလုံးကို သူသာပိုင်တယ်လို့ ပြောပါတယ်။ ဇော်ဂျီဝမ်းရဲ့ မြန်မာမဟုတ်တဲ့ အက္ခရာတွေမှာတော့ Microsoft ရဲ့ Tahoma ဖောင့်ကို တိုက်ရိုက်ယူသုံးထားပါတယ်။ ယာယီလို့ ပြောပေမဲ့ ခုထိပြင်သေးတာ မတွေ့ပါ။ ၂၀၀၈ Arial ဗားရှင်းမှာ Microsoft ပိုင် Arial ဖောင့်ကို ယူသုံးတယ်။ ၂၀၀၇ မှာ ဇော်ဂျီအဖွဲ့ MCPA Excellence Award ဆုရတယ်။

Zawgyi-One typeface was taken from Arthouse(Mandalay) font package. A member of Zawgyi team unofficially said that they bought all rights of Zawgyi font from font’s designer. One big confusion is that the “five” main founders of Zawgyi font are unknown of (at least did not declared themselves). MyMyanmar software package included Zawgyi-One, Zawgyi-Two and Zawgyi-Three fonts and said it owned Zawgyi font in Computer Journal(Myanmar). Again, Zaw Win Myat of Arthouse said in an interview that he still owned all rights of Zawgyi typeface and he just simply allowed the usage of the font. All other characters of Zawgyi font apart from Burmese codepoints are directly copied from Tahoma font of Microsoft. Zawgyi-Arial version uses Arial font owned by Microsoft too. Zawgyi team won 2007 MCPA Excellence award.

Future Upgrade

ဇော်ဂျီကို ယူနီကုဒ်ဖြစ်အောင် ဇော်ဂျီအဖွဲ့က ပြောင်းပေးမယ့် အချိန်ကို စောင့်နေသူတွေ ရှိတာတွေ့တယ်။ စောင့်မနေပါနဲ့။ ဇော်ဂျီ ကို ဘယ်နည်းနဲ့မှ နဂိုအတိုင်းလည်းဖြစ်အောင် (ဖတ်လို့ရအောင်)၊ ယူနီကုဒ်စနစ်နဲ့လည်း ကိုက်ညီအောင် ပြောင်းလို့မရပါ။ ယူနီကုဒ်ဖောင့်ကို ဇော်ဂျီစာလုံးပုံနဲ့ လိုချင်တယ်ဆိုတော့ ဖြေရှင်းနည်းက လွယ်ပါတယ်။

There are some who waiting for the “right” time when the Zawgyi team would upgrade Zawgyi font to Unicode standard and still compatible with old Zawgyi. But it’s just logically impossible to co-exist since Zawgyi characters and Unicode characters cross-exit. If it’s simply the changing of one of Unicode font’s typeface to Zawgyi typeface, it’s pretty easy.

Ref:

  • http://www.myanmarnlp.org.mm/
  • http://www.unicodeconference.org/
  • http://unicode.org/conference/about-conf.html
  • http://www.zawgyi.net
  • http://www.myanmaritpro.com/
  • http://my.wikipedia.org/wiki/မြန်မာယူနီကုဒ်နေ့ရက်စဉ်သမိုင်း

 

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

Consonant+Medial+Vowel“.

Burmese Unicode sequence

Burmese vowel “e” (​ေ) is up-side-down of English “e” shape and is a dependent vowel. Some people complained why vowel e is behind the consonant in Unicode encoding. I tried to answered that it’s according to logical and linguistic approach for a Brahmi based script and it doesn’t affect on how we type the character sequences. But some really conservative and stubborn people keep saying that it’s not “Myanmar’s Way”. They think that Burmese script was invented by ancient genius Burmese last 2000 years ago. Geez!

Pallava family branches

Pallava family branches

Well, the more the resistant, the more the motivation I get to learn new things. Burmese language was originally based on Mon and Arakan scripts. Mon and Arakan scripts came from Grantha scripts which was a southern family of Brahmi script. Brahmi script was the origin of most of south and west Asian scripts.

As you can see in the image, vowel e was originally just a modifier to the consonant. All the vowels stayed on top of or below the consonants. People changed writing styles in time. Sometimes, when time passed, people started forgetting the origin of certain history. But in internet age, we can research and dig up easily when we couldn’t do it two decades ago.

Brahmi script 3rd century BC

Brahmi script 3rd century BC. The original form of vowel e was very simple, a stick on top left side of consonant.

Vowel E for Indian Languages 2nd century -7th century AD

Vowel E for Indian Languages 2nd century -7th century AD. Vowel e in all branches still maintained top left position.

Arakan Vowel "e" 2nd century - 6th century

Arakan Vowel "e" 2nd century - 6th century AD. The vowel e was clearly still on top and scripts were not very much different from original southern family Grantha

Pyu script 4th century - 6th century AD

Pyu script 4th century - 6th century AD. Vowel e was still near to it's original form.

Pallava - a Pyu equivalent script

Pallava - a Pyu equivalent script. Many of it's original shapes and forms were still maintained.

Pyu script proposal to Unicode

Pyu script proposal to Unicode by an individual. In Brahmi based script Unicode encoding models, all independent vowels stay behind consonant

Myazedi 12th Century AD

Myazedi Inscription 12th Century AD. Finally, vowel e was completely moved in front of consonant.

 

Read more:

  • http://skyknowledge.com/pallava.htm
  • http://anshumanpandey.blogspot.com/2010/08/pyu-ancient-script-of-burma.html
  • http://www.myanmartutorials.com/articles/logical-order-or-non-logical-order/
  • http://en.wikipedia.org/wiki/Grantha_script
  • http://en.wikipedia.org/wiki/Br%C4%81hm%C4%AB_script
  • Arakan Coins by U San Tha Aung, The Buddhist Art of Ancient Arakan by U San Tha Aung.

Tags: , , , , , , , , , , , ,

· · · ◊ ◊ ◊ · · ·