A Myanmar language loving man asked some of us, the Unicode activists, why encoding sequence of Myanmar Unicode is not the same as Burmese script. So I tried to type a long letter (for a slow typer like me) and explained as much with my tiny wit.

##

အန်ကယ်ခင်ဗျား

အလုပ်မအားလို့ ခုမှ စာပြန်ဖြစ်ပါတယ်။ အဓိက သဝေထိုး ကိစ္စပဲ ပြောမှာပါ။ အာရပ်၊ ဟိန္ဒူ၊ မြန်မာ၊ နဲ့ အခြားသော အရှေ့တောင် အာရှစာများဟာ ဗြာဟ္မီ အနွယ်ဝင် စာများ ဖြစ်ပြီး ဗျည်းနဲ့ ဗျည်းတွဲ သရများ ပေါင်းစပ်တဲ့အခါ ပုံအမျိုးမျိုး ပြောင်းပါတယ်။ အဲဒီအခါ နီးစပ်တဲ့ ဘာသာများ ဖြစ်သည့်တိုင်အောင် တချို့ဘာသာမှာ သရဟာ အရှေ့ရောက်၊ တချို့က အပေါ်ရောက် တချို့က အောက်ရောက်ပါတယ်။ Unicode Encoding အဖြစ် တိကျသေချာတဲ့ စည်းမျဉ်းတွေ ရှိတဲ့ စနစ်တစ်ရပ် ပြုလုပ်တဲ့အခါ ဘယ်အက္ခရာဟာ အရှေ့မှာ နေပြီး ဘယ်ဟာ အနောက်မှာနေမယ်ဆိုတာ အတိအကျ စည်းမျဉ်း ချရပါတယ်။ တော်သလို ကြည့်လုပ်လို့ မရပါ။ အဲဒီစည်းမျဉ်းတွေ ချတဲ့အခါမှာ Linguistic (ဘာသာဗေဒ)ကို လိုက်နာပြီး နေရာချဖို့ ဆုံးဖြတ်ပါတယ်။ Linguistic ဆိုတာ အသံအရ စီခြင်း၊ ယုတ္တိကျအောင် စီခြင်း ဖြစ်ပါတယ်။

သဝေထိုးဟာ ဆိုရင် သရဖြစ်ပါတယ်။ အသံအရ သရဟာ ဗျည်းနောက်မှ လာတာပါ။ ဥပမာ ပြေး ဆိုတဲ့စာလုံးမှာ ပ(ဗျည်း) + ရ(ရရစ်) + သဝေထိုး(သရ) + ဝစ္စပေါက်(အသံလေး) ရယ်လို့စီပါတယ်။ စီပုံစီနည်း တစ်သမတ်တည်း ဖြစ်စေဖို့ ဖြစ်ပါတယ်။ လုံးကြီးတင်ဟာ အပေါ်မှာနေပြီး ချောင်းငင်ဟာ အောက်မှာနေပါတယ်။ ဒါပေမဲ့ စီတော့လည်း သူ့ကို နောက်မှာ သွားထားတာပါပဲ။ တခြား ဝင်းဖောင့်၊ ဇော်ဂျီဖောင့်တို့နဲ့ သွားမနှိုင်းပါနဲ့။ သူတို့မှာ အက္ခရာတွေကို ရှေ့နောက် ပြောင်းပေးနိုင်တဲ့ နည်းပညာမရှိလို့ အမြင်အရ အဆင်ပြေအောင် စီထားရခြင်းသာ ဖြစ်ပါတယ်။

ဗျည်းတွဲဟာ ပင့်ရစ်ဆွဲထိုး လေးလုံးဖြစ်ပြီး သရမလာခင် အရင်လာပါတယ်။ မေဆွိ က ဆွိမှာ ဝဆွဲ အရင်လာပြီးမှ သရ လုံးတင် လာပါတယ်။ ဗျည်းတွဲ အချင်းချင်း ယှဉ်လာရင် ပင့်ရစ်ဆွဲထိုး အစဉ်အတိုင်း ရေးပါတယ်။ ဥပမာ အမြွှာ မှာ အ + မ + ရရစ် + ဝဆွဲ + ဟထိုး + ရေးချ ရယ်လို့ ပုံသေ စီပါတယ်။ စည်းမျဉ်းမရှိ စံမလိုက်နာတဲ့ ဖောင့်တွေမှာတော့ ရေးချင်သလိုရေးပါတယ်။ အဲဒီအခါ Search Engine တွေမှာ တစ်မျိုးနဲ့ရေးရင် နောက်တစ်မျိုးကို ရှာမတွေ့နိုင်တော့ပါ။

အောက်မြစ်ဟာဆိုရင် မြန်မာစာမှာ အသံဖော့တဲ့ သင်္ကေတဖြစ်ပြီး အသတ်နောက်မှ လာပါတယ်။ ဒါပေမဲ့ ယူနီကုဒ်မှာ အောက်မြစ်ပြီးမှ အသတ် လာရပါတယ်။ ဘာဖြစ်လို့လဲ။ ကရင်စာမှာ အောက်မြစ်ဟာ သရအဖြစ်လည်း သုံးပါတယ်။ အဲဒီအခါမှာ အသတ်ရှေ့ကိုရောက်လာပြီး ဗမာစာစီပုံနဲ့ ပြောင်းပြန် ဖြစ်ပါတယ်။ ဒါပေမဲ့ ကရင်ဟာ မြန်မာယူနီကုဒ် အုပ်စုထဲမှာ ပါနေတဲ့အတွက် စီပုံ တစ်သမတ်တည်း ဖြစ်အောင် အောက်မြစ်ကို အရှေ့ပို့လိုက်ရပါတယ်။

စာလုံးစီပုံ Encoding ဟာ ကွန်ပျူတာနဲ့ဆိုင်တဲ့ ကိစ္စဖြစ်ပြီး မြန်မာစာ ရေးထုံးကို မထိခိုက်ပါ။ ရိုက်တဲ့အခါမှာ မြန်မာစာ သင်ပုန်းကြီးအတိုင်း သဝေထိုး ပစောက် ရရစ် ရေးချ ဝစ္စပေါက် = ပြောင်း ရပါတယ်။ ပေါ်ရင်လည်း အမှန်ပေါ်ပါတယ်။ အဲလိုစီတဲ့အတွက်လည်း အက္ခရာစဉ်တာမှာ အများကြီး မှန်ကန်လာပါတယ်။ (ကွန်ပျူတာစနစ်မှာ မြန်မာစာကို အထောက်အပံ့ပေးထားရင် မြန်မာအက္ခရာစဉ်တို ရှေးထုံးအတိုင်း စဉ်လို့ ရပါတယ်။ )အာရပ်စာ ဟိန္ဒူစာ အရှေ့တောင်အာရှစာတွေကို ကွန်ပျူတာစနစ်မှာ ထောက်ပံ့ပေးတဲ့အခါ အရှေ့အနောက်စီတာတွေကို လိုက်ကြည့်စရာမလိုတော့ပါ။ Selection မှတ်တဲ့အခါ ဝဏ္ဏတစ်ဖြတ်လုံးကိုသာ Select လုပ်လို့ ရပါတော့တယ်။ ဆိုလိုတာက ရရစ် အသတ် ဝစ္စပေါက် စတာတွေကို တစ်ခုစီ သတ်သတ် Select လုပ်မရတော့ပါ။ ဝဏ္ဏတစ်ဖြတ်လုံး (Syllable level) ပါလာမှာ ဖြစ်ပါတယ်။ စာရိုက်တာ မှားသွားရင် နောက်က Backspace နဲ့ အက္ခရာ တစ်ခုချင်းစီ ဖျက်လို့ရပါတယ်။ အရှေ့က ဖျက်မယ်ဆိုရင်တော့ ဝဏ္ဏတစ်ခုလုံး ပျက်မှာ ဖြစ်ပါတယ်။ အခုအခါ မြန်မာစာကို Mac နဲ့ Windows မှာ မထောက်ပံ့သေးတဲ့အတွက် အဲဒီ Feature ကို မြင်ရမှာ မဟုတ်ပါ။ Linux မှာတော့ မြန်မာစာကို အပြည့်အဝ အထောက်အပံ့ ပေးပါပြီ။

Selection, Delete နဲ့ Backspace စမ်းနိုင်အောင် ကွန်ပျူတာက အပြည့်အဝ ထောက်ပံ့ပေးထားတဲ့ ဟိန္ဒူစာနဲ့ အာရပ်စာတွေကို ထည့်ပေးလိုက်ပါတယ်။

क्षमा कीजिये أنت غبي

http://unicode.org/notes/tn11/UTN11_3.pdf ယူနီကုဒ် စာလုံးစီပုံ စည်းမျဉ်းတွေကို ယူနီကုဒ် ကွန်ဆိုတီယမ်အဖွဲ့က ဒီမှာ အတိအကျ ရေးထားပါတယ်။ ယူနီကုဒ်ဖောင့် ဖြစ်ဖို့ ကုဒ်ပွိုင့်နေရာသာမက စာလုံးစီပုံကိုလည်း အတိအကျ လိုက်နာရပါတယ်။ ဒီစည်းမျဉ်းတွေက တစ်စက်လေး လွဲချော်တာနဲ့ ယူနီကုဒ် မဟုတ်ဘူးလို့ သတ်မှတ်ပါတယ်။ မတော်တဆ လွဲချော်တာဆိုရင်တော့ ပြင်ဖို့ ထောက်ပြ ပေးနိုင်ပါတယ်။ တမင်ကို လွှဲချော်ထားတာဆိုရင်တော့ ကျွန်တော်လည်း ဘာမှ မတတ်နိုင်ပါ။ ယူနီကုဒ် မဟုတ်ပါလို့ ပြောရုံသာ ရှိပါတော့တယ် ခင်ဗျာ။

လေးစားစွာဖြင့်
##

Tags: , , , ,

· · · ◊ ◊ ◊ · · ·

Myanmar3 (Windows/Linux)

Masterpiece Uni Sans (OSX)

Drag the link to Bookmark Bar and click when viewing websites written in Unicode.

BookmarkDrag

Please note that Myanmar3 is for Windows and Linux while Masterpiece Uni Sans is for OSX(Mac). If Bookmark Toolbar is not there, enable it by View>Toolbars>Bookmarks Toolbar from browser’s menu. I used mm3web which is considerably small in size. After converting it to compressed font, it’s only around 10Kb in size.

This bookmarklet doesn’t work with Chrome browser in all OSs.

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

Myanmar Palindrome

10 Feb 2011

A palindrome is a word, phrase, number or other sequence of units that can be read the same way in either direction.

ရှေ့ကဖတ်ဖတ် နောက်ကဖတ်ဖတ် အတူတူဖြစ်တဲ့ စာလုံး၊ စာကြောင်း၊ ဝါကျ၊ ကိန်း နဲ့ အခြားသော ယူနစ်များကို ပယ်လင်းဒရုမ်း​လို့ ခေါ်တယ်။

Types

Characters
civic, radar, level, rotor, kayak, reviver, racecar, and redder
Phrases
“Was it a rat I saw?”, “Step on no pets”, “Able was I ere I saw Elba”, “Dammit, I’m mad!”, “Rats live on no evil star”
Famous quotations
Three famous English palindromes are “Able was I ere I saw Elba” (which is also palindromic with respect to spacing), “A man, a plan, a canal, Panama!”, and “Madam, I’m Adam” or “Madam in Eden, I’m Adam”

Well, these were English palindromes paragraphs I copied from Wikipedia. Myanmar also have infamous “ဘူးသီး​မသီးဘူး” (Bottle gourd is not fruiting) palindrome. Anymore? Nah!… Not many more.

Burmese is a complex script in which words are formed by single or multiple syllables. Vowels are mostly dependent which make nearly impossible to make character level palindromes. But we can still make a few short palindromes combining characters without dependent vowels.

Burmese character level (အက္ခရာ) palindromes:
ဝဝ မဝဝ (fat or not)
ကက မကက (dance or not)
စစ မစစ (tease/start or not)
The character list for xxမxx palindromes: ကခစဆတထနမရဝသဟအ
There are also some rare palindromic vocabularies (more than 2 characters).
မဒမ (မျောတိုင်)
ကရက (ကရား)

Syllable level palindromes:
Syllable level (ဝဏ္ဏ) is more suitable for making Burmese palindromes. There can be hundreds (or) even thousands combination we can make using syllables. For example,
စားစားမစားစား (eat or not)
စားချင်စား/စားရင်စား (eat if you want)
စားကစား/စားမှစား (eat a lot)
စားလည်းစား (eat too)
စားသာစား (eat all you want)
စားတော့စား (eat, but) etc.

There are some syllable level palindromic words too.
ကြီးတော်ကြီး (Big aunt)
စင်ကိုးစင် (nine stages)
ပုံတစ်ပုံ (one picture)
ရေခဲရေ (ice water)

Ok. Here comes the main part. There never has been a proper Burmese palindrome which is more than 10 syllables. I played a bit with words in my sketch book.

မလေးအမေ – မေအလေးမ
ကညာအပျို – ပျိုအညာက
စားသောက် – သောက်စား
လှလှ မလှလှ
ထထ မထထ

And I combined them together to get a reasonable sentence and finally got a 21 syllables palindrome.

“ကညာအပျို မလေးအမေ ထထ မထထ မေအလေးမ၊ ပျိုအညာက။”
Ma Lay’s virgin mom (or Virgin Ma Lay’s mom) is waking up or not, May from Ah Nyar is lifting weights. (Ah Nyar /a̱nja/ is upper reaches of Irrawaddy river.)

Notes:

ဟန်သစ်ငြိမ်ရဲ့ ငြိမ်သစ်ဟန် inspired me.

Ref: http://en.wikipedia.org/wiki/Palindrome

Tags: , , ,

· · · ◊ ◊ ◊ · · ·

Windows အတွက် Uniscribe ဆိုတဲ့ Shaping Engine ရှိတယ်။ ဒါပေမဲ့ သူက မြန်မာစာအတွက် Support လုပ်ပေးမထားဘူး။ ဒါကြောင့် လက်ရှိမြန်မာစာအတွက် သုံးလို့မရရအောင် Microsoft Volt သုံးပြီး တခြား Opentype Rule တွေနဲ့ Shaping Rule တွေကို အဆင်ပြေသလို တီထွင်ကြံဆပြီး သုံးထားရတာ။ ဂျပန်က နှစ်ထပ်ကားတွေကို မြန်မာပြည်ရောက်တော့ အမိုးဖြတ်၊ တံခါးပေါက် ဘယ်ညာပြောင်းတပ်ပြီး သုံးရတဲ့သဘောပေါ့။ Windows က မြန်မာစာအတွက် Uniscribe မှာ Support ပေးရင် အဲလို Hack စရာမလိုတော့ဘဲ အလွယ်သုံးနိုင်မယ်။ Shaping အတွက်သုံးရတဲ့ CPU usage လည်း သိသိသာသာ လျော့သွားမယ်။ မြန်မာ၂၊ ၃၊ ပုရပိုဒ်၊ ပိတောက်၊ ယွန်းချို၊ မိုင်မြန်မာ နဲ့ ဝင်းယူနီကုဒ်ဖောင့်တွေ Uniscribe သုံးတယ်။

 

Uniscribe Font တွေကို လင်းနက်မှာ ပန်ဂိုးက ဘာသာပြန်ပြီး Shaping ပြန်လုပ်တယ်။ ဆိုလိုတာက လင်းနက်မှာ Shaping က Windows မှာထက်တောင် နှေးနိုင်တယ်၊ သူက နှစ်ဆ အလုပ်လုပ်ရတာကိုး။ ဒါပေမဲ့ Pango မှာ Graphite အတွက် အပြည့်အဝ ထောက်ပံ့ပေးထားတယ်။ Padauk ဖောင့်က Uniscribe နဲ့ Graphite နှစ်ခုလုံး Apply လုပ်ထားတဲ့အတွက် Pango က Graphite ကို ဦးစားပေးပြီး Shaping လုပ်တဲ့အတွက် Padauk သုံးရတာ ပိုပေါ့ပြီး မြန်တယ်။ Masterpiece Uni Sans ကတော့ Pango ကို တိုက်ရိုက်သုံးတဲ့အတွက် အပေါ့ဆုံးနဲ့ အမြန်ဆုံး ဖြစ်မယ်။ Linux မှာ တိုင်းရင်းသားစာတွေ ဖတ်ဖို့လိုရင် Padauk ကိုသုံးပြီး၊ မလိုရင် Masterpiece Uni Sans ကိုသုံးဖို့ Recommend လုပ်ပါတယ်။ MyMyanmar လည်း Graphite သုံးတယ်ထင်တယ်။ Pango က Graphite ကို Support လုပ်ပေမဲ့ Shaping rule တွေက ဖောင့်ထဲမှာပဲ ရှိတယ်။ Masterpiece သွင်းလိုက်လို့ ပိတောက် အလုပ်မလုပ်ဘူးဆိုတာ မဖြစ်နိုင်ဘူးထင်တယ်။ သေချာစမ်းကြည့်ရဦးမယ်။

 

သံလွင်ဖောင့်ကတော့ 1mb လောက်ရှိတဲ့အတွက် ဖောင့်ဆိုဒ်အကြီးဆုံးဖြစ်မယ်။ Opentype နဲ့ Graphite ရဲ့ Ligature ပြောင်းတဲ့ Rule တစ်ခုပဲသုံးထားလို့ CPU Usage အနည်းဆုံးဖောင့် ဖြစ်မယ်။ Windows မှာရော Linux ရဲ့ Harfbuzz နဲ့ Pango Module တွေမှာပါ အလုပ်လုပ်တယ်။ Windows နဲ့ OSX က Adobe Software တွေမှာ အသုံးပြုလို့ရတဲ့ တစ်ခုတည်းသော ဖောင့် ဖြစ်မယ်။ (Character Toolbox က English default ဖြစ်နေတာကို Off ပေးဖို့တော့ လိုပါတယ်။) Adobe က အခြေခံ Opentype Rule တွေကို နားလည်ပေမဲ့ Complex Shaping မှာ Uniscribe နဲ့ အလုပ်မလုပ်ဘူး။  Adobe က သူ့ကိုယ်ပိုင် အင်ဂျင်နဲ့ အလုပ်လုပ်တယ်။ AFDKO နဲ့ ရေးထားတဲ့ ဖောင့်တွေမှ အပြည့်အဝ Support လုပ်တယ်။

 

Mac ရဲ့ Native က AAT ၊ သူက Graphite နဲ့ အလုပ်လုပ်ပုံချင်းတူတယ်။ Masterpiece Uni Sans က အရှေ့တောင်အာရှ ဘာသာစကားတွေမှာ ကိုယ့်အားကိုယ်ကိုး Develop လုပ်ပြီး ပထမဆုံး AAT သုံးနိုင်တဲ့ Opensource Mac Font ဖြစ်မယ်။ သူ့ရှေ့မှာ စီးပွားဖြစ်ဖောင့်တွေဖြစ်တဲ့ Xenotype နဲ့ MyMyanmar နှစ်ခုရှိတယ်။ တိုတိုပြောရရင် မြန်မာစာကို Linux ကလွဲပြီး ဘယ် OS ကမှ Support မလုပ်ပေးသော်ငြား အပတ်တကုပ်နဲ့ အားထုတ်ခဲ့တဲ့ ပညာရှင်တွေကြောင့် မြန်မာယူနီကုဒ်ဖောင့်တွေ ဒီလောက်ထိ အဆင့် မြင့်မြင့် သုံးနေနိုင်တာလို့ ပြောရမယ်။

 

ဒီဖောင့်က မပေါ်ဘူးဆိုရင် ဘယ်နေရာမှာ ဘယ်လိုမပေါ်တာ၊ အလုပ်မလုပ်ဘူးဆိုရင် ဘယ် OS ရဲ့ ဘယ် Software မှာ အလုပ်မလုပ်တာ၊ ဘယ်လို ဘယ်လိုရိုက်လိုက်လို့ မမှန်တာ ဘယ်နေရာမှာ မမှန်တာ စသည်ဖြင့် အသေးစိတ် Bug Report တွေကို Screenshot နဲ့တကွ အကြောင်းကြားပေးရင် Font Developer တွေ Troubleshoot လုပ်ရတာ ပိုအဆင်ပြေမှာ ဖြစ်ပါတယ်။ ကျေးဇူးတင်ပါတယ်။

 

View Unicode font list here.

Download Myanmar unique syllable list here.

Myanmar unique syllable list ဖိုင်ထဲမှာ ပါတဲ့ ဝဏ္ဏ၊ ဝဏ္ဏတွဲ အကုန်လုံးနဲ့ အမှန်အတိုင်းမြင်ရတယ်ဆိုရင် အဲဒီဖောင့် ၁၀၀ ရာခိုင်နှုန်း အလုပ်လုပ်တယ်လို့ အကြမ်းဖျင်း ပြောလို့ ရပါတယ်။

Tags: , , , , , , , ,

· · · ◊ ◊ ◊ · · ·
Burmese Character Frequency

Burmese Character Frequency

I tried an attempt to collect a general data analysis on Burmese character frequency using data from Wikipedia and blogs.

Download Data Sheet here. The image and data are redistributable under CC BY-SA 3.0 license.

Tags: , , , , , , , ,

· · · ◊ ◊ ◊ · · ·

(1) Keyman

Keyman is a software from Tavultesoft. Myanmar3 layout was developed based on Keyman 6.2.176.0 freely redistributable version. Myanmar NLP lab developed Myanmar3 layout.

 

Layout – Myanmar3

OS: Windows

License: LGPL (Keyboard file only ##not the Keyman software)

 

Project Links:

http://www.myanmarnlp.net.mm/

http://code.google.com/p/myanmar3source/ (Latest updated versions)

Download Links:

https://myanmar3source.googlecode.com/files/myanmar3std.kmn

 

(2) Ekaya

Ekaya uses Windows Advanced Text Services Framework to provide a Smart Input method (keyboard) suitable for typing languages using Complex Scripts such as Myanmar (Burmese). This means that it can do context sensitive reordering and substitution of characters as you type.  The keyboard rules are written in the same kmn format that the commercial Tavultesoft Keyman uses for its keyboards. The main advantage of Ekaya is that it is free and Open Source (GPL). It uses the Open Source KMFL library to parse the .kmn files. Ekaya was developed by Keith Stribley, Thanlwinsoft.

 

Layout – Myanmar3, MyWin

OS – Windows

License – Creative Commons Attribution-ShareAlike 2.5 License

 

Project Links:

http://www.thanlwinsoft.org/ThanLwinSoft/Ekaya/

http://www.myanmarnlp.org.mm/index.php?option=com_content&view=article&id=2&Itemid=5

Download Links:

http://www.thanlwinsoft.org/ThanLwinSoft/Downloads/Keyboards/Ekaya-0.1.6_x86_64.exe (##64bit Windows)

http://www.thanlwinsoft.org/ThanLwinSoft/Downloads/Keyboards/Ekaya-0.1.6_x86.exe

http://www.myanmarnlp.org.mm/images/stories/download/ekaya-0.1.5_x86.zip

Updated Maintained Link: http://my.duniakitab.com/ThanLwinSoft/ThanLwinSoft/Ekaya/

 

(3) Keymagic

KeyMagic Unicode Keyboard Input Customizer – is a smart keyboard input method editor for complex script languages. With this IME, now you can have different type of Unicode keyboard layout and, you can switch to and from. As well as map/edit key layout as your own preferred type layout setting. Keymagic was mainly developed by Thant Thet Khin Zaw.

 

Layout – Myanmar3, MyWin, Parabaik, ZawgyiL

OS – Windows, OSX, Linux

License – GPL

 

Project Links:

http://keymagic.net/

Download Links

http://keymagic.net/downloads:

 

 

(4) Waitzar

This project has evolved, from a simple plugin which converts romanised Burmese to native text, to a solid multi-font system for typing Burmese at all levels of its computerized history: past (Win Innwa), present (Zawgyi-One), and future (Unicode 5.1). Waitzar was developed by Waitzar Team and mainly by Seth N. Hetu.

 

Layout – Waitzar, Burglish, Myanmar3, Ayar, MyWin, Parabaik, Zawgyi

OS – Windows, Linux (##Linux version doesn’t have full features)

License – Apache License 2.0

 

Project Links:

http://www.waitzar.com/

http://code.google.com/p/waitzar/ (Windows)

http://code.google.com/p/scim-waitzar/ (Linux)

Download Links:

http://waitzar.googlecode.com/files/release_1.8.zip

 

(5) NHM Writer

This project was developed by Ravi to fill up the gap for Zawgyi Keyboard users. Over 100,000 rules were written during this layout development. NHM software from New Horizon Media was used.

 

Layout – Zawgyi

OS – Windows

No License. Free to use and redistribute.

 

Download Link:

http://goo.gl/ztnr

 

(6) MyMyanmar

MyMyanmar input methods are packaged with MyMyanmar Language System.

 

Input Methods – TypeWriter, Phonetics, On Screen Keyboard, MyRoman, Handwriting

OS – Windows

License – No license mentioned, assumed copyrighted since it’s a commercial product

 

Project Link:

http://www.mymyanmar.net/

Download Link:

http://www.mymyanmar.net/MyMMLNG2010.exe

 

Extra notes for Linux

Linux has iBus and Scim for input methods. Both iBus and Scim can import (keyman layout)kmn files. Latest myanmar3 kmn file is available at Myanmar3 project from googlecode.

Tags: , , , , , , , , , , , , ,

· · · ◊ ◊ ◊ · · ·

ဥုံ သျှရီ သျှရီ ယခုကား မြန်မာသက္ကရာဇ် ၁၃၇၂ မှ ၁၃၇၃ သို့ အကူးတည်း။ ဘလော့မြန်မာ အမည်ရှိရှိသော ဗြဟ္မာကြီးဦးခေါင်းကို ယူနီအမည်ရှိ နတ်သမီးမှ လက်ကမ်းယူသတည်း။ ယင်းကြောင့် နှစ်စတွင် မြန်မာဘလော့လောကကြီး ပူညံပူညံ ဖြစ်လတ္တံ့။ ပြောင်းသူတို့ကလည်း ပြောင်းပြီပြောင်းပြီဟု ဝမ်းသာအားရပြောကြလတ္တံ့။ မပြောင်းသူတို့ကလည်း သေတောင်မပြောင်းဘူးဟု ခံငြင်းကြလတ္တံ့။ အများစုသောသူတို့ကား နားစွန်နားဖျားနှင့် ယူနီကို အသေရိုက်သတ်ချင်အောင် ချစ်ခင်ကြလတ္တံ့။ အကုန်ပြောင်းရင် ပြောင်းမယ်ဟု ဆိုသူတို့ကလည်း ဆိုကြလတ္တံ့။ အချို့ကလည်း စကားရောဖောရောဖြင့် ယိုးဒယားတွင် သွားပြောင်းခဲ့သည်ကို စကားမရှိ စကားရှာ ပြောကြလတ္တံ့။

မုခမျက်နှာရပ်ဝန်း(ဖဗ)တွင်မူ ယူနီသုံးသူအပေါင်းတို့ တောက်ညင့်ကပ် ခံရလတ္တံ့။ အားနာသူတို့ကား ပြန်ပြောင်းကြလတ္တံ့။ အချို့ကား ဧကန်အလုပ်ရှုပ်ခံ၍ နှစ်မျိုးလုံးနှင့် ရေးကြလတ္တံ့။ ပေါ်ပျူလာမဖြစ်သူတို့ကား ဂရုစိုက်စရာမရှိပြီ ဖြစ်ရကား ယူနီကို တွင်တွင် သုံးသည်ချည်းသာ ဖြစ်လတ္တံ့။ ဤသို့ အကြောင်းမူ အခြေပြုရကား ကွန်ဗာတာဆော့ဝဲတို့ ဟစ်ပွိုင့်တက်လတ္တံ့။

ယူနီသမားတို့ ပြောင်းခါစတွင် ဂြိုဟ်သားစာများကို လာကြည့်သူတို့ကြောင့် ဟစ်ပွိုင့်တက်ရကား ဝမ်းမြောက်ကြလတ္တံ့။ ဖတ်မရ မမြင်ရပြောသူများကြောင့် လိုက်ရှင်းနေရသည်များသောကြောင့် နောက်ပိုင်းတွင် စိတ်တွင်တွင်ကြီး ရှုပ်ရလတ္တံ့။ နဂိုစိတ်ရှည်သူများ ဒေါသထွက်၍ စိတ်တိုတတ်သူများ သည်းခံလာတတ်လတ္တံ့။

ယားသူတို့သာကုတ်သည်ဟူ၍ ဒဒွေးသုံးခိုင်းသူတို့လည်း ရှိလတ္တံ့။ ယူနီကို တစ်ချက်ထိလျှင် တစ်ချက်ပြန်ပက်၊ တစ်ခွန်းပြောလျှင် တစ်ခွန်းပြန်တုံ့သူတို့ ရှိထသည် ဖြစ်မူ၍ ဟမ်မူရာဘီ ကိုဓဥပဒေ(Code of Hammurabi) အလား ယူနီကိုဓ (Unicode) ဟု အမည်နာမသည်လည်း တွင်လတ္တံ့။

ဤသို့ယူနီ ကို လူမညီသည့် အပူသည်ဟု ရှုံ့ချသည်လည်း ရှိလတ္တံ့။ ယူနီပါလျှင် ပွဲဆူသောကြောင့် အကြောင်းမရှိအကြောင်းရှာ ယူနီပါအောင် ပြောကြလတ္တံ့။ ယူနီခေတ်စားသောကြောင့် ယူနီဆီးယို၊ ယူနီခုံဖိနပ်ဘရန်းများ ပေါ်လာပြီး အရောင်းသွက်လတ္တံ့။ ဖွ၍ပွသည် ဖြစ်သောကြောင့် မဆီမဆိုင် ယူနီဒေါသသင့်၍ ကြားညပ်ကြသည်များလည်း ရှိလတ္တံ့။ ကြီးကြီးငယ်ငယ် ပုပုရွရွ ဘုစုခရု ကိုကိုမမ ဦးကြီးဒေါ်လေး ဘိုးဘိုးဘွားဘွားနှင့် သားသည်အမေတို့မကျန် ယူနီအလှုပ်တွင် နားမလည် ပါးမလည် စုံးစုံးမြုပ်ကြ လတ္တံ့။ (ဤကား ကိုယ့်ထမင်းကိုယ်စား ကြီးတော်နွား ကလိသွားထိုးသော ယူနီသမားတို့ အပြစ်ချည်းပေတည်း – စကားချပ်)။ အချုပ်ဆိုရသော် ကောဇာ ၁၃၇၃ သည်ကား နှစ်ရှည်လများ ပေအဖြစ်ပု၍ အန်ဒါဒေါ့ ဖြစ်ခဲ့သော ယူနီကုဒ် စင်ပေါ်ရောက်မည်ဟု အတပ်ဟောလိုက်ရပေသတည်း။ ဥုံ ပလီစိချောက်ချက် အသက်သေတစ်မနက် သွားဟ။

##(ပေါပါ့.. ရုံးဆင်းခါနီး အားနေ၍ လျှောက်ရေးထားသည်။)

Tags: ,

· · · ◊ ◊ ◊ · · ·

ဒီရက်ပိုင်း ယူနီကုဒ်ကို လူတော်တော်များများ စိတ်ဝင်စားလာကြပြီး ထောက်ပြဝေဖန် မေးမြန်းတာတွေ ရှိတဲ့အထဲမှာ ညီလင်းဆက်ရေးခဲ့တဲ့ Review on Myanmar Unicode 5.1 & Suggestion ကို ပြတဲ့ပြီး ဒါတွေရှင်းပြီးပြီလားလို့ မေးတဲ့လူတွေ ရှိလာလို့ ဒီစာကို ရေးဖြစ်ပါတယ်။ ယူနီကုဒ်လုပ်ခဲ့တဲ့ ပညာရှင်တွေ၊ Developer တွေက ကိုယ်စီ ရှင်းထားကြပေမဲ့ အင်္ဂလိပ်လိုဖြစ်တာရယ်၊ မြန်မာလိုရေးထားတာဆိုရင်လည်း တစ်စုတစ်စည်းတည်း မရှိတာကြောင့်  တစ်နေရာတည်းမှာ စုစည်းပြီး ဖြေပေးလိုက်ပါတယ်။

.::Download this article in PDF format here::.

 

၁။

ယူနီကုဒ်မှာ ပုံသဏ္ဌာန် ထပ်တူထပ်မျှတူရင် သုံးတဲ့နေရာ မတူပေမဲ့ ကုဒ်ပွိုင့်တစ်ခုတည်း ယူပါတယ်။

 

ဥပမာ –

玍 – (738D)

To be born

Birth, origin

To live, to exist, to survive

To revive, to bring to life

Raw, uncooked, crude

Pure, neat, genuine

unfamiliar, strange

untamed, barbarian

a student

 

ះ – (17C7)

KHMER SIGN REAHMUK

srak ah

visarga

 

Screen shot 2011-01-22 at 2

Khmer O, AU

 

ရှေ့ထိုး (​ေ-ာ်)ကိုသီးခြားခွဲထုတ်မရပါ။ ဒါ့အပြင် Split Vowel (ခမာတွင်သုံးသည်, 17C4, 17C5) ဟုသတ်မှတ်၍ ​ေ-ာ်အတွက် တစ်ကွက်ထည့်ပါက ​ေ-ာ၊ -ံ့ ၊ -ို အတွက်ပါ ထည့်ရပါမယ်။ အဲဒီအတွက်  Split Vowel ကိုမသုံးပဲ အသတ်ကိုသာ ရှေ့ထိုးအတွက် ပုံဖော်ခြင်းမှာ သုံးပါတယ်။ အဲလိုမျှဝေသုံးစွဲခြင်းအတွက် အက္ခရာစဉ်ခြင်းနှင့် ရှာဖွေခြင်းတွင် မည်သို့မျှပြောင်းလဲခြင်းမရှိပါ။ Split Vowel လို့ထည့်ရင် ပြင်မယ်ဆိုရင် အသတ်ကိုဖျက်တာ၊ ရေးချကို ဖျက်တာခက်သွားမယ်။ ကော် ကနေ ကော၊ ကေ ကိုပြင်မယ်ဆိုရင် ရေးချ၊ ရှေ့ထိုးဖျက်ရုံနဲ့မရဘဲ တစ်ခုလုံးဖျက်ရပါမယ်။

 

၂။

 

မွန်ဘာသာ ရှေးစာတွေမှာ “ပဿ” အသုံးရှိသလို “လသ္သ” အသုံးလည်း ရှိပါတယ်။ ယူနီကုဒ် အရှေ့ပိုင်းဗားရှင်းတွေမှာ ဿကြီး မပါပါဘူး။ နောက်မှ လိုလို့ အကြောင်းအကျိုး သက်သေသာဓကတွေ ပြပြီး တောင်းထားတာ ဖြစ်ပါတယ်။ နောက်ထပ် code point မပေးရင် အဲဒီ ၂ခုလုံးကို ဖော်ပြဖို့ မဖြစ်နိုင်ပါ။ disunification လုပ်ရပါတယ်။ Database မှာ De-normalization ကို မြန်ဖို့ အဆင်ပြေဖို့ သုံးရသလိုပါပဲ။

 

၃။

 

ခုခေတ်မှာ ဗမာစာတစ်ခုတည်း ရုံးသုံးဖြစ်နေပေမဲ့ တူညီတဲ့ အက္ခရာတွေ ယူသုံးတဲ့ တခြားသာသာစကား အများအပြားလည်း ရှိပါတယ်။ ယူနီကုဒ်မှာ ဗမာ၊ မွန်၊ ရခိုင်၊ ရှမ်း၊ ပိုးကရင်၊ စကောကရင်၊ ပလောင်၊ ပအို့ဝ် စတဲ့ တိုင်းရင်းသားစာ အများအပြားအတွက်ပါ ထည့်ပေးထားတဲ့အတွက် ဗမာစာတစ်ခုတည်း ကွက်ကြည့်လို့ မဖြစ်တော့ပါဘူး။ ဗမာစာကိုယ်တိုင်ကိုက မွန်အက္ခရာတွေမှာ အခြေခံထားတဲ့အတွက် မွန်ဘာသာရယ်၊ သူနဲ့ယှဉ်ပြီးသုံးတဲ့ ရှေးထုံးဗမာစာရယ်ကိုပါ ထည့်စဉ်းစားရပါတယ်။ မွန်စာရေးထုံးအရ မသတ် (မ်) ကို အတိုရေးချင်တဲ့အခါ ဗျည်းပေါ် အစက်တင် (Superscripted) ရေးပါတယ်။ (အခုထိ ခမာမှာ အဲဒီအတိုင်းသုံးပါတယ်)။ အမှန်တော့ ဗျည်းပေါ်တင်ရေးတဲ့ အဲဒီအစက် ကိုယ်တိုင်ကိုက ဗျည်း(အံ) ဖြစ်ပါတယ်။ အဲဒါကြောင့် အ နဲ့ပေါင်းပြီး အ သေးသေးတင် ဖြစ်တဲ့အခါ သရလို့ မယူဆပါဘူး။ နောက်ပိုင်း မြန်မာသင်ပုန်းကြီးက ဗျည်းမှာ အံ မထည့်တော့ဘဲ ဗျည်းလွတ်နေတဲ့ သရတွေကို စီတဲ့အထဲ သွားထည့်လိုက်တဲ့အခါ သရအဖြစ် သတ်မှတ်လိုက်ပါတော့တယ်။ အဲဒါကြောင့် သေးသေးတင်ကို သရအဖြစ်ရော ဗျည်းအဖြစ်ပါ သတ်မှတ်တဲ့အတွက် Various Sign ထဲထည့်ပါတယ်။ ခမာနဲ့ ထိုင်းဘာသာတွေမှာပါ Various Sign ထဲ ဝင်ပါတယ်။

 

၄။

 

ရှေးက မြန်မာစာရေးတဲ့အခါမှာ ကျောက်စာပေစာတွေမှာ ရေးရတဲ့အတွက် နေရာဆံ့အောင် အတိုရေးရတဲ့ နည်းတွေ ရှိပါတယ်။ အု က ဥ ဖြစ်တာတွေက အဲဒီထုံးပါပဲ။ ၎င်း ကိုယ်၌ကိုက လည်းကောင်းကို ချုံ့တာပါ။ ၎င်း ကို ထပ်ချုံ့ချင်တဲ့အခါမှာတော့ ၎ သင်္ကေတပေါ် ကင်းစီးတင်ပြီး ၎င်္ ရယ်လို့ ရေးပါတယ်။ အဲဒါကြောင့် ၎ သင်္ကေတမှာ ငသတ်ဝစ္စပေါက် ဖြုတ်ထားတာ ဖြစ်ပါတယ်။ ယူနီကုဒ် 1.0 မူကြမ်းမှာ ၎ သင်္ကေတနဲ့ ဿကြီး 5.1 မူအတိုင်း ပါပါတယ်။

 

၅။

 

အပေါ်က သဝေထိုးကို ရှေးက ဗမာစာ၊ မွန်စာတွေမှာ သုံးပါတယ်။ ခုခေတ်လည်း မွန်စာတွေမှာ သုံးနေတုန်းပါပဲ။ ဥပမာ – “ယဵု”။ အသုံးလိုတိုင်းယူနီကုဒ်မှာ လိုက်ထည့်နေရမလားဆိုတော့ ဟုတ်ပါတယ် လိုက်ထည့်ရမှာပါ။ သုံးတဲ့အသုံး၊ ဘယ်နေရာမှာသုံးတယ်၊ ဘယ်ခုနှစ်က ဘယ်တိုင်းရင်းသားရဲ့ ဘယ်စာမှာသုံးတယ်ဆိုတာ ပြနိုင်ရင် ယူနီကုဒ်ကွန်ဆိုတီယမ်မှာ ထပ်တိုးတောင်းလို့ ရပါတယ်။ ကုဒ်ပွိုင့်တစ်ခုချင်းစီဟာ ရဖို့ အင်မတန်ခက်ခဲတဲ့အတွက် အသစ်ရမယ်ဆိုရင် ဒါဟာ ဝမ်းသာအားရ ကြိုဆိုရမယ့် အချက် ဖြစ်ပါတယ်။

 

၆။

 

Normalization အတွက်လားဆိုရင် ဟုတ်ပါတယ်လို့ ဖြေရပါမယ်။ Alternate rule for normalization ဆိုတာ ရှိရင် ပိုအကျိုးရှိပါတယ်။ ရဖို့လည်း ခက်ပါတယ်။ ဥလုံးကြီးတင်ဆန်ခတ်နဲ့ မှားနိုင်စရာ တခြားစာလုံးမရှိတာရယ်၊ ရှောင်ဖို့ခက်တဲ့ သာဓကအများအပြားရယ်ကြောင့် ထည့်ပေးလိုက်တာပါ။ လက်ကွက်မှတ်မိရင် 1025+102E အစား 1026 အက္ခရာ ဦ ကိုသာသုံးဖို့ တိုက်တွန်းပါတယ်။

 

၇။

 

ဪ သရအတွက် မွန်စာမှာ ရှေ့ပစ်သုံးပြီး ပြပါတယ် – “အဴ”။ ဗမာစာမှာ ရှေ့ပစ်မသုံးတော့ဘဲ ဝသတ်နဲ့ ပြပါတယ် – “ဝ်”။ သဝေထိုးနဲ့ ရေးချသုံးတဲ့ အော်သံမှာ ရှေ့ပစ်နဲ့ဆင်တဲ့ ရှေ့ထိုးကို သုံးပြီး ပုံစံအသစ်ရေးပါတယ်။ ကုန်းဘောင်ခေတ် တောင်တွင်းဆရာတော် ခင်ကြီးဖျော်ရဲ့ သဒ္ဒဗျူဟာကျမ်းမှာတော့ အော်သရအတွက် အက္ခရာဩမှာ သဝေထိုးရေးချ ရှေ့ထိုးကပ်ပြီး အက္ခရာဪကို စထွင်ပါတယ်။ ဒါပေမဲ့ အက္ခရာဩ အက္ခရာဪတွေကို သ ရရစ် လို့ မရေးပါ။ မွန်စာမှာ အက္ခရာဩ ရော သ ရရစ် အသုံးပါ ရှိတဲ့အတွက်ကြောင့် ဖြစ်ပါတယ်။ ဥပမာ – “သြန်” (သကို ရရစ်ကပ်ရင် ဆလိမ်+အောသံထွက်ပါတယ်)။

 

 

၈။

 

၁၉၉၈ ယူနီကုဒ်(၃) မြန်မာစာ Proposal မှာ အော နဲ့ အော် သရနှစ်လုံးပါပါတယ်။ ဒါပေမဲ့ သရလို့ဆိုတဲ့ အ ကိုယ်၌က ဗျည်းထဲဝင်နေတဲ့အချက်ကြောင့်ရယ် အို အုံ အံ အသုံးတွေ အတွက်ကြောင့်နဲ့ အ ကိုသုံးပြီး ရှိပြီးသားသရတွေဖြစ်တဲ့ သဝေထိုး၊ ရေးချတို့နဲ့ ရေးလို့ဖြစ်တယ်ဆိုပြီး နောက်ပိုင်းမှာ ပြန်ဖြုတ်ပါတယ်။ ဗျည်းမှာ အ မပါတဲ့ ခမာကိုတော့ အော အော် နှစ်လုံး ပေးပါတယ်။ ယူနီကုဒ်ပွိုင့်လေး တစ်လုံးတစ်ပါဒအတွက် မြန်မာစာပညာရှင်၊ ကွန်ပျူတာပညာရှင်ေတွ ဖြစ်နိုင်ချေရှိတဲ့ နည်းလမ်းပေါင်းစုံသုံးပြီး အကြိမ်ကြိမ် ခေါင်းချင်းဆိုင်ဆွေးနွေး၊ ပြည်ပကိုအခါခါထွက်၊ ဆုံးဖြတ်ချက်ကို လည်တရှည်ရှည်နဲ့စောင့်ဖူးခဲ့ပါပြီ။

 

 

၉။

 

ယူနီကုဒ်အက္ခရာတွေမှာ မြန်မာအက္ခရာတွေအတွက် ဘလော့ခ် အစုအဝေးကြီးတစ်ခု ထားပေးပြီး ပုံစံကျအောင် စီပါတယ်။ ဗားရှင်းတစ်ခုချင်းစီ သွားတိုင်း မလိုတာပယ် လိုတာဖြည့်လုပ်ပါတယ်။ အဲဒီအခါမှာ အရင်ဗားရှင်းတွေနဲ့ အတတ်နိုင်ဆုံးတူအောင် ပြန်ချန်ထားရပါတယ်။ ဗမာစာဟာ မွန်စာကို ယူသုံးထားပါတယ်။ မွန်စာမှာလည်း ဗမာစာမှာမရှိတဲ့ အက္ခရာတွေ ပါပါတယ်။ ရှမ်းစာ မွန်စာ ရခိုင်စာ ကရင်စာ မှာလည်း ဗမာအက္ခရာကို သုံးပါတယ်။ ကျီးဖြူဒီမှာနေ၊ ကျီးမည်းဒီကိုသွားဆိုပြီး ခွဲထုတ်လို့မရနိုင်ပါဘူး။

 

၁၀။

 

 

ယူနီကုဒ်ဖောင့်တွေဖြစ်တဲ့ မြန်မာ၃၊ မိုင်မြန်မာ၊ ပိတောက်၊ ပုရပိုက်၊ ယွန်းချို၊ မာစတာပိယူနီစံတွေမှာ ရှားရှားပါးပါး ပါဠိသက် တစ်နေရာ နှစ်နေရာကလွဲလို့ အားလုံးအတူတူ အလုပ်လုပ်ပါတယ်။ အခုဒီစာကိုလည်း Mac မှာ မာစတာပိယူနီစံနဲ့ ရိုက်ပြီး မွန်စာတွေ မြင်ရအောင် Windows မှာ ပိတောက်နဲ့ PDF ပြန်ထုတ်ပါတယ်။

 

၁၁။ ဒါကတော့ ညီလင်းဆက်ထဲမှာ မပါပေမဲ့ ယူနီကုဒ်က ပါဠိသုံးထပ်ဆင့် မရဘူးလို့ ကတ်ကတ်သတ်သတ် ပြောသူတွေ ရှိလာတာကြောင့် တစ်လက်စတည်း ထည့်ရေးဖြစ်ပါတယ်။ ယူနီကုဒ် Encoding မှာ မြန်မာဘာသာအတွက် Encode လုပ်လို့မရဘူးဆိုတာ မရှိ​သလောက် ဖြစ်နေပါပြီ။ ဖောင့်အနေနဲ့ အမှန်မပြနိုင်တာတွေ ရှိကောင်းရှိပါမယ်။ ဥပမာ –

န + ဝိရာမ + တ + ဝဆွဲ ဆိုတဲ့ ပါဠိသုံးထပ်ဆင့် စာလုံးပါ။

 

သူ့ကို အခု မြန်မာ၃နဲ့ အမှန်မမြင်ရပေမဲ့ သုံးမှဖြစ်မယ်ဆိုပြီးလိုအပ်လာခဲ့လို့ ရှိရင် ယူနီကုဒ် Encoding စာလုံးစီပုံ ရှိပြီးသား ဖြစ်တဲ့အတွက် ဖောင့်မှာ Glyph တစ်ခုနဲ့ Rule တစ်ခု ပေါင်းထည့်လိုက်ရုံနဲ့ ရပါပြီ။

 

Encoding ဆိုတာနဲ့ တစ်ဆက်တည်း ပြောလိုက်ပါဦးမယ်။ ယူနီကုဒ် Encoding Model မှာ ဘယ်အက္ခရာက ရှေ့ကနေပြီး ဘယ်အက္ခရာက နောက်ကနေမယ်ဆိုတာ အတိအကျ ဖော်ပြထားတဲ့ စည်းမျဉ်းတွေ ရှိပါတယ်။ Encoding ဆိုတာ မြန်မာစာ သင်ရိုး မဟုတ်ပါဘူး။ တခြားတိုင်းရင်းသားအက္ခရာတွေနဲ့ အဆင်ပြေအောင်၊ ကွန်ပျူတာမှာ တွက်ချက်ရ လွယ်ကူအောင် နောင်အရှည်မှာ အဆင်ပြေလွယ်ကူအောင် ဘာသာဗေဒနည်း အရ ကွန်ပျူတာမှာ Syllable ဝဏ္ဏအဆင့် သိမ်းတဲ့နည်း ဖြစ်ပါတယ်။ အလွယ်မှတ်ရင်တော့ ဗျည်း၊ ဗျည်းတွဲ၊ သရ လို့ မှတ်နိုင်ပါတယ်။ စိတ်ဝင်စားရင် ဒီနေရာမှာ အလွယ်မှတ်နည်း အဆင့်ဆင့်ကို သွားကြည့်နိုင်ပါတယ်။ အကျယ်ကိုတော့ ဒီမှာ ကြည့်ပါ။

 

နောက်ဆုံးတစ်ခုပြောချင်တာက ယူနီကုဒ်ဟာ မြန်မာစာ ကောင်းကောင်းမတတ်တဲ့ ကွန်ပျူတာသမားတွေ လုပ်ချင်ရာ လုပ်ထားကြတာ မဟုတ်ဘူး ဆိုတာပါပဲ။ မြန်မာစာပညာရှင်တွေ၊ တိုင်းရင်းသားစာပေ ပညာရှင်တွေ၊ ဘာသာဗေဒကို အထူးပြု လေ့လာနေတဲ့ လူတွေ၊ ကွန်ပျူတာပညာရှင်တွေ အားလုံး ဝိုင်းဝန်းပြီး လုပ်ထားကြတာပါ။ လုပ်တိုင်းလည်း မြန်မာတွေ စိတ်ကြိုက် အားလုံး မရပါ။ အရှေ့တောင်အာရှဘာသာစကားတွေကို အထူးပြုလေ့လာထားတဲ့ ယူနီကုဒ်ကွန်ဆိုတီယမ်က ပညာရှင်တွေရဲ့ အဆင့်ဆင့် စိစစ်မှုကို ခံကြရပါသေးတယ်။ ယူနီကုဒ် Proposal တစ်ခုတင်ဖို့ နဲ့ တင်ပြီးရင် အတည်ပြုဖို့ တစ်နှစ်ကြာပါတယ်။ အဲဒီကာလတွေအတွင်းမှာ အကြောင်းပြချက်ခိုင်လုံရင် ပြင်ခွင့် ကန့်ကွက်ခွင့် ရှိပါတယ်။ အဲဒါတွေအားလုံး ပြီးသွားတော့မှ အတည်ပြုတဲ့ ဗားရှင်းတစ်ခုရပါတယ်။ အခု ဗားရှင်း 5.2 မှာ ဗမာစာအတွက် ပြင်စရာ ကုန်သလောက်ဖြစ်သွားပါပြီ။ ဒါကြောင့် စိတ်ချသုံးလို့ ရပါပြီလို့ ပြောနေကြတာပါ။ လူသိနည်းတဲ့ တိုင်းရင်းသားစာတွေ ထည့်ဖို့ရှိလာတယ်ဆိုလည်း အခုရှိပြီးသားအက္ခရာတွေရဲ့ နောက်မှာ ထပ်ထည့်သွားရုံပါပဲ။ ဒီလောက်ဆိုရင် ဒွိဟဖြစ်နေသူ အတော်များများ ရှင်းသွားလောက်ပြီ ထင်ပါတယ်။

 

@=={Lionslayer>

22/01/2011

 

Ref:

Tags: , , , , , , , , , , ,

· · · ◊ ◊ ◊ · · ·

စီတယ်ဆိုရင် Encoding နဲ့ မှားပြီး နားလည်နေမယ်။ အက္ခရာစဉ်တယ်လို့ ပြောရအောင်။

အပေါ်က ကွန်းမန့်တွေမှာ ပြောသွားတာကို ကျွန်တော် နားလည်သလို ပြန်ရေးပြမယ်။ လွဲနေရင် လွဲနေတယ် ပြောပါ။

ကိုသီဟ။ ။ လောလောဆယ် မြန်မာအက္ခရာစဉ်ထုံးအတိုင်း နေရာတိုင်းမှာ မထောက်ပံ့ပေးထားသော်လည်း ဗျည်းသီးသန့်ကွဲအောင် နေရာတိုင်းမှာ စဉ်လို့ရပြီ။ ဥပမာ မိုက်ကရိုဆော့ အော့ဖစ်၊ SQL၊ ယူနီကုဒ်စာတွေ စဉ်ပေးနိုင်တဲ့ ဘယ် OS မဆို၊ ဘယ် Office suite မဆို။

ကိုမင်းကျော်။ ။ ယူနီကုဒ်စဉ်ဖို့ ဆော့ဝဲအကူလိုတယ်။ ယူနီကုဒ်မှာ တိုင်းရင်းသား အက္ခရာတွေ စဉ်လို့မရ။

ဒီတော့ ကျွန်တော်တို့ ဒီလို စဉ်းစားကြည့်ရအောင်။
၁။ နည်းပညာအကူမပါရင် ယူနီကုဒ်စဉ်လို့မရ။
မှန်ပါတယ်။ A နဲ့ a ဝိတ်အတူတူဖြစ်ပါတယ်ဆိုတာ OS ကိုယ်တိုင်က သတ်မှတ်ပေးထားမှ အမှန်စဉ်လို့ ရပါတယ်။
၂။ အိုအက်စ်က ဘာကို စံထားပြီး သတ်မှတ်ပေးမလဲ။
ရှင်းပါတယ်။ ယူနီကုဒ်ကို စံထားပြီး သတ်မှတ်ပေးပါတယ်။

အင်္ဂလိပ်စာကို ကုဒ်ပွိုင့်နဲ့ စီလို့မရသလိုပဲ မြန်မာစာကို ကုဒ်ပွိုင့်နဲ့ စီမရပါ။ မြန်မာ အက္ခရာစဉ်ဟာ အသံနဲ့ စဉ်ပါတယ်။ ကုဒ်ပွိုင့်ပြောင်းလိုက်ရုံနဲ့ စီလို့ရမယ် ထင်နေသူများ လုံးဝ(လုံးဝ) မရနိုင်ကြောင်း ရဲရဲကြီး အာမခံပါတယ်။

ဒါဆို မြန်မာ အက္ခရာစဉ်အမှန်ကို ဆော့ဝဲတိုင်း ပလက်ဖောင်းတိုင်းက ဘယ်လို လိုက်သိနိုင်မလဲ။

ဒီမှာတင် စံ (စတန်းဒတ်) ဆိုတာ စကားပြောလာပါပြီ။ တံတားပဲဆောက်ဆောက်၊ လမ်းပဲဖောက်ဖောက်၊ စည်သွပ်ဘူးပဲ လုပ်ရောင်းရောင်း ဘယ်နှမီတာ၊ ဘယ်နှမီလီမီတာ ရှိတယ်လို့ပြောရင် လူတိုင်းသိပါတယ်။ ကမ္ဘာသုံးစံ ဖြစ်လို့ပါပဲ။ ထိုနည်းတူစွာ မြန်မာစာ၊ မွန်စာ၊ ရှမ်းစာ၊ ကရင်စာ ဘယ်လိုစီတယ်ဆိုတာ သိဖို့ ယူနီကုဒ် ကွန်ဆော့တီယမ်က ချပေးထားတဲ့စံတွေကို စံ အဖြစ် အကောင်အထည်ဖော်ပေးနေတဲ့ စံ အဖွဲ့အစည်းတွေ စံ ပရောဂျက်တွေ ရှိပါတယ်။ စာလုံးစီနည်းကို Locale တစ်ခုစီအတွက် စီလို့ရအောင် အသင့်သုံးနိုင်တဲ့ နည်းပညာတွေ ပြုလုပ်ပေးနေတဲ့ ICU CLDR ပရောဂျက်တွေ ဖြစ်ပါတယ်။

မြန်မာကို ၁ ကနေစလို့ အစဉ်လိုက် စီနိုင်အောင် သူတို့က အသင့်လုပ်ပေးပါတယ်။ ထိုနည်းတူစွာ မြန်မာပါဠိ Locale အတွက် တောင်းဆိုမှုတွေ ရှိလာရင် အ ကနေ ပြောင်းပြန် ပြန်စဉ်လို့ရအောင် သူတို့ လုပ်ပေးနိုင်ပါတယ်။ ထိုနည်း တူစွာ မွန်စာမှာ သရအနေနဲ့သုံးတဲ့ဝဏ္ဏတွေ ရှေ့က လာပါတယ်ဆိုလည်း အဲဒီအတိုင်း စဉ်လို့ရအောင် အသင့် လုပ်ပေးနိုင်ပါတယ်။ ဒါပေမဲ့ သူတို့က ယူနီကုဒ်စံ အက္ခရာတွေနဲ့ ယူနီကုဒ်စံ Encoding တွေကိုသာ လိုက်နာမှာ ဖြစ်ပါတယ်။

OSX, Windows, Database system တွေက မြန်မာစာကို Support လုပ်ပြီဆိုတာနဲ့ သူတို့ဟာသူတို့ မြန်မာစာ သင်ပုန်းကြီး လိုက်ဖတ်နေစရာ မလိုပါဘူး။ ICU က အသင့်လုပ်ပေးထားတဲ့ ဒေတာတွေကို အသင့် ကောက်စားလိုက်ရုံပါပဲ။

အခုဖြစ်နေတဲ့ ပြဿနာတွေက မြန်မာနိုင်ငံကို စီးပွားရေးပိတ်ဆို့ထားတာရယ်၊ Copyright ဥပဒေ မရှိသေးတာရယ်ကြောင့် စီးပွားရေးအကျိုးအမြတ်အခွင့်အလမ်း နည်းလွန်းတဲ့အတွက် အဓိက Vendor တွေက မြန်မာစာနဲ့ အခြားတိုင်းရင်းသားစာတွေကို Support လုပ်ဖို့ စိတ်မဝင်စားတာမို့ OS တွေမှာ Native support မရတာကြောင့် လက်တွေ့ပြလို့ မရတဲ့ ပြဿနာပါ။ မြန်မာစာအတွက် ဦးဦးဖျားဖျား ထောက်ပံ့တယ်ဆိုရမဲ့ Open Office ကတော့ မြန်မာစာအတွက်စံကို အသင့်ယူသုံးလိုက်လို့ လက်တွေ့မြင်နေရတာပါပဲ။ Open Office Developers တွေ မြန်မာစာအတွက် သီးသန့် ပရိုဂရမ်တွေ ကြိုးစားပမ်းစား ဆွဲပေးစရာ မလိုပါခင်ဗျား။

ဒီလောက်ဆို ရေးထုံးအတိုင်း စဉ်လို့ ရတယ်မရဘူး၊ တိုင်းရင်းသားစာတွေကို စဉ်လို့ရတယ် မရဘူး ရှင်းလောက်ပြီ ထင်ပါတယ်။

Test More: ICU Burmese sorting Demo

Tags: , ,

· · · ◊ ◊ ◊ · · ·

ယူနီကုဒ်ဖောင့်တွေကို ရိုက်တဲ့အခါမှာ ြမန်မာ၃ဖောင့်အတွက် ဒီဇိုင်းလုပ်ထားတဲ့ ယူနီကုဒ် ကီးဘုတ်လက်ကွက်ဟာ မှတ်သားအရ အလွယ်ဆုံးနဲ့ အရှင်းဆုံး အကျုံ့ဆုံးဖြစ်တာကို သတိထားမိပါတယ်။ မြန်မာစာကို သင်ပုန်းကြီးအတိုင်း ရိုက်လို့ရအောင်လုပ်ပေးထားတဲ့ ဒီလက်ကွက်နဲ့ရိုက်ရင် စာရိုက်တဲ့အမြန်နှုန်း သိသိသာသာ တက်လာတာ သတိထားမိပါတယ်။ မလိုတော့တဲ့ ကီးအပိုတွေ ဖယ်ပြီး ကျုံ့အောင်လုပ်ပစ်လိုက်တဲ့အတွက် အရင့်အရင် လက်နှိပ်စက်၊ ဝင်း၊ ဇော်ဂျီလက်ကွက်တွေနဲ့ ကွဲသွားတာတွေ ရှိပါတယ်။ အဓိက ဝလုံး ယပက်လက် ဂငယ် နေရာတွေ ပြောင်းသွားတာပါ။ မြန်မာစာ စရိုက်တဲ့လူတွေအတွက် ဘယ်လက်ကွက်ထက်မဆို လွယ်ပါတယ်။ တခြားကီးဘုတ်က ပြောင်းတဲ့သူတွေအတွက် နည်းနည်းသတိထားပြီး တစ်ပတ်လောက် ကျင့်ယူလိုက်ရင် ကျွမ်းကျင်သွားမှာပါ။

အခုဒီမှာပြထားတဲ့ လက်ကွက်ပုံကို မြန်မာနိုင်ငံမှာ ဝီကီအရေးဆုံးလူဖြစ်တဲ့ ကိုမြတ်သွင်က မှတ်သားရလွယ်ကူအောင် ရည်ရွယ်ချက်နဲ့ ပြန်ဆွဲပေးထားပါတယ်။ မြန်မာ၃ လက်ကွက်ကို အသုံးပြုတဲ့ စာရိုက်သွင်းနည်း ဆော့ဝဲတွေကတော့ –

၁။ မြန်မာ၃ နဲ့အတူပါလာတဲ့ ကီးမန်းကီးဘုတ်

၂။ ဝင်းဒိုးနဲ့ OSX နှစ်မျိုးလုံးမှာရတဲ့ ကီးမက်ဂျစ်

၃။ ဝိဇ္ဇာစာရိုက်စနစ် တို့ ဖြစ်ကြပါတယ်။

Myanmar3 Unicode Keyboard Layout

Myanmar3 Unicode Keyboard Layout

ဒီပုံကို ဘယ်သူမဆို လွတ်လပ်စွာ ကူးယူဖြန့်ဝေနိုင်ပါတယ်။

Tags: , , ,

· · · ◊ ◊ ◊ · · ·