23 Jul 2011

Currently, there are only two active Wikimedia Projects for Burmese language, Wikipedia and Wiktionary. I want to expend one more for Wikisource. Wikisource is an online library of free content publications, collected and maintained by Wiki community. Myanmar is a culture-rich country with lots of classical writings. I think it will be better if all the artistic writings of the past can be archived in a single place which is easily accessible. I see no other sources for archiving other than Wikisource itself.

I want Tripiṭaka in Burmese texts along with Burmese translations to be uploaded to Wikisource as well. is maintaining the Tripiṭaka in multiple languages. But Burmese-pali texts are in Myanmar1(Unicode 4) texts. Those texts needs to be properly converted to current standard as well. In comparison, is doing the good job maintaining the translations of Bible in various languages inside Myanmar.

The main issue here is we have only a handful of people who are actively contributing to Wiki projects. It will be better if we get some more recruits. I thought font issue was a problem in contributing Wiki. But it seems I guess wrong. Wikimyanmar site which can be written in Zawgyi encoding has little updates anyway.

Another issue is Copyright issues. I don’t want people to upload copyrighted materials to Wiki projects. Normally it seems there is no problem if we use a copyrighted material under fair use. But it’s an ethical issue and I don’t want to mix up the good works with unwanted attentions. Myanmar practices TRIP which means we can upload the publications to public domains after 50 years of author’s death. For example, we can upload Myo Ma Nyein(1909-1955)’s songs (texts) while we can’t upload Thakin Ko Daw Hmine(1876-1964)’s poems until 2014. We may need to list a datasheet of death years of Writers. I see no other than Ko Myat Thwin for this list.

Another issue is setting up an Incubator for new language at Meta before we get approval. Currently, not many Myanmar Wikipedians are active on Meta. If that’s the case, I might as well do it but I’m just a lazy bun in this kind of formal things ##.

“Today, Myanmar Wiktionary reaches 100,000 words!”

Myanmar Wiktionary 100K plus

I started contributing to Wiktionary at the end of last year. It was difficult to maintain a nearly inactive Wiktionary with a couple of regular members. So I decided to make the Wiktionary usable to certain extents first while I tried to recruit new contributors. I collected opensourced dictionary data online such as Ornagai, electrical engineering dictionary porject and Sealang Burmese dictionary. Online community generated data such as Ornagai has a lot of spelling mistakes in it and the format and definitions are inconsistent which need to be improved greatly. Then Myanmar NLP kindly provided me with the Myanmar lexicon database.

Pywikipediabot is a very handy and useful application. I used to run it for fixing minor encoding mistakes in Burmese. Now I used it to upload dictionary data. I spent the Myanmar new year (13th-17th April) formatting the data to Wiki markup. Now Myanmar Wiktionary is available in two languages as English-Burmese and Burmese-Burmese. While bot was uploading data, we tried to improve the homepage design and to add more words which were not in the collected dictionary data. Today, Myanmar Wiktionary reaches 100,000 words.

Unicode Font Usability

It might be confusing that why there are not a lot of Burmese Wikipedians or Wiktionarians. It was a complex drama that there were several pseudo Unicode fonts (they use Unicode codepoints for Burmese, but never follow the codepoints exactly or the encoding order) when standard Unicode fonts were still in development, and one of the pseudo Unicode font named Zawgyi became popular. Unicode fonts are used in Government offices and international projects such as Wikipedia. Yet a normal Burmese online citizen would only use Zawgyi font. We, the Unicode activists, tried to make awareness of Unicode standard and got some achievements as popular IT forums such as MyanmarITPros, Mystery Zillion and Mmitd between 2011 English new year and Burmese new year.

Change to Unicode

Before major OS vendors such as Apple and Microsoft support Burmese language in OSX and Windows, there should be solution for usability of WikiMedia projects for OS unsupported languages.

1. Font embedding

Burmese Unicode sequence

Burmese script is  one of many branches of Brahmi script. It needs complex shaping and reordering of glyphs. So Unicode fonts with proper contextual rendering are necessary. Most of the people don’t have Burmese font or have Burmese font but Zawgyi. They wouldn’t be able to see the Wikipedia or Wiktionary texts or wouldn’t see them properly. So embedded font is needed for reading purpose. There are several opensourced fonts for Burmese in multiple platforms such as Windows, Linux, OSX and iOS. Some of them are cross-OS enabled. OS and browser detection javascripts were developed and TTF, compressed TTF, eot and woff can be embedded accordingly. As I am not a coder, I would be very glad if someone were to develop a font embedding module for mediawiki and implement in local wikis.

2. Build-in keyboard

Even after texts are readable, editing texts in local languages needs special keyboard inputs. Languages such as Burmese needs keyboards with reordering capability. People usually don’t have keyboard installed in their computer or mobile devices. There is a project called Narayam which is a build-in keyboard plugin for mediawiki and I helped writing Myanmar Unicode keyboard for it. There is also a Burmese local project called Keymagic and one of it’s effort was web keyboard. I hope with the help of them, editing Wikipedia even in local language would be possible.


Recruiting for Wiktionary

ဒီနေ့ မြန်မာဝစ်ရှင်နရီ ဝေါဟာရ တစ်သိန်း ပြည့်တဲ့နေ့ဖြစ်ပါတယ်။ လောလောဆယ် ပုံမှန်ဝင်ရေးနေတာ Trh နဲ့ ကျွန်တော် နှစ်ယောက်ပဲ ရှိပါတယ်။ Myanmar NLP က ပေးတဲ့ မြန်မာစာ ဒေတာဘေ့စ် ကို ဝီကီပီးဒီးယားဘော့သုံးပြီး အဓိပ္ပါယ် သတ်မှတ်ချက်တွေကို တင်ပါတယ်။ မြန်မာ ဝီကီပီးဒီးယားနဲ့ မြန်မာ ဝစ်ရှင်နရီ နှစ်ခုအတွက် MgSunBot run ထားတဲ့ Dedicated ကွန်ပျူတာ တစ်လုံး သတ်သတ်ထားပါတယ်။ Encoding ပြင်တာတွေ၊ အင်တာဝီကီလင့် ထည့်တာတွေ၊ ဆောင်းပါးတွေ အလိုအလျောက်တင်တာတွေ လုပ်ပါတယ်။ ဆောင်းပါးတစ်သိန်းမှာ အများစုက အင်္ဂလိပ် ဝေါဟာရတွေဖြစ်ပြီး ငါးပုံတစ်ပုံလောက်က မြန်မာဝေါဟာရဖြစ်ပါတယ်။ မပြောပလောက်တဲ့ ပမာဏကတော့ အခြား ဘာသာစကားတွေ ဖြစ်ပါတယ်။ ဝစ်ရှင်နရီရဲ့ အဓိကရည်ရွယ်ချက်က ကမ္ဘာပေါ်မှာရှိတဲ့ ဘာသာစကားတွေကို ကိုယ့်ရဲ့ Local Language ကို ပြန်ဆိုဖို့ ဖြစ်ပါတယ်။

ဒီမှာ ရှိတဲ့ ဒေတာတွေဟာ Open Content ဖြစ်ပြီး မည်သူမဆို ပြင်ခြင်း၊ ထပ်ထည့်ခြင်း ပြုလုပ်နိုင်ပါတယ်။ XML database dump ကို Download လုပ်ပြီးလည်း ကြိုက်တဲ့နေရာမှာ ယူသုံးနိုင်ပါတယ်။ ကျွန်တော်ကတော့ Wiktionary ကို ဗဟိုထားပြီး Contribute လုပ်ဖို့ အကြံပြုပါတယ်။ Wiktionary ဟာ လက်ရှိမှာ အစုံလင်ဆုံးနဲ့ အလွတ်လပ်ဆုံး မြန်မာ-မြန်မာ-အင်္ဂလိပ် ဒေတာတွေ ဖြစ်ပါတယ်။

Wiktionary ဟာ စာလုံးတွေများနေပြီဖြစ်ပြီး မြန်မာဝေါဟာရတွေဟာ ခိုင်ခိုင်မာမာ အသုံးပြုလို့ရပြီ ဖြစ်ပေမဲ့ အင်္ဂလိပ် ဝေါဟာရ အဓိပ္ပါယ် ဖွင့်ဆိုချက်တွေ၊ Encoding အမှားတွေ၊ အသံထွက်နဲ့ ပြုပြင်စရာ ရှိတာတွေ အများအပြား ရှိတာကြောင့် ပုံမှန်နဲ့ ရေရှည်အကူအညီပေးမယ့် contributor အများအပြား လိုအပ်နေပါတယ်။ ဝစ်ရှင်နရီကို ကူညီဖို့အတွက် အချိန်အများကြီးပေးဖို့၊ ဘာသာရပ်ဆိုင်ရာမှာ တစ်ဘက်ကမ်းခတ် ကျွမ်းကျင်ဖို့ မရှိမဖြစ် မလိုအပ်ပါဘူး။ အောက်ပါနည်းလမ်းများနဲ့ ဝစ်ရှင်နရီကို ကူညီအားဖြည့်နိုင်ပါတယ်။

၁။ IPA  အသံထွက် ပေါင်းထည့်ခြင်း

ရှိပြီးသား မြန်မာစာလုံးတွေအတွက် နိုင်ငံတကာ အသံထွက်သင်္ကေတစံ ဖြစ်တဲ့ အိုင်ပီအေ သင်္ကေတတွေ ပေါင်းထည့်ပေးနိုင်ပါတယ်။ အိုင်ပီအေထည့်ဖို့ ဘာသာဗေဒကျွမ်းကျင်သူ ဖြစ်စရာ မလိုပါ။ မြန်မာ အသံထွက်ရေးနည်းကို ဒီမှာ လေ့လာပြီး ဒီကွန်ဗာတာကို သုံးပြီး အိုင်ပီအေ သင်္ကေတတွေ Generate လုပ်နိုင်ပါတယ်။ ပြီးရင် ဒီပုံစံအတိုင်း အသံထွက်နေရာမှာ တစ်ကြောင်း ဝင်ဖြည့်ပေးနိုင်ပါတယ်။ xxx နေရာမှာ ကိုယ် generate လုပ်ထားတဲ့ အိုင်ပီအေသင်္ကေတကို ဖြည့်ရမှာ ဖြစ်ပါတယ်။


၂။ Encoding ပြင်ခြင်း

မြန်မာစာနဲ့ရေးထားတဲ့နေရာတွေမှာ ရရစ်၊ သဝေထိုးစတာတွေ ရှေ့ရောက်နေတာ၊ ဉလေး နဲ့ အက္ခရာဥ စလုံးယပင့်နဲ့ ဈမျဉ်းဆွဲစတာတွေ လွဲနေတာ တွေကို တွေ့ရင် တွေ့သလို ပြင်ပေးနိုင်ပါတယ်။

၃။ စာလုံးပေါင်းပြင်ခြင်း

အွန်လိုင်းကရတဲ့ ဒေတာတွေဟာ ဗြောက်သောက်ဖြစ်နေတာအပြင်၊ ဝစ်ရှင်နရီမှာ အရင်ကထည့်ထားတဲ့ ဒေတာတော်တော်များများမှာ စာလုံးပေါင်းတွေ မှားနေတာ တွေ့ရပါတယ်။ စာလုံးပေါင်းတွေကိုလည်း ကြုံရင်ကြုံသလို ဝင်ပြင်ပေးသွားနိုင်ပါတယ်။ စာလုံးပေါင်း အကိုးအကားအတွက် ဒီနေရာမှာ မြန်မာသတ်ပုံကျမ်းအတိုင်း တင်ပေးထားပါတယ်။

၄။ စာလုံးအသစ် ထပ်ထည့်ခြင်း

မရှိသေးတဲ့ စာလုံးတွေထည့်မယ်ဆိုရင် ရှိပြီးသား ဝေါဟာရတွေရဲ့ အရင်ရေးထားတဲ့ Format တွေကို ကြည့်ပြီး လိုက်တင်နိုင်ပါတယ်။ အကူအညီမှာ ဝင်ကြည့်နိုင်သလို၊ အကူအညီလိုရင်လည်း ဝင်မေးနိုင်ပါတယ်။

၅။ လင့်ထည့်ခြင်း

ဝီကီတွေရဲ့ အားသာချက်ကတော့ ဝီကီအတွင်းမှာရှိတဲ့ ခေါင်းစဉ်တွေကို အလွယ်တကူ လင့် နိုင်တာပါပဲ။ ဆောင်းပါးတစ်ခုကို တည်းဖြတ်နေစဉ် ကိုယ်လင့်ချင်တဲ့ စာသားကို လေးထောင့်ကွင်းနှစ်ထပ် ခတ်ပေးလိုက်ရုံနဲ့ လင့်ဖန်တီးပြီးသား ဖြစ်သွားပါတယ်။ ဥပမာ [[xxx]]။ ဝီကီစာသားတွေကို လိုအပ်မယ်ထင်တဲ့နေရာတွေမှာ လိုက်လင့်ပေးခြင်းအားဖြင့် ဖတ်ရှုရှာဖွေရ လွယ်ကူပြီး ဆောင်းပါးတစ်ခုနဲ့ တစ်ခု ချိတ်ဆက်မှုလည်း ပိုမို အားကောင်းလာမှာ ဖြစ်ပါတယ်။

၆။ လက်တွေ့သုံးခြင်း

Myanmar wiktionary searchbox

ဝစ်ရှင်နရီမှာ လက်တွေ့သုံးခြင်း၊ မိမိရဲ့ အသိမိတ်ဆွေများကို သတင်းစကားဖြန့်ခြင်းနဲ့လည်း ကူညီနိုင်ပါတယ်။ ဝစ်ရှင်နရီဟာ Opensearch enabled ဖြစ်တာကြောင့် ဝစ်ရှင်နရီ Homepage ကိုသွား၊ ဘရောက်ဆာရဲ့ Search box မှာ Wiktionary (my)  ကို ပေါင်းထည့်ခြင်းဖြင့် ဝစ်ရှင်နရီကို အလွယ်တကူ သုံးနိုင်ပါတယ်။

Wiki need_to_know Basics

Wiki Basics

၁။ ကိုသွားပါ။ မြန်မာဝီကီပီးဒီးယား ရဲ့ Home Page ဖြစ်ပါတယ်။
၂။ ညာဘက်အပေါ်ထောင့် “Log in ဝင်ရန်/ အကောင့် လုပ်ရန်” ကနေ ဝင်ပြီး Register လုပ်ပါ။ အကောင့်မလုပ်လည်း ရေးလို့ရပါတယ်။ ဝီကီက ကိုယ့်ရဲ့ အိုင်ပီကို မှတ်ထားပါလိမ့်မယ်။ အကောင့်လုပ်ရင် ကိုယ်ရေးခဲ့တာတွေ အမှတ်အသားရှိပြီး အလွယ်တကူ စီစဉ်ခန့်ခွဲနိုင်ပါလိမ့်မယ်။
၃။ အကောင့်လုပ်ပြီးလို့ရှိရင် မိမိရဲ့ ကိုယ်ပိုင်နစ်နာမည်နဲ့ စရေးလို့ရပါပြီ။ ညာဘက်အပေါ်က Search Box ထဲမှာ ကိုယ်ရေးချင်တဲ့ ဆောင်းပါးခေါင်းစဉ်ကို ရိုက်ထည့်ပါ။
၄။ ဆောင်းပါးရှိပြီးသားဆိုရင် တစ်ခါတည်း ဆောင်းပါးထဲ တန်းရောက်သွားပြီး “ပြင်ရန်” ကို နှိပ်တာနဲ့ ဆောင်းပါးကို တည်းဖြတ်နိုင်ပါပြီ။ မရှိသေးရင် “ဤဝီကီတွင် “​XXX” အမည်နှင့် စာမျက်နှာကို ဖန်တီးပါ။” ဆိုပြီး အနီရောင်လင့်နဲ့ ပေါ်လာပါလိမ့်မယ်။ အဲဒီလင့်ကို နှိပ်လိုက်ရင် ဆောင်းပါးရေးတဲ့ စာမျက်နှာကို ရောက်သွားပါပြီ။
၅။ ဆောင်းပါးထဲရောက်သွားရင် စရေးလို့ရပါပြီ။ ခေါင်းစဉ်ခွဲ၊ ဖောမတ်နဲ့ ပုံတွေထည့်ပုံထည့်နည်း အသေးစိတ်ကို ဒီမှာ ကြည့်ပါ။ ရေးပြီးသားတွေကို ဘယ်လိုမြင်ရမလဲသိဖို့ အောက်က ဒုတိယခလုပ်ဖြစ်တဲ့ “နမူနာကြည့်ရန်” (Preview) ကို နှိပ်ပါ။ ခဏခဏ ပြင်လိုက်သိမ်းလိုက်လုပ်တာကို ရှောင်ဖို့ ဖြစ်ပါတယ်။ စိတ်တိုင်းကျပြီဆိုရင် သိမ်းပါ။
၆။ ဆောင်းပါးတစ်ခုခုအပေါ် ပြောစရာရှိရင် သူ့ရဲ့ ဆွေးနွေးရန်လင့်ထဲမှာ ဝင်ရေးပါ။ ရေးပြီးသားစာနောက်မှာ ~~~~ (‘~’ သင်္ကေက လေးခု) ရိုက်ပေးထားရင် သိမ်းပြီးတဲ့အခါ ကိုယ့်လက်မှတ်နဲ့ ရေးတဲ့အချိန် ပေါ်လာပါလိမ်ြမယ်။ အထွေထွေ ဆွေးနွေးစရာနဲ့ အကြံပြုချက်တွေကို “လက်ဖက်ရည်ဆိုင်” မှာ ဝင်ပြောနိုင်ပါတယ်။
၇။ ဝီကီရေးနေကျလူတွေကတော့ “လတ်တလောအပြောင်းအလဲ” ကို အရင် ဝင်ကြည့်တာ များတယ်။ ဘယ်သူတွေ နောက်ဆုံး ဘာတွေပြင်သွားတယ်၊ ဘာတွေပြောသွားတယ်ဆိုတာ အလွယ်သိနိုင်ပါတယ်။

ဒါတွေကတော့ ဝီကီရေးသူတွေအတွက် သိထားသင့်တဲ့လင့်တွေပါ။
၁။ လတ်တလော အပြောင်းအလဲ
၂။ မိမိရဲ့ အသုံးပြုသူ စာမျက်နှာ (ဒီမှာ ကိုယ့်အကြောင်း ကိုယ်ရေးပါ။)
၃။ ဆောင်းပါးမာတိကာ
၄။ မသုံးတတ်သေးသူများ လက်တည့်စမ်းရန်နေရာ
၅။ တည်းဖြတ်ခြင်း အသေးစိတ်/အကျဉ်း
၆။ ဝီကီမဏ္ဍိုင်ငါးခု
၇။ တစ်ယောက်ယောက် ဝီကီမှာ ဘယ်လောက်ရေးခဲ့ပြီလဲဆိုတာ သိချင်ရင်
၈။ ဝီကီ စာရင်းချုပ် (Stats)
၉။ ဖိုင်/ပုံ တင်ဖို့။ ဝီကီအားလုံးအတွက် သုံးချင်ရင် Commons မှာတင်။
၁၀။ ကိုယ့်အကောင့်ကိုယ် စိတ်ကြိုက်ပြင်ဖို့ (သို့) ရွေးချယ်စရာများ

Project Rally 2010-10

26 Oct 2010

Translatewiki did a very exciting translation marathon. This was it’s message.

Among all users contributing 500 or more new translations for  MediaWiki, and eligible for a cut, we will divide 1,000 Euro  (approximately 1,409 US Dollar). The money comes from a 2,000 Euro grant  by Wikimedia Nederland, the Dutch Wikimedia Chapter as a part of their spendings on International Projects, to Stichting Open Progress based on a grant proposal to boost MediaWiki localisation through for which we are very grateful.

Please sign your name here if you think you have made 500 or more new translations for MediaWiki or its extensions (check the rules!) between 16 October 2010 00:00 UTC and 23 October 2010 24:00 UTC.

I participated in this rally and got my cut of 39 something over Euro and donated it to Stichting Open Progress. It took me 4 days of hardworking and I was really disturbed  by the news of Cyclone Giri at the last day. Cyclone-hit Kyaukphyu is my home town in which my grandma is currently staying. But I was able to finish it.

Translation rally

I think it’s a good idea to make a Myanmar Wikipedia rally too.

Mifo Translated

15 Oct 2010

Mifos is a diverse community of microfinance institutions, technology professionals, business people, volunteers, and contributors. I was encouraged to translate this project since some NGOs and organizations in Myanmar are using it now.

You may think. “Is translating 10 strings a day too little?” Wrong! At this rate I can translate thousands strings in six months and can finish several projects. Now I’m easily catching up all coming-up new strings for Mifos since I have already finished the rest.


Now it’s over 1k strings coming up. Let’s see.

Completion of localizing MediaWiki

Kyats1000 from Geread as completion reward

I went to Bangkok last Thursday night for Myanmar Wikipedia Unconference. The 3 days workshop was a fun and a success. I will write a detailed post about workshop later. What I want to say here is that I translated all Mediawiki(Most Used) strings in 3 days. It was total around 500 strings and about 30% was roughly done before. So I tried to finish up the remaining and polished the existing translations. This effort made me the top contributor of The wiki geek, Gerard, who attended the unconference blogged about this.

Top Contributor

Top Contributor

MediaWiki is a web-based wiki software application used by all projects of the Wikimedia Foundation, and many other wikis. The fun here is if you translate a string in, you will see your translation instantly in and you will see the updated translation in all projects of Wikimedia Foundation next morning. If anybody is interested in localization of remaining MediaWiki strings, you can help out here. Before you start translating, the important thing is that you need to write an accurate profile of yourself and apply for translation rights. And please make sure to only use Unicode encoding.

Thank you,


