Interview with Ko Ngwe Tun Part I

ခုလို အင်တာဗျူးခွင့်ပေးတဲ့အတွက် ကျွန်တော့် အနေနဲ့ရော Myanmar Tutorials အနေနဲ့ပါ ကျေးဇူးအများကြီး တင်ပါတယ်။ ကျွန်တော့် အနေနဲ့ကတော့ ကိုငွေထွန်းကို Solveware Solution နဲ့တွဲပြီး သိနေခဲ့တာ ကြာပါပြီ။ မြန်မာ ပြည်ရဲ့ နည်းပညာ နယ်ပယ်မှာ နေရာစုံ ကျင်လည်နေတဲ့ သူတစ်ယောက်ကို မေးခွင့်ရတဲ့အတွက် ကျွန်တော်တို့ MyanmarTutorials အတွက်တော့ MyanmarTutorials ရဲ့ ပရိသတ်တွေ အတွက်ပါ အဖိုးတန်တဲ့ အတွေ့အကြုံတွေ သိရတော့မယ့်အတွက် အထူးပင် ဝမ်းသာ ဂုဏ်ယူမိပါတယ်။

Interview with Ko Ngwe Tun

MyanmarTutorials ပရိသတ်ကြီးနဲ့ ကိုငွေထွန်းကို မိတ်ဆက် ပေးချင်ပါတယ်ခင်ဗျ၊ ကိုငွေထွန်းရဲ့ အကြောင်းကို အတိုချုပ်လေး ပြောပြပေးပါ။ Online Activity တွေ ရှိရင်လည်း ပြောပြပေးပါ။

အဓိက ကျွန်တော့်အကြောင်းဆိုရင် ကျွန်တော်လုပ်ခဲ့တဲ့ လုပ်ငန်းတွေ အကြောင်းပေါ့။ Software ရေးတာကို အဓိက လုပ်ပါတယ်။ Contribution အနေနဲ့တော့ မြန်မာစာ ကွန်ပျူတာပေါ်မှာ သုံးလို့ရဖို့အတွက် လုပ်တယ်။ နောက် Wikipedia လုပ်တယ်။ နောက် Security နဲ့ ပတ်သက်ပြီးတော့ Security ဆိုတာ Computer Security ပေါ့၊ Network Security တွေ မဟုတ်ပါဘူး။ ရိုးရိုး End-user တစ်ယောက် Security Awareness တွေ ဘယ်လို ရှိဖို့လိုလဲဆိုတဲ့ အပိုင်းပါ။ အဲဒါနဲ့ ပတ်သက်ပြီးတော့ ကျွန်တော် စာတွေလည်း ရေးပါတယ်။ လောကအလှ မှာလည်း ရေးတယ်၊ တစ်ခြားနေရာတွေမှာလည်း ရေးတယ်။ ကြံုရင် ကြံုသလိုပေါ့နော်။ ကျွန်တော် သိထားသလောက် ကျွန်တော် တတ်ထားသလောက် ရေးဖြစ်တာပါ။ ကျွန်တော် အလုပ်ကတော့ သုံးခု Subject က Software တွေရေးတယ်၊ အွန်လိုင်းအနေနဲ့ ဆိုရင် Wikipedia တို့ လုပ်ဖြစ်တာ ရှိတယ်၊ Localization လုပ်ဖြစ်တာ ရှိတယ်၊ အပြင်မှာတော့ Security နဲ့ပတ်သက်တဲ့ Training တွေ လုပ်ဖြစ်ပါတယ်။ ဒါ ကျွန်တော့်အကြောင်း အကြမ်းဖျဉ်းပါ။

Natural Language Processing အကြောင်းလေးကို ရှင်းပြပေးပါ။ အဲဒါနဲ့ ဆက်စပ်ပြီး Myanmar NLP အကြောင်းကိုလည်း ရှင်းပြပေးပါ။ (ဘယ်အချိန်က စတင် အကောင်အထည် ဖော်ခဲ့ပါသလဲ။ ဘယ်လို Activity တွေ ဆောင်ရွက်နေပါသလဲ၊ ဘယ်လို Product တွေ ထုတ်လုပ်ဖို့ ရည်ရွယ်ထားပါသလဲ၊ ပြီးတော့ Roadmap တွေ ချမှတ်ပြီး ဆောင်ရွက်နေပါသလဲ)

NLP၊ အတိုကောက်ကတော့ NLP ပေါ့။ အရှည်ကတော့ Natural Language Processing။ Natural Language Processing က ဘာလဲဆိုတာ မပြောခင်၊ Natural ဆိုတဲ့ Word ကို အရင်ဆုံးစပြောရပါမယ်။ ကျွန်တော်တို့မှာ Language တွေ ရှိတယ်။ Programming Language တွေ၊ Speaking Language တွေ၊ နောက် ကျွန်တော်တို့တွေ သိတဲ့ Markup Language တွေ စသည်ဖြင့် Language တွေ အများကြီး ရှိပါတယ်။ အဲဒီလို Language တွေ အများကြီးထဲမှာ ဘယ်လိုပဲ Language တွေ များများ၊ ဘာတွေပဲ ဖြစ်ဖြစ်၊ ဆိုကြပါစို့ ကျွန်တော်တို့ ကျောက်တုံးကြီး တစ်တုံးကို မြင်တယ်ဆိုရင် မြန်မာလို ကျောက်တုံးလို့ ခေါ်မယ်၊ အင်္ဂလိပ်လို Stone လို့ ခေါ်မယ်။ တရုပ်လိုလည်း တစ်ခြား နာမည် တစ်ခုခု ခေါ်မှာ ဖြစ်ပါတယ်။ အဲဒါတွေ အားလုံးမှာ ကျောက်တုံးဆိုတဲ့ အနှစ်သာရကို မပျောက်သွားစေတဲ့ Language နောက်တစ်မျိုး ရှိတယ်။ အဲဒီလို Language ကို Natural Language လို့ခေါ်ပါတယ်။ သူက လူတွေနားလည်တဲ့ Speaking Language လည်းမဟုတ်ဘူး။ စက်တွေ နားလည်ဖို့ Markup Language လိုဟာမျိုးတွေလည်း မဟုတ်တဲ့ Language တစ်မျိုး ရှိပါတယ်။ အဲဒါကို Natural Language လို့ ခေါ်ပါတယ်။ အဲဒီတော့ ကွန်ပျူတာက ဘာမှ မသိဘူး။ သူ့ကို ကျွန်တော်တို့က ဒါကျောက်တုံးလို့ ပြောလို့မရဘူး။ ကျောက်တုံးလို့ ပြောရင် ကျောက်တုံးက Verb လား။ Noun လားလို့ သိဖို့အတွက် သူ့ကို Feed လုပ်ရတယ်။ အဲဒီလို Feed လုပ်ပြီးမှ သုံးရတယ်။ အဲဒီလို လုပ်တဲ့အပိုင်းတွေကို Processing လို့ခေါ်ပါတယ်။ အဲဒီတော့ ကျွန်တော် ပြောခဲ့သလို Natural Language ဆိုတာရှိတယ်။ အဲဒါကို Processing လုပ်တာလည်းရှိတယ်။ အဲဒီနှစ်ခုပေါင်းပြီး Natural Language Processing လို့ ခေါ်ပါတယ်။

Natural Language Processing ဆိုတာ ကျွန်တော်လုပ်တဲ့ Subject တစ်ခုထဲမှာပါပါတယ်။ အဖွဲ့အစည်းအနေနဲ့တော့ အရင်တုန်းကတော့ MCF အောက်မှာ ရှိတယ်။ အခုတော့ ဆက်သွယ်ရေး အောက်မှာပါ။ အဲဒီမှာ ကျွန်တော်သွားပြီး ကျွန်တော် တတ်သိခဲ့တဲ့ နည်းပညာတွေကို Contribution လုပ်ပါတယ်။ Contribution လုပ်တယ်ဆိုတာ လစာနဲ့ ခိုင်းတာကို ကျွန်တော်လုပ်တာ မဟုတ်ပါဘူး။ ကျွန်တော် သိသလောက် သူတို့လုပ်နေတာ တည့်သွားအောက် Adjust လုပ်တဲ့ သဘောအနေနဲ့ ပါဝင်တာပါ။ Part Time လည်း မဟုတ်ပါဘူး။ ဒါပေမယ့် တစ်ခုတော့ ရှိပါတယ်။ အဲဒီကနေ ဘာတွေပြန်ရသလဲ ဆိုရင် Experience တွေ Exposure တွေတော့ ပြန်ရပါတယ်။ ကျွန်တော့်ကို အဲဒီကနေ နိုင်ငံခြားတွေကို လွှတ်တယ်။ လိုအပ်တဲ့ Training တွေ ကျွန်တော့်ကို ပေးခိုင်းတယ်။ Training ဆိုတဲ့နေရာမှာ ကျွန်တော် ကိုယ်တိုင်ကလည်း ပြန်ပေးရတာရှိသလို Training Opportunity တွေ ပေါ်လာရင်လည်း ကျွန်တော့်ကို လွတ်တာတွေ ရှိပါတယ်။

ဘယ်အချိန်လောက်က စခဲ့ကြသလဲဆိုရင် ၂၀၀၃ – ၂၀၀၄ လောက်က စတယ်လို့ ဆိုရမှာ ဖြစ်ပါတယ်။ အဲဒီအချိန်တုန်းကတော့ လူတွေ အတော်တော်များများ ကွန်ပျူတာပေါ်မှာ သုံးလို့ရအောင်လို့ပဲ လုပ်ခဲ့ကြတာပါ။ နောက်ပိုင်းမှ တစ်ဖြည်းဖြည်းချင်း Language Processing Level ဖြစ်အောင် လုပ်လာတယ်။ Language Processing ဆိုတာတော့ ကွန်ပျူတာပေါ် ပေါ်တဲ့အခါ Level သုံးခုရှိတယ်ဗျ။ အဲဒါက ဘာလဲဆိုတော့ ကွန်ပျူတာပေါ်မှာ ရိုက်လို့ နှိပ်လို့ရတဲ့ Level အဲဒီလို ရိုက်ပြီးရင်လည်း Print ထုတ်၊ ရိုက်ရင် ရိုက်တဲ့အတိုင်း ပေါ်တယ်။ Print ထုပ်ရင်လည်း သွားတယ်။ အဲဒီလို Level ကို Enabling လုပ်တယ်လို့ ခေါ်တယ်။ Enabling ရဲ့ နောက်တစ်ဆင့်ကတော့ Recognition၊ စက်ကသိလာပြီ၊ ဒါကတော့ မြန်မာစာပါလား၊ ဒါကတော့ အင်္ဂလိပ်စာပါလား၊ ဒါကတော့ ကုလားစာပါလားဆိုတာ Recognition Level ပါ။ ကျွန်တော်တို့ Level ကတော့ Enabling ပေါ့။ Enabling နောက် Recognition၊ နောက် Level တစ်ခုကကြတော့ Processing၊ တစ်ခြား Language တွေကို ကြည့်မယ်ဆိုရင် Spell Check လုပ်နိုင်လာပြီ၊ Sorting လုပ်နိုင်လာပြီ၊ အဓိပ္ပါယ်တူတဲ့ စကားလုံးတွေကို ရှာပေးနိုင်လာပြီ။ Synonym တွေ ရှာပေးနိုင်လာပြီ၊ Antonym တွေရှာပေးနိုင်လာပြီ၊ Antonym ဆိုတာ ဆန့်ကျင်ဖက် အဓိပ္ပါယ်ရှိတဲ့ စကားလုံးတွေ ရှာပေးတာမျိုးပါ။ ဥပမာ – tall ဆိုရင် Antonym က short ဆိုတာမျိုး ရှာပေးတာ၊ အဲဒီ Level ကို Processing လုပ်နိုင်တယ်လို့ ခေါ်ပါတယ်။ နောက် သူ့ရဲ့ Homonym၊ ဥပမာအားဖြင့် အသံထွက်တူတယ် အဓိပ္ပါယ်ကွဲတယ် အဲဒါမျိုးတွေ ရှာနိုင်တဲ့ စနစ်ကို Processing လုပ်တယ်လို့ ခေါ်ပါတယ်။ အဲတော့ Level တစ်ဆင့်ခြင်းပေါ့။ ဒီထက် ပိုရှင်းအောင် ပြောရရင် “ဝ” လုံးဆိုတာမျိုးဆို စက်ကသိလာတယ်။ ဘေးနားမှာရှိတဲ့ စကားလုံး Neighborhood ကို သိနိုင်တယ်၊ ဘေးနားမှာ ဘာရှိရင် ဘာဖြစ်နိုင်တယ်ဆိုတာ သိနိုင်လာတယ်။ အဲဒီလို အဆင့်ကို Processing လုပ်တဲ့အဆင့်ပါ။

ပြန်ချူပ်ပြောရရင် စတာတော့ ၂၀၀၃ လောက်က စတယ်။ ၂၀၀၃/၂၀၀၄ လောက်က စတယ်။ Computer Industry မှာ ရှိတဲ့လူတွေ ပေါင်းပြီး စခဲ့ကြတယ်။ ကိုဇော်ထွဋ်တို့ ကိုဝေလင်းကျော်တို့ ကိုဝီလျှံတို့ နောက် ကျွန်တော်တို့ နောက် ကိုတင်မျိုးထက်တို့ နဲ့ စခဲ့ကြတယ်။ အဓိကကတော့ ကွန်ပျူတာ နယ်ပယ်မှာ Font ဆိုတာနဲ့ ကျွမ်းဝင်ပြီးသား လူတွေကနေ စခဲ့ကြတာပါ။ စခါစတုန်းကတော့ နာမည်ဘာပေးရမလဲလို့ ရွေးကြရင်း Myanmar Unicode and NLP Research Center လို့ ပေးခဲ့ကြပါတယ်။ ဘာကြောင့် NLP ကို Research လုပ်ဖို့လိုလဲဆိုတာ အဲဒီအချိန်လောက်တုန်းက တစ်ယောက်နဲ့ တစ်ယောက် သုံးလို့ရတယ် ဆိုတဲ့ Level မှာပဲ ကျေနပ်နေကြတယ်။ သုံးလို့ရတယ် ဆိုတာက ၉၈ လောက်ကတည်းက ရှိခဲ့ပြီး အဲဒီထက် ပိုမတက်လာဘူး။ အဲဒီတော့ ကျွန်တော်တို့တွေက မြင်လာတယ်။ အဲဒီထက်တော့ ပိုပြီးတော့ တက်လာဖို့ လိုပြီ။ သုံးမယ်ဆိုလည်း Enabling Level မှာ ရပ်နေဖို့ မဟုတ်ပဲ ဒီထက်ပိုပြီး အဆင့်မြင့်ဖို့ လိုလာပြီလို့ စဉ်းစားပြီး (ဆရာကြီး ဒေါက်တာ ကျော်သိန်းရဲ့ Organize လုပ်တဲ့အချက်လည်း အဓိကကျပါတယ်) စဖြစ်ခဲ့ပါတယ်။ အဲဒီကနေ လုပ်ရင်း လုပ်ရင်းနဲ့ နိုင်ငံတော်ပိုင်းက အားပေးအား မြှောက်ပြုတဲ့အထိ ဖြစ်လာခဲ့ပါတယ်။ မြန်မာလူမျိုးတွေအတွက် မြန်မာလို သုံးလို့ရဖို့ဆိုတာ ဖြစ်ကို ဖြစ်သင့်တဲ့အရာလို့ အားပေးတာတွေ ဖြစ်လာပါတယ်။

အပေါ်မှာတော့ ပြောခဲ့ပါတယ်။ ကျွန်တော်တို့ရဲ့ အဆင့်က Enabling အဆင့်လို့။ ဒါပေမယ့် ဒီနေရာမှာ ထပ်မေးပါရစေ။ ကျွန်တော်တို့ အခု ဘယ်အဆင့် ရောက်နေပြီလဲခင်ဗျ။

ခု အနေအထားကတော့ ဘယ်လိုပြောရမလဲဆိုရင် Enabling အဆင့်နဲ့ Processing အဆင့်ကြားထဲ ရောက်နေပြီလို့ ဆိုနိုင်ပါတယ်။ ခုချိန်မှာ Processing လုပ်လို့ရနိုင်တဲ့ ဟာတွေလည်း ပေါ်လာပါပြီ။ Recognition Level လည်း တစ်ချို့ တစ်ဝက်ရောက်ပြီလို့ ပြောလို့ရပါတယ်။ ကျွန်တော်တို့က နောက်ကျတဲ့အခါကျတော့ ဘာပြီးတော့ ဘာသွားမယ်ဆိုတဲ့ အစား ကျွန်တော်တို့ ဘယ်လိုသွားကြသလဲဆိုတော့ အရင်လိုတာဘာလဲ အဲဒါကို အရင်လုပ်။ အရင်လိုတာက Machine Translation ဆို Machine Translation ချကြတယ်။ တကယ်ကတော့ဗျာ အပေါ်ဆုံးထပ်က စပြီး အိမ်ဆောက်တယ်ဆိုတာ မကောင်းပါဘူး။ Underground လုပ်၊ ပြီးမှ တစ်ဆင့်ပြီး တစ်ဆင့် အပေါ်ကို တက်သွားတာမျိုး ဖြစ်သင့်တာပေါ့။ ဒါပေမယ့်လည်း ကျွန်တော်တို့က ဘာပြန် စဉ်းစားမိလဲဆိုတော့ လိုအပ်ချက်အရ ကဲ ဟုတ်ပြီး အပေါ်ဆုံးထပ် ရောက်တော့မှ အဲဒါကြီးက မှားနေတယ်ဆိုရင် ဘယ်လိုလုပ်မလဲဆိုပြီး အပေါ်ဆုံးထပ် အတွက်လည်း စဉ်းစားကြည့်ပါတယ်။ အပြင်မှာ စမ်းသပ်ကြည့်ပါတယ်။ အဲဒီလိုမျိုးတွေ ရှိပါတယ်။

Myanmar Font တွေအနေနဲ့ နိုင်ငံတကာက လက်ခံပြီး စာရင်းသွင်းတဲ့အထိ ဖြစ်လာအောင် ဘာတွေ လုပ်ဖို့ လိုမလဲ။ ဥပမာ Windows မှာဆိုရင် ခုချိန်ထိ Myanmar Font ကို စာရင်းမသွင်းသေးပါဘူး။ အဲဒီလို စာရင်းမသွင်းတာ ဘာကြောင့်ပါလဲခင်ဗျ။

ဒါလည် တကယ်ကကြတော့ ဒီလိုဗျ။ မြန်မာစာပေါ်ဖို့ ဆိုရင် Basic Component သုံးခုရှိပါတယ်။ အဲဒီ Basic Component သုံးခုမှာ ပထမဦးဆုံး တစ်ခုက မြန်မာစာပေါ်ဖို့ အဲဒီ Device က မြန်မာစာကို သိရမယ်။ အဲဒီ Device ထဲမှာ ဖောင့်ဆိုတာ ရှိရမယ်။ စက်ထဲမှာ ဖောင့်မရှိပဲ မြန်မာစာပေါ်တယ်ဆိုတာ မဟုတ်ဘူး။ ဒီစက်ထဲမှာ မရှိရင် တစ်ခြား စက်၊ အဝေးကြီးက စက်တစ်ခုထဲမှာ ရှိကို  ရှိရပါမယ်။ နောက် တစ်ဆင့်ကကြတော့ အဲဒီ မြန်မာစာကို သိတဲ့ စနစ် အခြေခံစနစ် ရှိရမယ်။ အဲဒါကို ကျွန်တော်တို့က Rendering Engine လို့ခေါ်တယ်။ အဲဒါလည်း ရှိရမယ်။ နောက်တစ်ခုကတော့ Device ထဲမှာ ထည့်ပေးဖို့ မြန်မာစာ ဖောင့်ကို ကျွန်တော်တို့က ထွင်နိုင်တယ်။ Rendering Engine ကိုလည်း OS မှာ ရေးနိုင်တယ်။ ဒါပေမယ့် အဲဒီဟာ နှစ်ခုရှိပါတယ်လို့ Recognition ကိုလည်း OS Vendor က အသိအမှတ်ပြုရမယ်။ အဲဒီလို သုံးဆင့်လိုပါတယ်။

အဲဒီတော့ အကို မေးတဲ့ မေးခွန်းကို ပြန်ကြည့်ပြီး ဖြေရမယ်ဆိုရင် နိုင်ငံတကာက လက်ခံတယ်။ အပွင့်လင်းဆုံးပြောရရင် နိုင်ငံတကာက လက်ခံနေပြီလို့ ပြောလို့ရတဲ့ အနေအထားမှာ ရှိပါတယ်။ ဒါပေမယ့် OS ထဲမှာ ပါဖို့ကတော့ အဲဒီ OS ကို ထုတ်တဲ့ Vendor ရဲ့ လက်ခံတဲ့အပေါ် လုပ်ဆောင်ချက် အပေါ်ပဲ မူတည်ပါတယ်။ သူတို့မှာ Process တွေ ရှိတယ်။ ဆိုပါစို့ OS ထဲကို ထည့်ပေးသင့်၊ မထည့်ပေးသင့် စဉ်းစား တာတွေရှိတယ်။ အကယ်၍ ထည့်ပေးလိုက်တဲ့အခါ ရောင်းအားက ဘယ်လောက်ရှိလဲ စဉ်းစားပါလိမ့်မယ်။ ဆိုပါစို့ အကယ်၍ အကိုသာ Microsoft ဆိုရင် ကိုယ်မရောင်းရတဲ့ နိုင်ငံအတွက် ထည့်ပေးဖို့ဆို ခဲယဉ်းပါလိမ့်မယ်။ သူတို့ အနေနဲ့ထည့်ပေးမယ်ဆိုရင်လည်း ရိုးရိုးထည့်ပေးလို့ ရတာမဟုတ်ဘူး။ Services တွေ ပေးရမယ်။ အဲဒီတော့ မထည့်ပေးရင် အကောင်းသား၊ ထည့်ပေးလိုက်မှ တစ်ခြား Services တွေ ပေးရမယ်။ Right တွေ ပေါ်လာနိုင်တယ်။ Flaw တွေ ပေါ်လာနိုင်တယ်။ Error တွေ ဖြစ်နိုင်တယ်ဆိုတဲ့ အခြေအနေတွေကို စဉ်းစားမိတဲ့ အခါမှာ ကျွန်တော့် အမြင်အရ Windows ခု နောက်ဆုံးထွက်တဲ့ Windows 7 အထိ မပါလာခဲ့ပါဘူး။ ဒါပေမယ့် ကျွန်တော်တို့ ထည့်ပြီး သုံးရင် သုံးလို့ ရပါတယ်။ Myanmar Fonts တွေ ထည့်သုံးချင်ရင် သုံးလို့ရပါတယ်။

တစ်ဖက်က ပြန်ကြည့်ရင်လည်း အဲဒီလို မပါတဲ့အတွက် လူတိုင်း ကြိုက်တဲ့ဖောင့်ထည့်သုံးပြီး Standard လိုက်နာခြင်း မလိုက်နာခြင်းတွေကို Enforce မလုပ်နိုင်တော့ဘူး။ အဲဒါတစ်ခု သွားတွေ့ရတယ်။ နောက်တစ်ခုက ဘယ်ဟာက Standard Font လဲဆိုတဲ့ အငြင်းအခုန်တွေက အမြဲတမ်း ဖြစ်နေရပါတယ်။ အဲဒီ နှစ်ချက်အရ Analysis ပြန်လုပ်ကြည့်တော့ ကျွန်တော်တို့ မြန်မာဖောင့်တွေကို စာရင်းမသွင်းဘူး။ Accept မလုပ်ဖူးဆိုတာတော့ တကယ်ပဲ။ အမှန်ပါပဲ။ ဘယ်ဖောင့်ကိုမှ မလုပ်သေးပါဘူး။ ဒါပေမယ့် စာရင်းသွင်းနေတဲ့ နေရာတော့ ရှိပါတယ်။ အဲဒါက ဘာလဲဆိုတော့ Unicode ပါ။ ကျွန်တော်တို့ ပြန်ပြောရရင် မြန်မာဖောင့်တွေအတွက် အခြေခံ Basic Unit က Encoding ပါ။ Encoding ဆိုတာ ဘယ်နေရာမှာ ဘာတွေ ချမယ်ဆိုတာ သတ်မှတ်ထားပါတယ်။ အဲဒီလို သတ်မှတ်တဲ့ အဖွဲ့အစည်းတွေရှိပါတယ်။ Unicode နဲ့ ISO ပါ။ Unicode နဲ့ ISO ကတော့ ကျွန်တော်တို့ကို ဘယ်နေရာမှာ သုံးဆိုတာ သတ်မှတ် ပေးထားပါတယ်။ အဲဒီလို သတ်မှတ်ပြီးတဲ့ အခါမှာ ဘယ်ဟာတွေကတော့ ငါတို့လက်ခံပါတယ်လို့ ပြောတဲ့ စနစ်တွေလည်း ရှိပါတယ်။ ငါတို့တော့ လက်ခံတယ်။ ဒါက Unicode အစစ်ပဲ စသည်ဖြင့် အဲဒီလို လက်ခံနေတာ လည်းရှိပါတယ်။

သို့ပေမယ့် ကျွန်တော်တို့ ပြောခဲ့တဲ့ OS Vendor ကတော့ မဟုတ်ပါဘူး။ OS Vendor က သူ့ OS ထဲမှာ အဲဒီဖောင့်ကို ထည့်မပေးထားဘူး။ ဥပမာ Mac ပေါ်မှာ ဖောင့်တစ်ခု အသစ်လုပ်၊ ပြီးရင် သုံးလို့ရပါတယ်။ အဲဒီလိုပဲ Windows ပေါ်မှာ ဖောင့်တစ်ခု အသစ်လုပ် သုံး၊ ဒါမှမဟုတ် Linux မှာလည်း ဖောင့်အသစ်တစ်ခုလုပ်၊ သူပြောတဲ့ Standard အတိုင်း ဘယ်နေရာမှာ ချဆိုချ၊ ပြီးရင် သုံးလို့ရပါတယ်။ အဲဒီတော့ ကျွန်တော်က ပြန်ပြောရရင် မြန်မာဖောင့် အနေနဲ့ OS Vendor တွေက အသိအမှတ် မပြုဘူး။ နိုင်ငံတကာကတော့ အသိအမှတ်ပြုတယ်။ OS Vendor တွေက အသိအမှတ် မပြုပေမယ့်လဲ ကျွန်တော်တို့တွေ အနေနဲ့ နှစ်ပေါင်းများစွာ သုံးလာခဲ့ကြတာ မဟုတ်လား။ Win ဆိုလည်း အသိအမှတ်ပြုလို့ သုံးခဲ့ကြတာမှ မဟုတ်တာ၊ ဟုတ်တယ်နော်၊ CE ဆိုလည်း အသိအမှတ်ပြုလို့ သုံးခဲ့ကြတာ မဟုတ်ဘူး။ အဲဒီနည်းနဲ့ပဲ ကျွန်တော်တို့ သုံးလို့ရနေပါတယ်။ နောက်တစ်ခုက Politic ပိုင်း၊ သူတို့တွေမှာ မြန်မာနိုင်ငံနဲ့ စီးပွားရေးမလုပ်ရဘူးဆိုတဲ့ ပိတ်ဆို့မှုတွေ ရှိနေပါတယ်။ အဲဒါကလည်း သွားပြီး Impact ဖြစ်နေပါတယ်။ ဒါပေမယ့် ကျွန်တော် စဉ်းစားတာက မြန်မာစာဆိုတာ ဘာသာစကားပါ။ နိုင်ငံမဟုတ်ပါဘူး။ ဘယ်သူဖြစ်ဖြစ်၊ ဂျာမန်ကြီးပဲ ဖြစ်ဖြစ်၊ ပြင်သစ်ကြီးပဲ ဖြစ်ဖြစ် မြန်မာစာ သိချင်ရင် မြန်မာစာကို ကြည့်ဖို့လိုမှာပါပဲ။ အဲဒီတော့ ဘာသာစကားဆိုတာကို တားမြစ်တားမြစ်တာ မကောင်းပါဘူး။ ဒါပေမယ့်ဗျာ OS Vendor အပေါ်မှာပဲ မူတည်နေပါတယ်။ ခုလက်ရှိ ဖောင့်တွေကို တစ်ချိန်ကြရင် OS Vendor က ထည့်ပေးလိုက်တဲ့အခါ အားလုံး ငြိမ်ကျသွားပြီး အဲဒါကိုပဲ ပြောင်းသုံးကြရမှာပေါ့။

အဲဒီအချိန် သူတို့က လက်ခံနိုင်တဲ့ အနေအထား ဖြစ်လာပြီ။ OS ထဲလည်း ထည့်ပြီးဆိုရင် ဘယ်လိုဖောင့်မျိုးကို ထည့်မယ်လို့ ထင်ပါသလဲ။ Unicode ကိုပဲ လက်ခံမယ့် အနေအထားမှာ ရှိနေပါသလား။

ကျွန်တော်တို့ စကားပြန်ကောက်ရအောင်။ ကျွန်တော် ခုနက ပြောခဲ့တဲ့ အချက်တစ်ချက် ရှိပါတယ်။ ISO နဲ့ Unicode တွေက စနစ်တစ်ခုလုံးကို သတ်မှတ်ပါတယ်။ ISO က Software တွေ Hardware တွေ အားလုံးအတွက် စံသတ်မှတ် ချက်တွေ ထုတ်ပေးပါတယ်။ အဲဒီတော့ Software Vendor တစ်ယောက်က အကိုရဲ့ စနစ်ကြီးက အရမ်းကောင်းတယ်။ မြန်မာပြည်အတွက် အရမ်းကို သင့်တော်တယ်။ ဒါပေမယ့် အဲဒီဟာက ISO နဲ့ မညီဘူးဆိုရင် Software Vendor က သုံးမှာ မဟုတ်ပါဘူး။ ဘာကြောင့်လဲဆိုတော့ သူတို့အနေနဲ့ တစ်ခြားနေရာတွေကို ရောင်းဖို့ရှိတယ်။ အဲဒီအခါ ISO နဲ့ မညီထားတဲ့အတွက် ပြဿနာတွေ ရှိလာနိုင်ပါတယ်။ ISO ညီတယ်လို့ ပြောပြီး ရောင်းမှ ဖြစ်မှာပေါ။ ဥပမာ – CD တစ်ချပ်၊ ကိုယ်က ပိုကောင်းအောင်ဆိုပြီး အကြီးကြီး ထုတ်တယ်ထားဦး။ စံသတ်မှတ်ချက်နဲ့ မညီတဲ့အတွက် သုံးလို့ရမှာ မဟုတ်ပါဘူး။ အဲဒီတော့ သူတို့ တကယ် သုံးခဲ့သည် ရှိသော် Unicode ကိုပဲ သုံးပါလိမ့်မယ်။

English Font တွေမှာဆိုရင် Standard တစ်ခုတည်းနဲ့ ဖောင့်မျိုးစုံကို သုံးလို့ရနေတာ ကြာပါပြီ။ Myanmar Fonts တွေအနေနဲ့ အဲဒီလို Standard တစ်ခုတည်းနဲ့ ပုံစံမျိုးစုံ သုံးလို့ မရသေးတာ ဘာကြောင့်ပါလဲ ခင်ဗျ။

မြန်မာစာမှာ ဆိုရင်လည်း Myanmar Unicode လို့ သုံးရင် ရပါတယ်။ ပိတောက်၊ Myanmar 3၊ ပုရပိုဒ်၊ Masterpiece အကုန် အတူတူပါပဲ။ အဲဒီ ဖောင့်တွေ အကုန်လုံးကိုလည်း Free ပေးထားပါတယ်။ Open Source တွေလည်း ဖြစ်ပါတယ်။ Free တင်မဟုတ်ပါဘူး။ Open Source ပါ ပေးထားပါတယ်။ အဲဒီလို Font တွေမှာ တစ်ယောက်နဲ့ တစ်ယောက် နည်းနည်းလေးတွေ လွဲတာ ရှိကောင်းရှိပါလိမ့်မယ်။ အဓိက ကွဲလွဲနိုင်တာက စတိုင်ပါ။ ပုံစံပေါ့။ ကျန်တာတွေက အကုန် အတူတူပါပဲ။ တစ်နေရာမှာ ရိုက်ပြီး နောက်ဖောင့်တစ်မျိုးနဲ့ ပြောင်းပြီးကြည့်လဲ ဒီအတိုင်းပဲ ပေါ်မှာ ဖြစ်ပါတယ်။

နောက်တစ်ခုက အဲဒီ ဖောင့်တွေ အားလုံးက ISO ရဲ့ Standard ကို လိုက်နာပါတယ်။ ISO ရဲ့ Standard ကို လိုက်ခြင်း အားဖြင့် တစ်ခြား Application Development တွေမှာ အဆင်ပြေသွားမယ့် သဘောရှိပါတယ်။ ဒါပေမယ့် လူတော်တော်များများက အစွဲကြီးပါတယ်။ ဘယ်လို အစွဲကြီးလဲဆိုတော့ ငါလုပ်တဲ့ဟာမှ အကောင်းဆုံးလို့ ထင်တယ်။ ကျွန်တော်လည်း ထင်ပါတယ်။ ဒါပေမယ့် တစ်ခါတစ်လေ့မှာ ညှိကြရတော့မယ်ဆိုရင် အဲဒီလို လုပ်လို့ မရတော့ပါဘူး။ ဥပမာ ပြောရရင် လက်ချောင်းတွေက အတိုအရှည် မတူပါဘူး။ ညီချင်တယ်ဆိုရင်တော့ တစ်ချို့တွေက ကွေးသင့်ရင် ကွေး ဆန့်သင့်ရင် ဆန့် လုပ်ပေးဖို့ လိုပါတယ်။ အဲဒီလို လုပ်နိုင်ကြရင်တော့ အားလုံးညီသွားပါလိမ့်မယ်။ အဲဒီလိုပဲ အားလုံးအတွက် အဆင်ပြေပြေနဲ့ သုံးလို့ဟာမျိုး တစ်ခုလုပ်ဖို့ အတွက်တော့ လုပ်တဲ့သူတွေ မှာ အခက်အခဲ ရှိပါလိမ့်မယ်။ အဲဒီလို အခက်အခဲရှိတဲ့ အပေါ်မှာ မူတည်ပြီး ဒါမှမဟုတ်လည်း ပျင်းပြီး သူများလုပ်ထားတာတွေ မကြည့်ပဲ ကိုယ်လုပ်ထားတာ အမှန်ပဲလို့ ယူဆပြီး ဘယ်သူမှလည်း မတိုင်ပင်၊ ကိုယ်ဟာကို ချလိုက်ရင်တော့ မရဘူးလားဆိုရင်တော့ ရပါတယ်။ နောက် မကောင်းတဲ့ Method တွေနဲ့ မကောင်းတဲ့ Approach တွေ သုံးမယ်ဆိုရင်တော့ ပေါ်ပြူလာ ဖြစ်တာပေါ့။ အဲဒါကလည်း ရေပွက် ခဏပါပဲ။ အဲဒီလို ဆိုရင်လည်း လူတွေက သူ့ကို လေးစားမှာ မဟုတ်ပါဘူး။ နောက် International ကလည်း Recognition မရှိဘူးပေါ့။ မင်းလုပ်နိုင်လား။ အော်ဟုတ်ပြီ။ နောက်ဆုံးမှာ မေးတာက မင်းဟာက ISO နဲ့ ညီလားဆိုရင်၊ ISO ဆိုတာ ဘာလဲ ပြန်မေးနေရတဲ့ အခြေအနေဆိုရင် မဖြစ်သင့်ပါဘူး။

ကိုယ်လုပ်တဲ့ဟာ အတွက် မြင်းစီးပြီး အထီးလား၊ အမလား သိသင့်ပါတယ်။ နောက် အကြမ်းစီးဖို့ အတွက်ဟာကို အကြမ်းအနေနဲ့ပဲ ထားသင့်ပါတယ်။ အဲဒီလို အကြမ်းကို ရေရှည်အတွက် ဆိုပြီး မလုပ်သင့်ပါဘူး။ ရောင်တန်း မလုပ်သင့်ပါဘူး။ ရောင်းတန်ုး ဆိုရင်လည်း တစ်ချိန်ကြ ပြဿနာ တက်မှာပါပဲ။ စံမှ မမှီတာ၊ စံမမှီပဲ လုပ်ထားတဲ့အတွက် အဲ.. အဲဒီမှာ စံဆိုတဲ့  စကားပြောတဲ့အတွက် ကြီးကြီးကျယ်ကျယ် စကားပြောတယ်လို့ ခဏခဏ အပြောခံထိပါတယ်။ ဒါပေမယ့် စံမရှိတဲ့အတွက် အခက်အခဲတွေ အများကြီး ကြံုရပါတယ်။ ဥပမာ – ရန်ကုန် အဝေးပြေးကားလမ်းသစ်မှာ ဆိုရင် ကားမောင်းနေတဲ့ လူက ကီလိုမီတာနဲ့လား မိုင်နဲ့လားဆိုတာ မသိဘူး။ အဲဒီတော့ ၈၀ ကီလိုမီတာထက် ကျော် မမောင်းရ၊ ၆၀ မိုင်ထက် ကျော်မမောင်းရဆိုပြီး Label နှစ်ခု တပ်ရပါတယ်။ အလုပ်တွေက နှစ်ဆ နှစ်ဆ ပိုစေပါတယ်။ နောက်လုပ်ရမယ့် လူတွေမှာလည်း ဘာနဲ့ လုပ်ရမလဲဆိုတဲ့ တွေဝေမှုတွေ ဖြစ်စေပါတယ်။

အကို ခုနက မေးတဲ့ မေးခွန်းကောင်းပါတယ်။ အင်္ဂလိပ်ဖောင့်လို မြန်မာဖောင့်တွေ ပုံစံတစ်ခုတဲ့ ဘာကြောင့်မဖြစ်ရတာလဲဆိုတဲ့ မေးခွန်း။ ဒီတော့ ပြန်ဖြေရရင် Standard အတိုင်း လိုက်နာတယ်ဆိုရင် ဖြစ်ပါတယ်။ ဖြစ်ကို ဖြစ်ရပါလိမ့်မယ်။ Standard ကို မလိုက်နာရင်တော့ အဲဒီလို ကွဲပြားမှုတွေ ဖြစ်နေဦးမှာပါပဲ။ အဲဒီအတွက် အလုပ်တွေလည်း နှစ်ဆ၊ နှစ်ဆ ဖြစ်နေဦးမှာပါပဲ။ ဒါကတော့ အပြင်မှာလည်း ဖြစ်နေပါတယ်။ ဥပမာ – ဖိနပ်စီးတယ်ဆိုပါစို့။ အကိုက စက်ယက္ကန်းစီးတယ်။ ကျွန်တော်က ဆင်ခြောက်ကောင် စီးတယ်။ နံပါတ်ကတော့ အတူတူပဲ။ ဒါပေမယ့် တကယ်တန်းမှာတော့ စက်ယက္ကန်းက နံပါတ် ၁၀ နဲ့ ဆင်ခြောက်ကောင် နံပါတ် တစ်ဆယ်မတူပါဘူး။ ကိုယ်က စက်ယက္ကန်း ၁၀ စီတိုင်း ဆင်ခြောက်ကောင် ၁၀ သွားဝယ်ရင် အဆင်ပြေမှာမဟုတ်ပါဘူ။

ကျွန်တော်တို့ Culture ကိုယ်တိုင်ကလည်း heroism ပါ။ ကိုယ်လုပ်တဲ့ဟာကိုမှ ကောင်းတယ်လို့ ထင်တယ်။ ကိုယ့်ရဲ့ အတိုင်းကသာ အမှန်ဆုံးလို့ ထင်တယ်။ ကိုယ့်အိမ်ကလူနဲ့ တိုင်းပြီး နံပါတ်တွေ ထုတ်ခဲ့ကြသလားတော့ မသိဘူးပေါ့။ ကျွန်တော်မြင်တာက ခုနောက်ပိုင်း Standard ဆိုတာ စကားပြောလာပါတယ်။ ဘယ်သူတွေ ဘာပဲ လုပ်လုပ် အရင်ဆုံး International Standard ကို လေ့လာပြီး လုပ်ဖို့ လိုလာပါတယ်။ အဲဒီလိုမှသာ တစ်ယောက်နဲ့ တစ်ယောက် Data တွေ Interchange လုပ်ရတာ လွယ်မှာ ဖြစ်ပါတယ်။ အဲဒီလိုမဟုတ်ပဲ ကိုယ်နဲ့ တိုင်းပြီး ကိုယ့် Standard နဲ့ ကိုယ်ပဲဆိုရင်တော့ မပြောတတ်ဘူးပေါ့။ လူတွေက Standard ကို မကြိုက်ဘူးလားဆိုရင် ကြိုက်ကြပါတယ်။ လူတိုင်းမေးကြည့်ပါ။ Standard ကို ကြိုက်လားဆိုရင် ကြိုက်တယ်လို့ပဲ ဖြေကြပါတယ်။ ဒါပေမယ့် လိုက်နာဖို့တော့ ခက်နေတတ်ပါတယ်။

ဆက်ပါဦးမယ် …

Facebook comments:

5 Responses

  1. fokhwar says:

    ကျေးဇူးပဲကိုသီဟရေ
    အစ်ကို့ အင်တာဗျူးတွေက တကယ်ကို ဗဟုသုတရပါတယ် ကျွန်တော်တို့လို့ အခုမှစလေ့လာတဲ့လူတွေအတွက်လဲ တကယ်ကို တန်ဖိုးရှိပါတယ် မြန်မာကျူတိုရီရယ်ကို အမြဲတမ်း update ဖြစ်အောင်ကြိုးစားနိုင်တဲ့အတွက်လဲ လေးစားပါတယ်

  2. Lionslayer says:

    When is partII coming?

    • Thiha says:

      အသားကုန်ကို ရိုက်နေပါကြောင်းခင်ဗျ။ ခဏလေးစောင့်ပါခင်ဗျာ။ တင်ပေးပါ့မယ်ခင်ဗျ။

  3. thettun says:

    နှစ်ယောက်လုံးကို ကျေးဇူးတင်ပါတယ်ခင်ဗျာ
    part II ကိုစောင့်မျှော်နေပါ့မယ်
    :)

Leave a comment


*