Logical Order သိမ်းသင့် မသိမ်းသင့်

ကျွန်တော် Myanmar Tutorials ကို ယူနီကုဒ် ပြောင်းမယ်ဆိုတော့ ယူနီကုဒ်အကြောင်းကို ဂဃနဏ သိအောင် စာတွေ ဖတ်ဖြစ်သလို Program တွေကိုလည်း စမ်းဖြစ်ပါတယ်။ ကိုယ်စီးတဲ့မြင်း အထီးလား၊ အမလား သိအောင် ဆိုပါတော့။ ယူနီကုဒ်လို့ ဆိုလိုက်တာနဲ့ မြင်းရိုင်းလို့ တင်စားကြပါတယ်။ ဒါကြောင့် အကန်မခံရအောင် သေချာစစ်တဲ့ သဘောပါ။

ယူနီကုဒ်နဲ့ ပတ်သက်ပြီ code point တွေ သတ်မှတ်ထားတာနဲ့ ပတ်သက်ပြီး ကျွန်တော် ရှေ့မှာ ရေးခဲ့တဲ့ ကျွန်တော်လေ့လာမိသမျှ ယူနီကုဒ် အကြောင်းဆိုတဲ့ ဆောင်းပါးမှာ ဖတ်ကြည့်နိုင်ပါတယ်။  ဒီအပိုင်းမှာတော့ Logical သိမ်းသင့် မသိမ်းသင့်ဆိုတဲ့ အကြောင်းကို ရေးသွားမှာ ဖြစ်ပါတယ်။ တစ်ခု ကြိုတင်ပြောထားလိုတာက စာရိုက်တဲ့နေရာမှာ ဆိုလိုတာမဟုတ်ပါဘူး။ စာရိုက်တဲ့နေရာမှာ ဇော်ဂျီစတိုင်ရိုက်မယ်ဆိုရင် ဇော်ဂျီပုံစံ အတိုင်း ရိုက်ရမှာ ဖြစ်တဲ့အတွက် ရိုက်ထုံးနဲ့ ပတ်သက်ပြီး သဝေထိုး အရင်ရိုက်ရတယ်ဆိုတာလဲ မရှိတော့သလို၊ နောက်မှာ ရိုက်ရတယ် ဆိုတဲ့ ပြဿနာလည်း မရှိတော့ပါဘူး။

Rendering လို မလို

မြန်မာစာရိုက်တဲ့အခါမှာ rendering လိုမလို ဆိုတဲ့ ပြဿနာလည်း ရှိပါတယ်။ rendering ဆိုတာကို ရှင်းပြရမယ်ဆိုရင် ရရစ် (သို့) အောက်ကမြင့်နဲ့ ဥပမာပေးကြည့်ပါမယ်။ ရရစ်ဆိုတာ မြန်မာစာမှာ တစ်ခုတည်းရှိပေမယ့် တကယ်တန်း စာရိုက်တဲ့အခါမှာတော့ ရရစ်ကို လုံးကြီးတင်ပါရင် အပေါ်ပိုင်းမှာ ဖြတ်ပေးရမှာ ဖြစ်သလို၊ ဝဆွဲပါရင်လည်း အောက်မှာ ဖြတ်ပေးရမှာ ဖြစ်ပါတယ်။ အဲဒီလို တစ်ခုတည်း တစ်သဘော တည်း ရရစ်ကိုထားမှသာ Data Consistency ဖြစ်မယ်၊ တိကျတဲ့ အချက်အလက် ဖြစ်မယ်ဆိုတာလဲ ဘယ်သူမှ အငြင်းပွားကြလိမ့်မယ် မထင်ပါဘူး။ အဲဒီလိုပါပဲ အောက်ကမြင့်ဆိုရင်လည်း တစ်ခုတည်းရှိပြီး နငယ်မို့တစ်ခု ဝဆွဲမို့ တစ်ခုဆိုတာမျိုးမရှိပါဘူး။ ဒါပေမယ့် တကယ်တန်း ရိုက်တဲ့အခါမှာတော့ လိုအပ်သလို ရွေ့ပေးရပါတယ်။ နောက်တစ်ခုက သဝေထိုးပါ။ တကယ်တန်း သဝေထိုးဆိုတာ ဗျည်းကို မှီနေတဲ့ စာလုံးသာ ဖြစ်ပါတယ်။ ရှေ့ကိုရောက်နေပေမယ့် တကယ်တန်း အရေးပါတာက ဗျည်းပါ။ ဒါကြောင့် ရိုက်တဲ့အခါမှာ ရှေ့မှာ နေပေမယ့် သိမ်းတဲ့အခါမှာ နောက်မှာ သိမ်းရမှာ ဖြစ်ပါတယ်။ အဲဒီလို ရှေ့ဖက်မှာစီလိုက် နောက်ဖက်မှာ ရေးလိုက် လုပ်ရတာ မြန်မာစာအတွက် rendering မပါလို့ မဖြစ်ဘူးလို့ လိုကိုလိုတယ်လို့ သတ်မှတ်ရမှာ ဖြစ်ပါတယ်။

နောက်တစ်ခုက Rendering ကြောင့် နှေးသွားနိုင်မလားဆိုတဲ့ ကိစ္စပါ။ ကျွန်တော်ကိုယ်တိုင် စမ်းသပ်ပြီးပါပြီ။ Rendering လိုတဲ့ font နဲ့ရေးထားတဲ့ စာမျက်နှာပေါင်း ၃၀၀ ကျော်ကို ဖွင့်တာနဲ့ မလိုတဲ့ စာမျက်နှာ ၃၀၀ ကျော်ကိုဖွင့်တာ CPU Usage/Memory Usage ပြောပလောက်အောင် မကွာတာတွေ့ရပါတယ်။ Data Consistency ဖြစ်ခြင်းဆိုတဲ့ အကျိုးကျေးဇူးနဲ့ နှိုင်းယှဉ်မယ်ဆိုရင် ဘယ်လိုမှ နှိုင်းယှဉ်လို့ မရနိုင်တဲ့ အချက်ပဲ ဖြစ်ပါတယ်။ ကျွန်တော်ကိုယ်တိုင် Posts တွေကို ယူနီကုဒ် စနစ်ကို ပြန်ပြောင်းတဲ့ နေရာမှာ Data Inconsistency ဆိုတဲ့ ပြဿနာကို တစ်ပုဒ်ခြင်းစီ ပြန်ရှင်းခဲ့ရပါတယ်။ ဒါကြောင့် မြန်မာစာ ရေးထုံးနဲ့ ပတ်သက်ရင် Rendering က လိုကို လိုအပ်တယ်လို့ ကောက်ချက် ချရမှာပါ။ ဒါပေမယ့် Rendering မလိုတဲ့အတွက် အားသာချက်တွေလည်း ရှိနေပြန်ပါတယ်။ rendering မလုပ်ရတဲ့အတွက် ဘယ်နေရာမှာ မဆို အလွယ်တကူ မြင်ရပါတယ်။ အဲဒီလို မြင်ရတဲ့ဖက်ကို လိုက်မယ်ဆိုရင်တော့ Rendering မလိုတာကို လက်ခံရပါမယ်။

ဒါပေမယ့် တဖက်မှာကြည့်ရင်လည်း အွန်လိုင်းပေါ်မှာ ငါရေးနေတာပဲ ဖတ်ရုံသက်သက် တော်ပြီပေါ့လို့ တွေးပြီး ရေးနေပေမယ့် Crawler တွေနဲ့ အချက်အလက်တွေ စုတဲ့အခါ အဲဒီလို အချက်အလက်တွေကို Language Resources အနေနဲ့ အသုံးချတဲ့အခါ အသုံးဝင်ဖို့ မလွယ်တော့ပါဘူး။ သူ့ကျွမ်းကျင်ရာ နယ်ပယ်တွေအလိုက် ပြန့်ကျဲနေတဲ့ အချက်အလက်တွေကို စုစည်းပြီး Language Resources လို့ခေါ်တဲ့ အရင်းအမြစ် တစ်ခုလုံး ဆုံးရှုံးသွားပါလိမ့်မယ်။ တကယ်တန်း ပြောရရင် Technology is ready လို့ ဆိုရလောက်အောင် နည်းပညာတွေက အသင့် ရှိနေပါတယ်။ အများစုကလည်း Open Source နည်းပညာတွေပါပဲ။ အဲဒီနည်းပညာတွေ အသက်ဝင်လာဖို့ အဓိက အကျဆုံး Foundation က Language Resources ပါပဲ။ ဒီတော့ဗျာ စာတွေမရှိရင် ဘာသာပြန်စနစ်လည်း ရှိလာစရာ အကြောင်းမရှိပါဘူး။ စာတွေမရှိရင် အခြား Language Processing လည်း ဖြစ်လာစရာ အကြောင်း မရှိတော့ပါဘူး။ အဲဒီလို Language Resources ဆိုတာမရှိရင် နိုင်ငံတကာကလည်း မြန်မာစာကို ကွန်ပျုတာသုံး မြန်မာစာအဖြစ် အသိအမှတ်ပြုမှာ မဟုတ်တော့ပါဘူး။

အဲဒီလို Language Resources လို့ခေါ်တဲ့ အရင်းအမြစ်တွေအတွက် အဓိက အကျဆုံး လိုအပ်ချက်တွေကို ကျွန်တော် စဉ်းစားကြည့်တဲ့အခါမှာ

  1. မြန်မာစာသည် တိကျတဲ့ စံနှုန်းတစ်ခုအပေါ်မှာသာ တည်မှီတည်ဆောက်ထားသင့်ပါတယ်။
  2. မြန်မာစာတွေကို သိမ်းဆည်းတဲ့နေရာမှာ တိကျတဲ့ စနစ်တစ်ခုနဲ့ သိမ်းဆည်းထားသင့်ပါတယ်။
  3. မြန်မာစာနဲ့ ရေးထားတဲ့ စာတွေအားလုံးကို တူရာတူရာ အလိုက် စနစ်တကျ စုစည်းပေါင်းစပ်နိုင်ရပါမယ်။

Logical Order ဆိုတာဘာလဲ

အရင်ဆုံး Logical Order ဆိုတာဘာလဲဆိုတဲ့ အပိုင်းကို အရင်ဆုံး ပြောချင်ပါတယ်။ အောက်မှာ ပြထားတာကတော့ Unicode က သတ်မှတ် ပေးထားတဲ့ မြန်မာစာနဲ့ တိုင်းရင်းသား ဘာသာစကားတွေအတွက် code point တွေပါ။ code point ဆိုတာက တကယ်တန်း Database ထဲမှာ ဖြစ်ဖြစ် သိမ်းထားတဲ့အခါ ရှိနေမယ့် တကယ့် အချက်အလက် ဖြစ်ပါတယ်။

အရင်တစ်ခါတုန်းကလည်း ပြောပြီးပါပြီ။ 1000 – ‘က’ ကစလို့ သတ်မှတ်ထားတဲ့ နောက်ထပ် Unicode 6.0 မှာ extended ဆိုပြီး ထပ်ဖြည့်ထားတဲ့ အထိ Character တစ်လုံးကို CODE POINT တစ်ခုစီနဲ့ သတ်မှတ် ထားပါတယ်။ သိမ်းတဲ့ အခါမှာလည်း အဲဒီ code point တွေကိုသာ သိမ်းထားထာ ဖြစ်ပါတယ်။ ယူနီကုဒ်စနစ်ကို လိုက်နာတဲ့အခါမှာ code point တွေကိုရော လိုက်နာဖို့ လိုသလို storage order လို့ ခေါ်တဲ့ logical order ကိုလည်း လိုက်နာဖို့ လိုပါတယ်။ အဲဒီအကြောင်းကို Unicode က Website မှာ အသေအချာရေးထားပါတယ်။ အောက်က လင့်မှာ ဖတ်ကြည့်နိုင်ပါတယ်။

အဲဒီတော့ Logical Order ဆိုတာ အပေါ်မှာ ပြထားတဲ့ ဇယားထဲက အစီအစဉ်အတိုင်း စီထားတာကို logical order လို့ဆိုရမှာ ဖြစ်ပါတယ်။ အဲဒီလို အစီအစဉ်အတိုင်း သိမ်းရမယ် ဆိုပါတော့။ ကျွန်တော် အပေါ်မှာ ပြောခဲ့ပြီးသားပါ အချက်အလက်တွေကို တိကျတဲ့ စနစ်တစ်ခုနဲ့ သိမ်းမယ်ဆိုတဲ့ အချက်ပါ။ တကယ်တန်း ယူနီကုဒ် စနစ်ဆိုတာ အဲဒီလို တိကျတဲ့ စနစ်တစ်ခုနဲ့ သိမ်တာကို အဓိကထားပါတယ်။ တိကျတဲ့ code point ကို လိုက်နာရုံနဲ့ မပြီးပါဘူး။ တိကျတဲ့ စနစ်နဲ့လည်း သိမ်းရမှာပါ။ အဲဒီလို သိမ်းတာကို Logical အတိုင်းသိမ်းတယ်လို့ ဆိုရမှာ ဖြစ်ပါတယ်။ ကဲဒီတော့ Logical Order အတိုင်း သိမ်းလား မသိမ်;ဘူးလားဆိုတာကို Font တွေကို အခြေခံပြီး စစ်ကြည့်ရအောင် အဲဒီလို စစ်ဖို့အတွက်လည်း W3.org က Web Tool တစ်ခုကို ညွှန်းချင်ပါတယ်။

ကျွန်တော် ပထမဦးဆုံး စမ်းသပ်ဖြစ်ခဲ့တာကတော့ Myanmar3 Unicode Font ပါ။ ကြောင်း ဆိုပြီး ရိုက်ထည့်လိုက်ပါတယ်။ အောက်မှာ ပြထားတဲ့ အတိုင်း Code Point အစီအစဉ်ရပါတယ်။

Order အတိုင်း ပြန်စီကြည့်ရအောင်

  1. 1000 – က
  2. 103c – ြ
  3. 1031 – ေ
  4. 102C – ာ
  5. 1004 – င
  6. 103A – ်
  7. 1038 – း

ဆိုပြီး အစီအစဉ်အတိုင်း စီထားတာ တွေ့ရပါလိမ့်မယ်။

အဲဒီအစီအစဉ်က မှန်လားဆိုတာကို စစ်ကြည့်ရအောင် မြန်မာစာ အက္ခရာစဉ်မှာ ပါဋ္ဌိအစဉ်နဲ့ စာလုံးပေါင်း သတ်ပုံကျမ်း အစီအစဉ်ဆိုပြီး နှစ်မျိုး ရှိပါတယ်။ ကျွန်တော်တို့တွေ အားလုံးကတော့ စာလုံးပေါင်း သတ်ပုံကျမ်း အစီအစဉ်အတိုင်း စီတာကိုပဲ လက်ခံပြီး စီစဉ်ကြပါတယ်။ အဲဒီလို စီတဲ့နေရာမှာ

<consonant><medial><vowel>

ဆိုပြီး စီပါတယ်။ consonant ဆိုတာဗျည်းပါ။ ‘က’ ကြီး၊ ‘ခ’ ခွေး စသည်ဖြင့်ပေါ့။ medial ဆိုတာကတော့ ဗျည်းတွဲပါ။ ရပင်း၊ ရရစ်၊ ဝဆွဲ၊ ဟထိုး၊ ရပင်း ဝဆွဲ စသည်ဖြင့် ပါ၀င်ပါတယ်။ နောက် တတိယလိုက်တာက vowel ပါ။ သရ ဆိုပါတော့။ ရေးချ၊ လုံးကြီးတင်၊ လုံးကြီးတင်ဆံခတ်၊ တစ်ချောင်းငင်၊ နစ်ချောင်းငင်၊ သဝေထိုး စသည်ဖြင့် ပါ၀င်ပါတယ်။ အဲဒီလို Collation of Myanmar (Burmese) in Unicode ကို ဖတ်ကြည့်မယ် ဆိုရင်လည်း အသေးစိတ် ရေးထားတာ တွေ့ရပါလိမ့်မယ်။

အဲဒီတော့ အပေါ်မှာ ရေးထားတဲ့ ကြောင်းဆိုတာကို ဗျည်း + ဗျည်းတွဲ + သရ အစီအစဉ်အတိုင်း စီထားတာ ဖြစ်တဲ့အတွက် မှန်ပါတယ်။ ရေးတာမှာတော့ ဘယ်လိုရေးရေးပါ။ အမြင်အတိုင်းရေးရေး၊ မှတ်တဲ့အတိုင်းရေးရေး မှတ်ရင်တော့ တစ်ပုံစံတည်း မှတ်တဲ့အတွက် ဗျည်း၊ ဗျည်းတွဲ သရ အစီအစဉ်အတိုင်း မှတ်ထားပါတယ်။

ကဲ ဒီတစ်ခါ ဇော်ဂျီနဲ့ စမ်းကြည့်ပါမယ်။

သူကတော့ ယူနီကုတ်ရဲ့ စံကို မလိုက်နာထားတဲ့အတွက် code point တွေလည်း တူမှာ မဟုတ်ပါဘူး။ ဒီနေရာမှာ code point အပိုင်းနဲ့ ပတ်သက်ပြီး ဘာမှ ပြောစရာမရှိပေမယ့် Storage Order နဲ့ ပတ်သက်ပြီး စစ်ဆေးကြည့်မယ်ဆိုရင် အရေးအကြီးဆုံး ဖြစ်တဲ့ ဗျည်းက တတိယ နေရာမှာရောက်နေပါတယ်။ အဲဒီအတွက် စီမယ်ဆိုရင် ဗျည်းကို ရှေ့ပြန်ထုတ်ပေးရပါမယ်။ အဲဒီအပြင် ဗျည်းတွဲနဲ့ သရ အစဉ်ကိုလည်း ပြန်စီ ပေးရပါလိမ့်မယ်။

နောက်ဆုံးတစ်ခု အနေနဲ့ ဧရာနဲ့ စမ်းကြည့်ပါမယ်။

သူကတော့ code point တွေကို အတိအကျလိုက်နာထားပြီး storage order ကိုတော့ Visual Order နဲ့ပဲ သိမ်းထားပါတယ်။ Logical order ကိုလည်း မလိုက်နာသလို ဗျည်း + ဗျည်းတွဲ + သရ ဆိုတဲ့ အစီအစဉ်ကိုလည်း မလိုက်နာပါဘူး။

Logical Order သိမ်းသင့် မသိမ်းသင့်

ဒီလို code point တွေကို စစ်ဆေးကြည့်ပြီးပြီဆိုရင် ရှေ့ဆက်ပြီး Logical Order အတိုင်း သိမ်းသင့် မသိမ်းသင့်ဆိုတာကို ဆက်ရပါမယ်။ ဒါကလည်း မြန်မာစာဆိုတာ စံတစ်ခုတည်းအပေါ်မှာ မူတည်ထားမှသာ Language Resources အတွက် အထောက်အပံ့ပေးနိုင်မယ် ဆိုတဲ့အတွက် အရေးပါတဲ့ ကဏ္ဍတစ်ခု ဖြစ်ပါတယ်။

စာဖတ်သူ အနေနဲ့လည်း အပေါ်မှာ ကျွန်တော် စမ်းသပ်ပြခဲ့တာတွေ ကြည့်ပြီး Code Point, Logical Order နဲ့ မြန်မာ အက္ခရာစဉ်စတာတွေကို အတိုင်းအတာတစ်ခုအထိ လက်ခံနိုင်ပြီလို့ ယူဆပါတယ်။ ရှေ့ဆက်ပြီး လေ့လာရမှာကတော့ Logical Order သိမ်းသင့် မသိမ်းသင့်ဆိုတဲ့ အပိုင်းပါ။ အဲဒီအတွက် ကျွန်တော် စမ်းသပ်ထားတဲ့ Sorting Order ဆိုတဲ့ PHP Program လေးကို အရင် စမ်းသပ်ကြည့်ပါဘူး။ ကျွန်တော် စီကြည့်မယ့် စာလုံးတွေကတော့

‘၁’, ‘ကြောင်း’, ‘ခ’, ‘ခေး’, ‘ကောင်း’, ‘ကွန်း’, ‘က’,  ‘ကြ’, ‘ကြွ’, ‘ကျောင်းသား’, ‘ကေး’, ‘ကေက’,  ‘ကြိုး’, ‘တား’,  ‘ကြိုက်’, ‘ကျောင်း’

အဲဒီ စာလုံးတွေကို natsort() ဆိုတဲ့ PHP ရဲ့ Natural Sort နည်းနဲ့ စီကြည့်ပါမယ်။ ဘာမှမပါပါဘူး။ Array ကိုသာ ပြန်စီထားတာပါ။ Program ကတော့ အောက်မှာ ပြထားတဲ့အတိုင်း ဖြစ်ပါတယ်။

<!DOCTYPE HTML>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <link rel="stylesheet" href="960.css" />
    <title>Myanmar Sorting</title>
    <!--[if lt IE 9]>
    <script src="http://html5shim.googlecode.com/svn/trunk/html5.js"></script>
    <![endif]-->
</head>
<body class="container_12 clearfix">
    <div class="column grid_4">
        <h1>Unicode Sorting</h1>
        <?php
            // for Unicode
           echo '<p style="font-family: Myanmar3;">';
            $arrayuni = array('၁','ကြောင်း','ခ','ခေး','ကောင်း','ကွန်း','က', 'ကြ', 'ကြွ','ကျောင်းသား', 'ကေး', 'ကေက', 'ကြိုး','တား', 'ကြိုက်','ကျောင်း');
            natsort($arrayuni);
            foreach($arrayuni as $value)
            {
                echo $value;
                echo '<br />';
            }
            echo '</p>';
        ?>
    </div>
    <div class="column grid_4">
            <h1>Zawgyi Sorting</h1>
            <?php
            // for Zawgyi
            $arrayzg = array('၁','ေၾကာင္း', 'ခ', 'ေခး', 'ေကာင္း', 'ကြန္း', 'က','ၾက', 'ႂကြ', 'ေက်ာင္းသား', 'ေကး', 'ေကက', 'ႀကိဳး', 'တား', 'ႀကိဳက္', 'ေက်ာင္း');
            natsort($arrayzg);
            echo '<p style="font-family: Zawgyi-One;">';
            foreach($arrayzg as $value)
            {
                echo $value;
                echo '<br />';
            }
            echo '</p>';
            ?>
    </div>
    <div class="column grid_4">
        <h1>Ayar Sorting</h1>
        <?php
        //for Ayar
        $oldLocal = setlocale(LC_COLLATE, '');
        $arrayayar = array('၁','ေြကာင်း', 'ခ', 'ေခး', 'ေကာင်း', 'ကွန်း', 'က', 'ြက', 'ြကွ', 'ေကျာင်းသား', 'ေကး', 'ေကက', 'ြကိုး', 'တား', 'ြကိုက်', 'ေကျာင်း');
        natsort($arrayayar);
        echo '<p style="font-family: Ayar;">';
        foreach($arrayayar as $value)
        {
            echo $value;
            echo '<br />';
        }
        echo '</p>';
        ?>
    </div>

</body>
</html>

အဲဒီ Program အတိုင်း ကိုယ့်ဘာသာလည်း စမ်းသပ်လို့ရသလို ကျွန်တော် တစ်ခါတည်း Hosting မှာ တင်ပေးထားတာလဲ ရှိပါတယ်။ Myanmar Sorting ဆိုတာလေးကို ကလစ်ခေါက်ကြည့်ပါ။

အဲဒီနေရာမှာ စီတာတွေကို လေ့လာကြည့်မယ်ဆိုရင် ယူနီကုတ်နဲ့ ရေးထားတာက အမှားအယွင်း အနည်းဆုံး စီပေးတာ တွေ့ရပါလိမ့်မယ်။ ဒါပေမယ့် ကြိုးနဲ့ ကြိုက်လိုမျိုး ၁ က ရှေ့ဆုံးမှာ ရှိနေတာကို ပြန်စီပေးရတာမျိုးတွေ ရှိနေပါလိမ့်မယ်။ အဲဒီလို လုပ်ပေးဖို့အတွက် Myanmar Collation Method တစ်ခု ထည့်ပေးဖို့ လိုဦးမှာ ဖြစ်ပါတယ်။ MySQL မှာဆိုရင် my_MM.utf8 ဆိုတာမျိုး Locale တစ်ခု ထပ်ဖြည့်ပေးနိုင်မယ် ဆိုရင် Program အကူအညီမလိုပဲ စီလို့ရဖို့ အလွယ်ဆုံ ဖြစ်စေတာ Logical Order Storage ပဲဆိုတာ တွေ့ရပါလိမ့်မယ်။

အဲဒီလို Sorting တွေအတွက်လည်း Logical Order ဟာ မရှိမဖြစ် အရေးပါပါတယ်။ ‘က’ ကနေ ‘အ’ အထိ စီမယ်ဆိုရင် အလွယ်တကူ စီပေးနိုင်တာ Logical Order ပါ။ ကျွန်တော်တို့ ဘာမှ လုပ်ပေးစရာမလိုပါဘူး။ utf8 က အလိုလို သတ်မှတ်ပေးသွားတာပါ။ utf8 ရဲ့ Order ကို သိတဲ့ မည့်သည့် OS, မည်သည့် Application မဆိုစီပေးနိုင်ပါတယ်။

အဲဒီ အပြင် Logical Order သိမ်းခြင်း မသိမ်းခြင်းနဲ့ ပတ်သက်ပြီး ပြောရမယ်ဆိုရင် Logical Order သိမ်းလိုက်ခြင်းအားဖြင့် ရရှိလာမယ့် အကျိုး ကျေးဇူးတွေကို အရင်ကြည့်သင့်တယ်လို့ ကျွန်တော် မြင်ပါတယ်။ Logical Order တော့ မသိမ်းဘူး။ Code Point တော့ လိုက်နာတယ် ဆိုတာနဲ့ Rendering က လိုကို လိုတော့မှာ ဖြစ်ပါတယ်။ Code Point ကို လိုက်နာတာနဲ့ ရရစ်တွေကို ပုံစံမျိုးစုံ ပြောင်းလဲပေးဖို့ လိုအပ်လာပါတယ်။ အဲဒီအပြင် အောက်ကမြစ်လို့ နေရာတွေအတွက် Render လုပ်ကို လုပ်ရပါတော့မယ်။ အဲဒီလို Rendering တွေ လုပ်နေသေးတာ သဝေထိုးလိုအတွက် ဘာကြောင့် Rendering မလုပ်ပဲ နေရလဲဆိုတာ စဉ်းစားစရာပါပဲ။

မြန်မာစာ ယူနီကုဒ်နှင့် ပတ်သက်သမျှ

ကွန်ပျူတာသုံး မြန်မာစာ စနစ်အတွက် စနစ်တစ်ခုတည်း၊ အထိုင်တစ်ခုတည်း အပေါ်မှာ တည်မှီနေသင့်ပြီဆိုတာ သေချာပါတယ်။ အဲဒီအတွက် အကောင်းဆုံး စနစ်ဟာလည်း မြန်မာစာ ယူနီကုဒ် စနစ်ပါပဲ။ ဒါပေမယ့် အဲဒီ Logical Order အပေါ်မှာ localization လုပ်ပေးဖို့ လိုအပ်ချက် တွေလည်း ရှိနေပါသေးတယ်။ MySQL ဆိုရင် MySQL အတွက် localization အတွက် သတ်မှတ်ပေးစရာတွေ လိုနေပါတယ်။ အဲဒီလို သတ်မှတ်ပေးဖို့ တာဝန်ရှိတဲ့သူက ဘယ်သူလဲ။ မေးစရာရှိပါတယ်။ Myanmar NLP Lab လား။ မဟုတ်ပါဘူး။ သူ့ကျွမ်းကျင်ရာ နယ်ပယ်အလိုက် ပညာရှင်အားလုံးမှာ တာဝန်ရှိပါတယ်။ အဲဒီလို ပူးပေါင်းပါဝင် ဆောင်ရွက်ကြမှသာ ကွန်ပျူတာသုံး မြန်မာစာစနစ်ဆိုပြီး နိုင်ငံတကာမှာ အသိအမှတ်ပြုခံရမှာ ဖြစ်ပါတယ်။  စာရိုက်နည်း စနစ်ဆိုတာ ယူဆာတွေရဲ့ ရွေးချယ်မှုပါ။ ဝင်းအတိုင်း ရိုက်ချင်တယ်ဆိုလည်း ခုချိန်မှာ ရိုက်လို့ရပါပြီ။ ဇော်ဂျီအတိုင်း ရိုက်ချင်တယ်ဆိုရင်လည်း ရိုက်လို့ရပါပြီ။ ဒါပေမယ့် input method တွေမှာ Error တစ်ချို့ရှိနေဆဲ ဖြစ်တာ တွေ့ရပါတယ်။ ဒါပေမယ့် တီထွင်သူ Developer များအနေနဲ့လည်း အချိန်နဲ့ တစ်ပြေးညီ ပြင်ဆင်ဖြည့်ဆည်း ပေးလာတာ တွေ့နေရပါတယ်။ Myanmar3 က ဖောင့်သေးနေတဲ့အတွက် ကြီးပေးလိုက်တာ၊ KeyMagic ကို တီထွင်သူ ဖြစ်တဲ့ ကိုသန့်သက်ခင်ဇော်ကလည်း အချိန်နဲ့ အမျှ ပြုပြင် ဖြည့်ဆည်းပေးနေတာ၊ Win Myanmar System ကလည်း ယူနီကုဒ် Input Method အတွက် လိုအပ်သလို ဖြည့်ဆည်းပေးနေတာ၊ အဲဒီအပြင် အခြားဖက်မှာလည်း ကိုငွေထွန်း၊ ကိုရာဗီ၊ ကိုစေတန် စသည်ဖြင့် ပညာရှင်များကလည်း အလွယ်တကူ ပြောင်းလဲနိုင်အောင် ကူညီ ပေးနေကြတာ တွေ့ရပါတယ်။

ကျွန်တော်ကတော့ ယူနီကုဒ် ရန်ပွဲတွေထဲမှာ မပါဝင်လိုပါဘူး။ ဖြစ်စေချင်တာ တစ်ခုကတော့ ဝေဖန်ပါ၊ သုံးကြည့်ပါ၊ အဲဒီလိုမှသာ မြန်မာစာ ယူနီကုဒ် စနစ်အမြန်တိုးတက်လာမယ်လို့ ယူဆပါတယ်။ မသုံးပဲ နေရင်လည်း မတိုးတက်နိုင်သလို၊ မဝေဖန်ရင်လည်း အမြန်ကောင်းလာမှာ မဟုတ်ပါဘူး။ ဒါပေမယ့် တစ်ခုနဲ့ တစ်ခု သေသေချာချာ ဂဃနဏ သိအောင် မလေ့လာပဲ၊ ကိုယ်ထင်ရာ ပြောနေကြရင်တော့ ဘယ်တော့မှ ပန်းတိုင်ရောက်မှာ မဟုတ်ဘူးလို့ ဆိုချင်ပါတယ်။

အခြား သိမှတ်ဖွယ်ရာများ

အားလုံးပဲ ရွှင်းလန်းချမ်းမြေ့ပါစေ

သီဟ (Myanmar Tutorials)

Facebook comments:

50 Responses

  1. Aung Aung says:

    ယူ​နီ​ကုဒ် ရန်​ပွဲ​ဆို​တာ​ထက် အငြင်း​အခုံ​ဆို ပို​ကောင်း​မ​လား​လို့
    ကလေး​တွေ​လို ရန်တွေ့​တဲ့​သူ​တွေ​ရှိ​ပေ​မယ့် ပညာ​ရှင်​တွေ ပြော​နေ​တာ​တွေ​က ပို​ပြီး ပညာ​ရပ်သဘော ​ဆန်​သလား​လို့​ပါ. . .

    • Thiha says:

      ဟုတ်ကဲ့ဗျ အငြင်းအခုန်လို့ ဆိုနိုင်ပါတယ်။ ဒါပေမယ့် တစ်ဖက်နဲ့ တစ်ဖက် ပြောကြတဲ့ အခါမှာ ဂဃနဏ သိအောင် လေ့လာပြီး ပြောကြဆိုကြ ငြင်းကြခုန်ကြရင် ပိုပြီး အကျိုးများလိမ့်မယ်လို့ ကျွန်တော် ထင်ပါတယ်

  2. ppa says:

    ကိုသီဟ ရေးသွားတဲ့ အချက်တွေဟာ ကျွန်တော်လို ယူနီကုတ် စံသတ်မှတ်ချက် ကို သေချာ ဂဃနဏ မသိတဲ့ လူအတွက်ရှင်းရှင်းလင်းလင်းဖြစ်သွားစေပါတယ်။ အရင်က ကျွန်တော်က ကိုယ်စီးတဲ့ မြင်းအထီး မှန်းအမ မှန်း မကွဲပြားခဲ့ဘူး။ ခုလိုသေချာအချိန်ယူပြီးရှင်းပြ ရေးသားပေးတာကိုလဲ ကျွန်တော် အားကျ ကျေနပ်မိပါတယ်။ ကျွန်တော်မြင်တာကတော့ အငြင်းအခုန်ဆိုတာ တိုးတက်ဖို့ အတွက် လိုပါတယ် ဒါပေမယ် အချက်ကျကျ နဲ့ရှင်းလင်းငြင်းခုန်မယ်ဆိုရင် ဘယ်တစ်ခုက အဆင်ပြေမလဲဆိုတာ သေချာ ရှင်းရှင်းလင်းလင်းထွက်လာမယ်လို့ ထင်ပါတယ်။ အားသာချက် အားနည်းချက်ပေါ့ဗျာ။ ဘယ်လိုပဲဖြစ်ဖြစ် အချိန်တစ်ခု ပေးပြီး အလုပ်လုပ်နေတဲ့ ပညာရှင် တွေကို လေးစားပါတယ်ဗျာ။ အမျိုးမျိုးသော ပုံစံတွေထဲက အကောင်းဆုံးဖြစ်မယ့် ပုံစံတစ်ခု အမြန်ဆုံးရပါစေဗျာ…

    • Thiha says:

      ကျွန်တော်လည်း အဲဒီလိုပဲ အကောင်းဆုံး ပုံစံတစ်ခု အမြန်ဆုံး ထွက်စေချင်နေပါပြီ

  3. ကို​သီ​ဟ​ရေ ကျေးဇူး
    အများ​ကြီး ရှာဖွေ​ဖတ်​ရှု​ရ​မယ့်​ဟာ​ကို တစ်​ခု​တည်း​နဲ့ မြန်မာ​လို စုံ​စုံလင်​လင်​ဖတ်​ရ​တော့ ကျွန်တော်​တို့​လို စာ​ဖတ်​ပျင်း​သူ​တွေ အတွက် အို​ကေ​တာ​ပေါ့။ ဘာ​ကြောင့် ယူ​နီ​ကုဒ်​တယ်​ဆို​တာ ပြော​တဲ့​သူ​တွေ​က စနစ်​တ​ကျ​ပြော​သ​လို ဝေဖန်​တဲ့​သူ​တွေ​က​လဲ ယူ​နီ​ကုဒ်​မှာ ဘာ​တွေ အားနည်း​ချက်​ရှိ​နေ​တယ်​ဆို​တာ​ကို စကား​အနိုင်​ရ​ပြီး​ရော၊ ပုဂ္ဂိုလ်​ရေး တိုက်ခိုက်​ရ​ပြီး​ရော ဆို​ပြီး ပြော​နေ​တာ​တွေ မ​လုပ်​သင့်​တော့​ပဲ စနစ်​တ​ကျ ဝေဖန်​ဆွေးနွေး​သင့် တယ် ထင်​ပါ​တယ်။ ကြား​ထဲ​က ဘာ​မှန်း​ညာ​မှန်း သေချာ မ​သိ​သူ​များ​ကြောင့် ယုံ​ထင်​ကြောင်​ထင် ဖြစ်​ကုန်​မှာ မ​လိုလား​ပါ​ဘူး။ တကယ်​ကောင်း​လို့ သုံး​စေ​ချင်​လို့ သုံး​ဖူး​သူ​တွေ​က လမ်း​ညွှန်​ချင်​ရုံ​ပါ။ ကျွန်တော်​တို့​က Developer မဟုတ်​ပါ​ဘူး။ အသုံးပြု​သူ သက်သက် သာ ဖြစ်​ပါ​တယ်။ အသုံးပြု​သူ​မှ အသုံးပြု​သူ​သို့ ဝေမျှ​ခြင်း​သာ ဖြစ်​တဲ့ အတွက် အဲ့​ဒိ​ရဲ့ နောက်​ကွယ်​က ပြစ်​တင် ရှုံ့​ချ မှု​တွေ​ဟာ လူကြီး လူကောင်း မ​ဆန်​တဲ့ လုပ်​ရပ်​တွေ​သာ ဖြစ်​ပါ​တယ်။ အသီး​တစ်​ခု ဝယ်​လာ​လို့ စား​ကောင်း​ကြောင်း ညွှန်း​တာ​ကို မင်း​တို့​ရပ်​ကွက်​က ဝယ်​လာ​လို့ မ​စား​ဘူး။ မင်း​ဝယ်​လာ​လို့ မ​စား​ဘူး။ အဲ့​ဒိ​အသီး​က အဆိပ်​ဖြစ်​မှာ​ပဲ​လို့ အထင်​နဲ့ မျက်စိ​မှိတ် ပြစ်​တင် နေ​တာ​ဟာ ကလေး​ဆန်​လွန်းလှပါတယ်။

  4. Minn Kyaw says:

    ကိုသီဟ ကိုယ်တိုင် အားလုံးကိုသေချာ နားလည်စေချင်ပါတယ်။ နားမလည်ဘဲ လိုရာကိုဆွဲပြော လိုရာကို ယူရင် မှားသွားပေါ့။ ကိုသီဟာ ပြောခဲ့တဲ့ အချက်ကို ပြန်ပြောရရင်

    Logical order ကိုလညျး မလိုကျနာသလို ဗျည်း + ဗျည်းတှဲ + သရ ဆိုတဲ့ အစီအစဉ်ကိုလည်း မလိုက်နာပါဘူး။

    လိုရေးတဲ့ အဓိပ္ပါယ်ရော နားလည်သလား ….Logical order ဆိုတာ ဗညြျး + ဗညြျးတှဲ + သရ ဆိုတဲ့ အစီအစဉျ လို့လဲပြောသေးတယ်။ ပြီးတော့ဘဲ ၂ မျိုးဘဲ ကွာသလိုလို လုပ်နေပါလား …
    တယောက်ကလည်း Logical Order ကိုမလိုက်နာတာ တယောက်ကလည်း encoding ဆိုတာကို မလိုက်နာတာဆိုပြီး ကိုယ်နဲ့ အယူအဆ၊ အမြင်ချင်းမတူတာနဲ့ တုတ်ကိုချီး…. လုပ်နေသလိုဘဲဖြစ်နေပြီ။

    မြန်မာယူနီကုဒ်ဆိုတာ တိုင်းရင်းသားစာတွေပါပါတယ်။ ခင်ဗျားတို့ အဲ့တာတို့ကို လေ့လာစေချင်ပါတယ်။ အဲ့တာပြီးမှ Logical Order စီသင့်မစီသင့် ပြောစေချင်ပါတယ်။ မြန်မာစာကို အခြေခံပြီး ယူနီကုဒ့်ကို လုပ်မယ်ဆိုရင် အဘ အဘ တွေပြောခဲ့တဲ့ တိုင်းရင်းသားစာကို ဇော်ဂျီတွေ ဖျတ်နေတယ်ဆိုသလို၊ မြန်မာယူနီကုဒ်က တိုင်းရင်းသားစာပေတွေကို ဖျတ်ဆီးသလို ဖြစ်ပါလိမ့်မယ်။ မွန်စာမှာ သရပြီးမှ ဗျည်း ကို စီတာပါ။

    Logical Order၊ encoding ကွဲတယ်ဆိုပြီးပြောတာထက် ဧရာနဲ့ တခြား မြန်မာယူနီကုဒ်တွေနဲ့ ေ၊ ြ— နဲ့–င်္ ၃မျိုးဘဲ မတူတာဘဲရှိတာ။ ကျန်တာတွေကရော တခြား မြန်မာယူနီကုဒ်တွေနဲ့ Logical Order၊ encoding စီတာတွေ မတူဘူးလား။ တူလားဆိုတာ ကိုသီဟ မသိဘူးထင်တယ်။ တုတ်ကိုချီး…. မလုပ်ပါနဲ့၊ အဲလို မတူလို့ ပရိုဂရမ်တော်တော်များများမှာ အသုံးချလို့ရတာတွေ မစဉ်းစား၊ မထောက်ပြဘဲ၊ အွန်လိုင်းမှာ ဘရောဇာ်လေး ၃ ခု ၄ ခု၊ ပရိုဂရမ်လေး ၃ ၄ခုလောက်မှာ သုံးလို့ရယုံလုပ်တာနဲ့ မြန်မာစာတိုးတတ်လာပြီလို့ ပြောလို့ရနိုင်မလား။ ယူနီကုဒ်ဆိုတာ မည့်သည့် ပရိုဂရမ်၊ မည်သည့် OS၊ မည်သည့် အပလိကေးရှင်းတွေမှာမဆို အသုံးပြုလို့ရ ရမယ်လို့ ဆိုထားခဲ့ပါ။ အဲလိုမရသေးဘဲနဲ့ ယူနီကုဒ်စစ်ပါတယ်ပြောနေတာကိုက သုံးစွဲသူတွေကို သတင်းမှားပေးပြီး ဆေးကြော်ငြာနေသလိုမဖြစ်နေဘူးလား။
    အဲလို ၃ ၄ လုံးကြောင့် Sorting ကို တန်းပြီးမလုပ်နိုင်ပေမယ့်၊ လုပ်နိုင်တဲ့ နည်းစနစ်တွေက ရှိပြီးသားပါ။ ပရိုဂရမ်မာတွေလဲ လုပ်ပြထားပြီးသားပါပါ။ ဘယ်လိုစီစီ၊ အက္ခရာစဉ်တဲ့ အခါမှာ စီလို့ရနိုင်တယ်ဆိုတာကိုပါ။ (Sorting အောက်မှာ ဆက်ဖတ်ပါ။) ဘာကြောင့် ဘာအတွက် ဘာလို့ဆိုတာတွေကိုဘဲ ထည့်သွင်းစဉ်းစားစေချင်လို့ အကြံပြုတာပါ။ မြန်မာယူနီကုဒ့်ဆိုတာမှာ တိုင်းရင်းသားစာပေတွေပါ ပါပါတယ်။ ထို့အပြင် နည်းပညာနဲ့ ဘာသာဗေဒ ပညာရှင်တွေပါ ပူပေါင်းပါဝင်မှ ဖြစ်မှာပါ။ မြန်မာစာပညာရှင်တွေ တိုင်းရင်းသားပညာရှင်တွေကို နည်းပညာအကြောင်း၊ ကွန်ပျူတာအကြောင်း မသိလို့ ချန်ထားလို့ မရပါဘူး။ သူတို့ကိုဆွေးနွေးဖို့ ကွန်ပျူတာအရင်သင်ပေးရမယ်လို့ ပြောခဲ့ဘူးတဲ့ မြန်မာယူနီကုဒ်ပညာရှင်လဲ ရှိတယ်ဆိုတာလဲ သိစေချင်ပါတယ်။ မြန်မာစာ စာလုံးပေါင်းသတ်ပုံကျမ်းတွေက ခေတ်တိုင်းမှာ ဘာလို့ ကွဲပြားစွာ ရှိနေတာလဲ ဆိုတာကို သိစေချင်ပါတယ်။

    sorting ကိစ္စ
    sorting ကိစ္စကို ကိုသိဟရဲ့ ဆရာ့ ဆရာတွေကိုယ်တိုင် ပြောထားပါတယ်။ OS ဖန်တီးသူတွေကိုယ်တိုင် ဖန်တီးပေးမှ မြန်မာ sorting အလုပ်လုပ်မှာပါလို့ ပြောထားခဲ့ပါတယ်။ အင်္ဂလိပ်စာမှာတောင် a နဲ့ A နဲ့ စီတာ မတူဘူးဆိုပြီးထောက်ပြထားတာတွေတွေ့မှာပါ။ အင်္ဂလိပ်စာတောင် မှ အဲလိုဖြစ်နေသေတးယ်။ အခုခင်ဗျားထောက်ပြထားတဲ့ sorting ကိစ္စ အဆင်ပြေတာနဲ့ မြန်မာစာက ဥုံဖွံဆိုပြီး ထပြီး တိုးတတ်မသွားပါဘူး။ မြန်မာစာကို sorting လုပ်လိုက်လို့ မွန်စာမှာ sorting စီမရတော့တော့ ခင်ဗျားတို့မပြောတော့ဘူးလား။ ထိုနည်းတူ မြန်မာစာအခြေခံ တခြားတိုင်းရင်းသားစာပေတွေရဲ့ sorting တွေကို မစဉ်းစားဘူးလား။ sorting ကိစ္စကို စဉ်းစားခဲ့ရင်း တိုင်းရင်းသားအက္ခရာတွေကို ဘာလို့သီးခြားမပေးဘဲ မြန်မာအက္ခရာနဲ့ရောထားခဲ့သလဲ။ လူလေး ၁ သန်းပြည့်တဲ့ မြန်မာအက္ခရာပုံစံသုံး ယူနီကုဒ်တွေကို ခင်ဗျားတွေဘူးသလဲ။ ကျွန်တော်မြင်တာ တခုဘဲပါ။ တခြားသူတွေမှာ အမြင်တွေ ပိုများနိုင်ပါတယ်။ မျက်လုံးတလုံးနဲ့ မကြည့်ဘဲ၊ မျက်လုံး၂ ဘက်လုံးကို ကြည့်နိုင်အောင် ကြိုးစားပါ။

    ဧရာကို sorting မရဘူးပြောသူတွေအတွက် နမူနာလေးပါ။

    http://img.aahara.org/?di=1412952471755
    http://img.aahara.org/?di=9129524717514
    http://img.aahara.org/?di=14129524717512

    မြန်မာစာတိုးတတ်ဖို့ နည်းပညာရှင်တွေ တစ်စုတည်း လုပ်နေလို့ တိုးတတ်လာဖို့ မရှိပါဘူး။ ပူးပေါင်းပါဝင်မှာသာ ပြည့်စုံမှာပါ။ အခုလိုမျိုး လိုရာဆွဲပြော၊ ပြချင်တာ ချပြနေရင်တော့ အသင့်တို့ကြောင့် မြန်မာတိုင်းရင်းသားဘာသာ ပျက်ဖို့ရာသာရှိပါတယ်။

    • Ravi says:

      What is the key advantage of Ayar’s Storage sequence and also what do we gain by storing U+1031 and U+103C in front of the consonant? You would also agree that Ayar has taken a risk in following such a sequence by ignoring conformity and therefore does not satisfy what most softwares like Firefox expects. That means that there was a reason for the risk. What kind of assessments were made before the decision was taken to follow this model? I think readers like me would benefit from knowing why Ayar did different. Thanks.

  5. Ye Zaw Min says:

    ကျွန်တော် mysql မှာ မြန်မာလို ဒေတာရိုက်ထည့်ဖို့လိုတော့ မြန်မာယူနီကုတ်ကိုinstall လုပ်ပါတယ်။ ဒါပေမယ့် myphpadmin မှာ data entry လုပ်တော့ အဆင်မပြေပါခင်ဗျာ။ ဘယ်လိုအဆင်မပြေလဲဆိုတော့ အေ လို့ရိုက်လိုက်ရင် ပေါ်လာတာက အသဝေထိုး ပဲပေါ်တယ်။ သဝေထိုး အ လို့ မပေါ်ပါ။ ကျွန်တော် ဘာများလုပ်သင့်ပါသလဲခင်ဗျာ

    • Yaung Sein says:

      ကိုရဲဇော်မင်း ဒေတာဘေ့ထဲမှာ မြင်ရတာက “Storage Order” ပါ။ အဲဒီဒေတာကို ယူနီကုဒ်စံနစ် မြန်မာစာဖောင့်နဲ့ ထုတ်ပြလိုက်မှ “အေ” လို့ ပေါ်မှာဖြစ်ပါတယ်။

  6. Minn Kyaw says:

    ကျွန်တော်နောက်က ကွန်မန်းတွေတောင် တတ်နေပြီ၊ ကျွန်တော်ကွန်မန်း မတတ်သေးတာ အမြင်မတူရင် ထောက်ပြ ဝေဖန်တာကို မကြိုက်လို့ မတတ်တာလား။ မကြိုက်ရင် ဖျတ်လို့ရတယ်။ လိုအပ်မယ်ထင်လို့ ထောက်ပြတာ၊ ဝေဖန်တာကို လက်မခံရင် ထပ်မပြောတော့ပါ။
    နေရာတိုင်းမှာ ချွင်းချက်ရှိတယ်၊ တရားသေတွက်လို့မရတာတွေ ဒုနဲ့ဒေးပါဘဲ။

    • Thiha says:

      ကျွန်တော် ထောက်ပြ ဝေဖန်တာကို မကြိုက်လို့ မဟုတ်ပါဘူးခင်ဗျာ။ အကို့ ကွန်မင့်က အရမ်းရှည်တဲ့အတွက် Akasmit က Hold လုပ်ထားတာပါ။

  7. Ngwe Tun says:

    ကို​သီ​ဟ

    အလွန်​ကောင်း​သော​ရှင်းလင်း​ချက်​ဖြစ်​ပါ​သည်။
    အောက်​တွင်​ပြ​ထား​သော စာ​ကြောင်း​ကို ဖျက်​စေ​ချင်​ပါ​သည်။
    UTF-8 အပေါ်​မှာ အခြေ​ခံထား​တဲ့​အတွက် UTF-8 အခြေ​ခံ code point တွေ ဖြစ်​ပါ​တယ်။

    UTF-8 stands for Unicode Transformation Format-8. It is an octet (8-bit) lossless encoding of Unicode characters.

    UTF-8 encodes each Unicode character as a variable number of 1 to 4 octets, where the number of octets depends on the integer value assigned to the Unicode character.

    Please check how to differently store Unicode code point and UTF-8 at
    http://www.utf8-chartable.de/unicode-utf8-table.pl?start=4096

    Source : http://www.utf8.com/

    • Thiha says:

      ဟုတ်ကဲ့အကို ခုလို အမှန်ကို ပြောပြပေးတဲ့အတွက် ကျေးဇူးတင်ပါတယ်။ ကျွန်တော် ယူနီကုဒ် code point နဲ့ UTF-8 code point ကို သေသေချာချာ မသိဘူးခင်ဗျ၊ ဒါကြောင့် SQL ထဲမှာ ပြန်ခေါ်တဲ့အခါ ယူနီကုဒ် code point အတိုင်း မထွက်တာကိုး၊ ကျေးဇူးပါ အကို ကျွန်တော် ပြင်လိုက်ပါ့မယ်။

  8. Thiha says:

    ကိုသီဟ ကိုယ်တိုင် အားလုံးကိုသေချာ နားလည်စေချင်ပါတယ်။ နားမလည်ဘဲ လိုရာကိုဆွဲပြော လိုရာကို ယူရင် မှားသွားပေါ့။ ကိုသီဟာ ပြောခဲ့တဲ့ အချက်ကို ပြန်ပြောရရင်
    Logical order ကိုလညျး မလိုကျနာသလို ဗျည်း + ဗျည်းတှဲ + သရ ဆိုတဲ့ အစီအစဉ်ကိုလည်း မလိုက်နာပါဘူး။

    ခုလို ဆွေးနွေးပေးတဲ့အတွက် ကျေးဇူးအများကြီး တင်ပါတယ် ဆိုတာကို အရင်ပြောလိုပါတယ်။ ဒါပေမယ့် ကျွန်တော် တစ်ခု ပြောလိုပါတယ်။ ကျွန်တော် ပြောသွားတဲ့အထဲမှာ တုတ်ချီး – ပြီးပြောတဲ့ စကားတစ်ခွန်းမှ မပါဘူးဆိုတာ ကိုမင်းကျော်ကို အရင် အသိပေးလိုပါတယ်။ Mutual Respect ကို နားလည်တယ်ဆိုရင် အဲဒီ စကားအတွက် တာဝန် ပြန်ယူပေးပါ။ ကဲ ကိုမင်းကျော်ရေ ကျွန်တော့်ကို တိုက်ရိုက်ပြောပြီ ဆိုတော့ ကျွန်တော် တစ်ခုခြင်းစီ ပြန်ရှင်းပါ့မယ်။ အဲဒီ အပေါ်ဆုံ တစ်ပိုဒ်ကို ကျွန်တော် နားမလည်ဘူးဗျ။ ဘယ်ဟာကို ဆိုလိုပါသလဲ။ Logical Order ဆိုတဲ့ နေရာမှာ Unicode စံသတ်မှတ်ချက်ရဲ့ အစီအစဉ်ကိုသာ ကျွန်တော် အဓိက ဆိုလိုရင်း ဖြစ်ပါတယ်။ ကျွန်တော် ရေးတဲ့အထဲမှာလဲ သေသေချာချာ ရေးပြီးသားပါ။ ဗမာစာမှာတောင် Unicode ရဲ့ Logical Order အတွက် Locale တွေလည်း လိုနေပါသေးတယ်။ အဲဒီအပြင် ရှမ်းဘာသာ အတွက်ဆို၊ သီးသန့် Sorting Order, မွန်အတွက်ဆို မွန်ရဲ့ သီးသန့် Sorting Order တွေလိုဦးမှာ ဖြစ်ပါတယ်။ ဒါပေမယ့် ကျွန်တော် စမ်းသပ်ပြတဲ့ Program မှာ ဘာတစ်ခုမှ အထူးပြုလုပ်ချက် မပါပါဘူး။ Natural Sort ဆိုတဲ့ PHP ရဲ့ Function တစ်ခုမျှသာ ဖြစ်ပါတယ်။ ထွက်လာတဲ့ result အရလည်း အနီးစပ်ဆုံးမှန်တယ် ဆိုတဲ့ အဆင့်ပဲ ရှိပါတယ်။ အနီးစပ်ဆုံး မှန်တယ်ဆိုတာနဲ့ Processes တွေလည်း လျော့ချပြီး ဖြစ်ပါတယ်။ တစ်ခြားဟာတွေမှာ Sorting မရဘူးလို့ ကျွန်တော် ပြောတဲ့အထဲမှာ မပါပါဘူး။ Natural Sort မှာ စီလို့ မရတာကိုသာ ပြထားတာ ဖြစ်ပါတယ်။ အဲဒီ Natural Sort ဆိုတာလည်း ကျွန်တော်ရေးထားတာ မဟုတ်ပါဘူး။ UTF-8 အပေါ်မှာ PHP က အလိုလို သိနေတာ ဖြစ်ပါတယ်။ အဲဒီလိုပဲ PHP မှာလည်း သိသလို၊ ASP မှာလည်း သိမှာပါပဲ။ ဘာကြောင့် သိရတာလဲဆိုတော့ နိုင်ငံတကာက လက်ခံထားတဲ့ စံနှုန်းတစ်ခု ဖြစ်နေလို့ပါ။

    လိုရေးတဲ့ အဓိပ္ပါယ်ရော နားလည်သလား ….Logical order ဆိုတာ ဗညြျး + ဗညြျးတှဲ + သရ ဆိုတဲ့ အစီအစဉျ လို့လဲပြောသေးတယ်။ ပြီးတော့ဘဲ ၂ မျိုးဘဲ ကွာသလိုလို လုပ်နေပါလား …
    တယောက်ကလည်း Logical Order ကိုမလိုက်နာတာ တယောက်ကလည်း encoding ဆိုတာကို မလိုက်နာတာဆိုပြီး ကိုယ်နဲ့ အယူအဆ၊ အမြင်ချင်းမတူတာနဲ့ တုတ်ကိုချီး…. လုပ်နေသလိုဘဲဖြစ်နေပြီ။

    ဒီနေရာမှာလဲ အကိုလွဲနေပြီ ထင်ပါတယ်။ တကယတော့ အဲဒီလိုလိုက်နာခြင်း မလိုက်နာခြင်း ဆိုတာ ကျွန်တော့်ရဲ့ အယူအဆ မဟုတ်ပါဘူး။ တကယ် ရေးထားတဲ့ program မှာလည်း ကျွန်တော့် အယူအဆနဲ့ ရေးထားတာ တစ်ခုမှ မရှိပါဘူး။ natsort () ဆိုတာလည်း ကျွန်တော် ဖန်တီးထားတဲ့ function တစ်ခု မဟုတ်ပါဘူး။ ဒီနေရာမှာတော့ စကားကို နည်းနည်း ဆင်ခြင်ပြီး ပြောစေချင်ပါတယ်။

    မြန်မာယူနီကုဒ်ဆိုတာ တိုင်းရင်းသားစာတွေပါပါတယ်။ ခင်ဗျားတို့ အဲ့တာတို့ကို လေ့လာစေချင်ပါတယ်။ အဲ့တာပြီးမှ Logical Order စီသင့်မစီသင့် ပြောစေချင်ပါတယ်။ မြန်မာစာကို အခြေခံပြီး ယူနီကုဒ့်ကို လုပ်မယ်ဆိုရင် အဘ အဘ တွေပြောခဲ့တဲ့ တိုင်းရင်းသားစာကို ဇော်ဂျီတွေ ဖျတ်နေတယ်ဆိုသလို၊ မြန်မာယူနီကုဒ်က တိုင်းရင်းသားစာပေတွေကို ဖျတ်ဆီးသလို ဖြစ်ပါလိမ့်မယ်။ မွန်စာမှာ သရပြီးမှ ဗျည်း ကို စီတာပါ။

    တိုင်းရင်းသား ဘာသာစကာတွေ ပါတယ်ဆိုတာ ကျွန်တော် ကိုယ်တိုင်လည်း သိပါတယ်။ ကျွန်တော်ကိုယ်တိုင် ရှမ်းတစ်ဝက် ပါသလို၊ ရှမ်းစာ ယူနီကုတ်ဖြစ်တဲ့ ယွန်းချိုကိုသာ ဒီဆိုက်မှာ ကျွန်တော် သုံးထားတာပါ။ အဲဒီတော့ Logical Order ဆိုတာ အပေါ်မှာ ပြောခဲ့သလို Unicode စံရဲ့ Logical Order လည်း ရှိသလို၊ ဘာသာစကားအလိုက်လည်း Logical Order တွေ ရှိပါတယ်။ ခု Unicode က သတ်မှတ်ပေးထားတဲ့ စံမှာတင်ကို ဗမာစာအတွက် Logical Order တစ်ခု ထပ်ဖြည့်ပေးဖို့ လိုနေပါသေးတယ်။ အဲဒီလိုပါပဲ။ တိုင်းရင်းသား ဘာသာစကားတွေအတွက် Logical Order အစီအစဉ်ကိုလည်း ထည့်သွင်းစဉ်းစားပြီးမှသာ Code Point တွေကို သတ်မှတ်ထားတာ ဖြစ်ပါတယ်။ ကိုမင်းကျော်ကိုယ်တိုင် Unicode မှာ တိုင်းရင်းသားစာတွေ ပါတယ်လို့ ပြောခဲ့ပြီး ဖြစ်တဲ့အတွက် လေ့လာပြီး ဖြစ်ပါလိမ့်မယ်။ အဲဒီလို Sorting Order တွေကို ဖန်တီးဖို့ လိုအပ်နေပါသေးတယ်။ MySQL ဆိုရင်လည်း mm_UTF8 လိုမျိုး၊ shan_UTF8 လိုမျိုးတွေ သတ်မှတ်ပေးရပါလိမ့်ဦးမယ်။ ဒါပေမယ့် ပေါင်းစည်းလို့ ရနိုင်မယ့် အခြေအနေတွေလည်း အများကြီး ရှိနေပါသေးတယ်။

    Logical Order၊ encoding ကွဲတယ်ဆိုပြီးပြောတာထက် ဧရာနဲ့ တခြား မြန်မာယူနီကုဒ်တွေနဲ့ ေ၊ ြ— နဲ့–င်္ ၃မျိုးဘဲ မတူတာဘဲရှိတာ။ ကျန်တာတွေကရော တခြား မြန်မာယူနီကုဒ်တွေနဲ့ Logical Order၊ encoding စီတာတွေ မတူဘူးလား။ တူလားဆိုတာ ကိုသီဟ မသိဘူးထင်တယ်။ တုတ်ကိုချီး…. မလုပ်ပါနဲ့၊ အဲလို မတူလို့ ပရိုဂရမ်တော်တော်များများမှာ အသုံးချလို့ရတာတွေ မစဉ်းစား၊ မထောက်ပြဘဲ၊ အွန်လိုင်းမှာ ဘရောဇာ်လေး ၃ ခု ၄ ခု၊ ပရိုဂရမ်လေး ၃ ၄ခုလောက်မှာ သုံးလို့ရယုံလုပ်တာနဲ့ မြန်မာစာတိုးတတ်လာပြီလို့ ပြောလို့ရနိုင်မလား။ ယူနီကုဒ်ဆိုတာ မည့်သည့် ပရိုဂရမ်၊ မည်သည့် OS၊ မည်သည့် အပလိကေးရှင်းတွေမှာမဆို အသုံးပြုလို့ရ ရမယ်လို့ ဆိုထားခဲ့ပါ။ အဲလိုမရသေးဘဲနဲ့ ယူနီကုဒ်စစ်ပါတယ်ပြောနေတာကိုက သုံးစွဲသူတွေကို သတင်းမှားပေးပြီး ဆေးကြော်ငြာနေသလိုမဖြစ်နေဘူးလား။

    ကျွန်တော်ပြောတဲ့ နေရာမှာ မလိုက်နာဘူးလို့ ဆိုထားပါတယ်။ အဲဒါကို ကျွန်တော် လုံးဝ အတိအကျပြောလို့ရပါတယ်။ တကယ်တန်း သုံးခုလေး မတူတာဆိုပြီး ခွဲခြားထားရင် မလိုက်နာတာက မလိုက်နာတာပါပဲ။ တကယ်တန်းပြောရရင်ေ ြ င်္ သုံးမျိုး လိုက်နာလိုက်လို့ တိုင်းရင်းသား ဘာသာစကားတွေရဲ့ Logical Order ကို ထိခိုက်သွားစရာ အကြောင်း မရှိပါဘူး။ ဘာကြောင့် အဲဒီ သံးခုကို ချန်ထားခဲ့ရသလဲ ကျွန်တော် မသိပေမယ့် တကယ်တန်း Natural Sort နဲ့ စီတဲ့အခါမှာ စီလို့ မရတာကို တွေ့ရပါတယ်။ တကယ်တန်းတော့ တစ်တက်စားလည်း ကြက်သွန်၊ နှစ်တက်စားလည်း ကြက်သွန် ဖြစ်တဲ့အတွက် ဒါလေးတော့ rendering မလုပ်ဖူဆိုတာ မဖြစ်သင့်ဘူးလို့ ကျွန်တော် ထင်ပါတယ်။ အကယ်၍ အဲဒီလို မလိုက်နာရခြင်း အကြောင်းအရင်းကို (ဥပမာ – တိုင်းရင်းသား စာတွေကို ထိခိုက်မှာ စိုးလို့ဆိုရင် သက်သေပြပါ။ ဒါမှမဟုတ် သဝေထိုးက ရှေ့မှာ နေကို နေသင့်တယ်ဆိုရင်လည်း သက်သေပြပါ။ ကျွန်တော် ဖတ်သမျှ လေ့လာသမျှ ဘယ်တော့မှာ ဗျည်းရှေ့မှာ သရလာတာ မရှိပါဘူး။ တိုင်းရင်းသားတွေအတွက် အလေးထားတဲ့အတွက် သရတစ်ခု ရှေ့မှာ ထားတယ်ဆိုရင်လည်း ကျွန်တော်တို့ မြန်မာစာ အက္ခရာစဉ်အတွက် ထိခိုက်စေပါတယ်။ တကယ်တန်းတော့ ဒီ ယူနီကုဒ် Layout တစ်ခုတည်းမှာပဲ တိုင်းရင်းသား ဘာသာ စကားတွေအတွက် Sorting order တွေ ဖန်တီးဖို့ လိုအပ်ပါတယ်။ ခု ကျွန်တော် ပြလိုက်တဲ့ Program က PHP အပေါ်မှာ အခြေခံထားတယ်ဆိုပေမယ့် တကယ်တန်း natsort() ဆိုတဲ့ Function ဟာ မည်သည့် Programming Language မှာမဆို ပါဝင်မှာသေချာပါတယ်။ ကျွန်တော်ကိုယ်တိုင် PHP တစ်ခုတည်း လုပ်နေတာမဟုတ်ပဲ VB6, VB.NET, Java, C++ စသည်ဖြင့် အကုန်လုပ်ဖူးပါတယ်။ သေချာပါတယ်။ ကျွန်တော် အခုရေးသလိုမျိုး ရေးလို့ရမှာပါပဲ။ ဒီတော့ဗျာ ကျွန်တော်က Browser တစ်ခု အပေါ်မှာ တည်ပြီး စမ်းသပ် ပြတာ မဟုတ်ပါဘူး။ တကယ့်ကို နိုင်ငံတကာသုံး Sorting စနစ်တစ်ခု အပေါ်မှာ စမ်းသပ်ပြတာ ဖြစ်ပါတယ်။ နောက်တစ်ခုက မြန်မာစာ တိုးတက်နေပြီလို့ ကျွန်တော် ပြောတဲ့အထဲမှာ မပါပါဘူး။ အခုထိကို နိုင်ငံတကာက အသိအမှတ်ပြုတဲ့ အဆင့်ကို မရောက်သေးတာ အားလုံး အသိပဲ ဖြစ်ပါတယ်။ ကျွန်တော်တို့ ရှေ့ဆက် ကြိုးစား သွားရဦးမယ် ဆိုတဲ့ အဆင့်မှာပဲ ရှိသေးတယ်လို့ ကျွန်တော် ပြောခဲ့ပြီး ဖြစ်ပါတယ်။ နောက် ယူနီကုဒ် အစစ်ပါလို့ ကျွန်တော် သတင်းမှားပေးတယ်ဆိုရင် အဲဒါ ကျွန်တော် မဟုတ်ပါဘူး။ ယူနီကုဒ် စနစ်တစ်ခုလုံးက သတင်းမှား ပေးနေတာ ဖြစ်ပါလိမ့်မယ်။ အဲဒီ အပြင် natsort() လို function က အစသတင်းမှားပေး နေတာ ဖြစ်ပါလိမ့်မယ်။ အဲဒီလို သတင်းမှားပေးပြီး ဆေးကြော်ငြာနေတာ နိုင်ငံတကာက ဘာသာစကားပေါင်းစုံ ထည့်သွင်းထားတဲ့ Unicode စနစ်ကြီးကိုယ်တိုင်က မှားယွင်းတဲ့ သတင်းတွေ ပေးနေပါပြီ။ ဒါပေမယ့် ကျွန်တော်ကတော့ အဲဒီ ဆေးကို မှန်တယ်လို့ ယူဆပါတယ်။ ဒါကြောင့် သောက်ပါတယ်။ နောက်လူတွေကို ညွှန်းပါတယ်။
    တစ်ပိုင်းခြင်းစီ အကြောင်းပြန် သွားပါမယ်။

  9. Thiha says:

    အဲလို ၃ ၄ လုံးကြောင့် Sorting ကို တန်းပြီးမလုပ်နိုင်ပေမယ့်၊ လုပ်နိုင်တဲ့ နည်းစနစ်တွေက ရှိပြီးသားပါ။ ပရိုဂရမ်မာတွေလဲ လုပ်ပြထားပြီးသားပါပါ။ ဘယ်လိုစီစီ၊ အက္ခရာစဉ်တဲ့ အခါမှာ စီလို့ရနိုင်တယ်ဆိုတာကိုပါ။ (Sorting အောက်မှာ ဆက်ဖတ်ပါ။) ဘာကြောင့် ဘာအတွက် ဘာလို့ဆိုတာတွေကိုဘဲ ထည့်သွင်းစဉ်းစားစေချင်လို့ အကြံပြုတာပါ။ မြန်မာယူနီကုဒ့်ဆိုတာမှာ တိုင်းရင်းသားစာပေတွေပါ ပါပါတယ်။ ထို့အပြင် နည်းပညာနဲ့ ဘာသာဗေဒ ပညာရှင်တွေပါ ပူပေါင်းပါဝင်မှ ဖြစ်မှာပါ။ မြန်မာစာပညာရှင်တွေ တိုင်းရင်းသားပညာရှင်တွေကို နည်းပညာအကြောင်း၊ ကွန်ပျူတာအကြောင်း မသိလို့ ချန်ထားလို့ မရပါဘူး။ သူတို့ကိုဆွေးနွေးဖို့ ကွန်ပျူတာအရင်သင်ပေးရမယ်လို့ ပြောခဲ့ဘူးတဲ့ မြန်မာယူနီကုဒ်ပညာရှင်လဲ ရှိတယ်ဆိုတာလဲ သိစေချင်ပါတယ်။ မြန်မာစာ စာလုံးပေါင်းသတ်ပုံကျမ်းတွေက ခေတ်တိုင်းမှာ ဘာလို့ ကွဲပြားစွာ ရှိနေတာလဲ ဆိုတာကို သိစေချင်ပါတယ်။

    ကျွန်တော် အခုပြောသွားတဲ့ နေရာမှာ Program ကို နမူနာပေးသွားတာဆိုပေမယ့် တကယ်တန်း ပြောရရင် Program က အဓိက မဟုတ်ပါဘူး။ စနစ်ကသာ အဓိက ဖြစ်ပါတယ်။ Natual Sort ဆိုတဲ့ စနစ်ပါ။ Program အကူအညီ ယူရင်တော့ ဘယ် ဘာသာ စကားမဆို စီလို့မှာ သေချာတယ်ဆိုတာ ကျွန်တော်လည်း သိပါတယ်။ ဒါပေမယ့် တကယ်တန်း ဖြစ်သင့်တာက Program အကူ အညီ မယူပဲ Locale တစ်ခု ထည့်တာနဲ့ ဒီအတိုင်း စီလို့ရတဲ့ အနေအထားကို လိုချင်တာပါ။ ကျွန်တော် အခုစီပြထားတာလဲ အပေါ်မှာ ပြောခဲ့သလို ဘယ် Programming Language မှာ မဆို စီလို့ရရပါမယ်။ Excel မှာဆိုရင်လည်း Locale တစ်ခုထည့် တန်းစီ၊ (ခုလောလောဆယ်တော့ Open Office မှာ ဗမာစာအတွက် စီလို့ရနေပါပြီ) အဲဒီလိုပဲ Natual Sort နဲ့ စီလို့ရတဲ့ အနေအထားကို ဆိုလိုပါတယ်။ နောက် မြန်မာယူနီကုဒ် စနစ်ကို ကွန်ပျူတာ ပညာရှင်တွေပဲ လုပ်ထားတာ မဟုတ်ပါဘူး။ ဆရာကြီး မောင်သာနိုးတို့လို ဆရာမောင်ခင်မင်တို့လို ဆရာကြီးတွေ ပူးပေါင်း ပါဝင်ပြီး စီစဉ်ထားတာ ဖြစ်ပါတယ်။ ကျွန်တော်က ယူနီကုဒ် Code Point ကိုသာ သိပါတယ်။ အခု အကိုပြောတာတွေ ကျွန်တော် မသိပါဘူး။

    sorting ကိစ္စ
    sorting ကိစ္စကို ကိုသိဟရဲ့ ဆရာ့ ဆရာတွေကိုယ်တိုင် ပြောထားပါတယ်။ OS ဖန်တီးသူတွေကိုယ်တိုင် ဖန်တီးပေးမှ မြန်မာ sorting အလုပ်လုပ်မှာပါလို့ ပြောထားခဲ့ပါတယ်။ အင်္ဂလိပ်စာမှာတောင် a နဲ့ A နဲ့ စီတာ မတူဘူးဆိုပြီးထောက်ပြထားတာတွေတွေ့မှာပါ။ အင်္ဂလိပ်စာတောင် မှ အဲလိုဖြစ်နေသေတးယ်။ အခုခင်ဗျားထောက်ပြထားတဲ့ sorting ကိစ္စ အဆင်ပြေတာနဲ့ မြန်မာစာက ဥုံဖွံဆိုပြီး ထပြီး တိုးတတ်မသွားပါဘူး။ မြန်မာစာကို sorting လုပ်လိုက်လို့ မွန်စာမှာ sorting စီမရတော့တော့ ခင်ဗျားတို့မပြောတော့ဘူးလား။ ထိုနည်းတူ မြန်မာစာအခြေခံ တခြားတိုင်းရင်းသားစာပေတွေရဲ့ sorting တွေကို မစဉ်းစားဘူးလား။ sorting ကိစ္စကို စဉ်းစားခဲ့ရင်း တိုင်းရင်းသားအက္ခရာတွေကို ဘာလို့သီးခြားမပေးဘဲ မြန်မာအက္ခရာနဲ့ရောထားခဲ့သလဲ။ လူလေး ၁ သန်းပြည့်တဲ့ မြန်မာအက္ခရာပုံစံသုံး ယူနီကုဒ်တွေကို ခင်ဗျားတွေဘူးသလဲ။ ကျွန်တော်မြင်တာ တခုဘဲပါ။ တခြားသူတွေမှာ အမြင်တွေ ပိုများနိုင်ပါတယ်။ မျက်လုံးတလုံးနဲ့ မကြည့်ဘဲ၊ မျက်လုံး၂ ဘက်လုံးကို ကြည့်နိုင်အောင် ကြိုးစားပါ။

    အဲဒီလို ယူနီကုဒ်စံလိုက်နာလိုက်တာနဲ့ Sorting လုပ်လို့ရမယ်လို့ ကျွန်တော် တစ်ခါမှ လက်မခံဖူးပါဘူး။ နောက် ThanLwinSoft လို မြန်မာစာအတွက် လုပ်ပေးနေတဲ့ နိုင်ငံခြားသားတွေကလည်း လက်မခံပါဘူး။ Locale တစ်ခု ပေါင်းထည့်ပေးရမယ်ဆိုတာ အားလုံး လက်ခံထားပါတယ်။ Linux အတွက်လည်း ရေးပေးထားတာ ThanLwinSoft မှာ သွားဖတ်နိုင်ပါတယ်။ ဗမာစာအတွက် Sorting စီတဲ့ စနစ်ထည့်လိုက်တဲ့အတွက် မွန်စာ စီမရတော့ဘူးဆိုတာ တကယ်တန်းတော့ ဘာသာ စကားတစ်ခုခြင်းစီမှာသာ သက်ဆိုင်ပါတယ်။ ဘာကြောင့် အဲဒီလို ခွဲခြားပြောရသလဲ။ ဒါကတော့ ရှင်းရှင်းလေးမှာ တစ်ခုနဲ့ တစ်ခု Logical Order မတူလို့ပါ။ ဒါပေမယ့် အကိုပြောသလို ဗမာစာကို Logical Order နဲ့စီလိုက်တဲ့အတွက် တိုင်းရင်းသားဘာသာ စကားတွေအတွက် Logical Order အောက်သွားတယ်ဆိုရင် ကျွန်တော့်ကို တစ်ချက်လောက် သက်သေပြပါတယ်။ ကျွန်တော်ကတော့ လုံးဝ ထိခိုက်စရာ မရှိဘူးလို့ ယုံကြည်ထားပါတယ်။ အဲဒီလို Sorting Order တွေအတွက်လည်း တစ်ခုပြီး တစ်ခု ထွက်လာအောင် ကျွန်တော်တို့ ကြိုးစားသွားမှာပါ။ မျက်လုံးနှစ်ဖက် ကြည့်နိုင်ဖို့အတွက် အကိုတို့ကိုပဲ အကူအညီတောင်းရမှာ ဖြစ်ပါတယ်။ ကျွန်တော်ကတော့ ယူနီကုဒ်ရဲ့ စံနှုန်းပေါ်က အမြင်နဲ့သာ လေ့လာထားတာ ဖြစ်ပါတယ်။

    ဧရာကို sorting မရဘူးပြောသူတွေအတွက် နမူနာလေးပါ။

    http://img.aahara.org/?di=1412952471755
    http://img.aahara.org/?di=9129524717514
    http://img.aahara.org/?di=14129524717512

    မြန်မာစာတိုးတတ်ဖို့ နည်းပညာရှင်တွေ တစ်စုတည်း လုပ်နေလို့ တိုးတတ်လာဖို့ မရှိပါဘူး။ ပူးပေါင်းပါဝင်မှာသာ ပြည့်စုံမှာပါ။ အခုလိုမျိုး လိုရာဆွဲပြော၊ ပြချင်တာ ချပြနေရင်တော့ အသင့်တို့ကြောင့် မြန်မာတိုင်းရင်းသားဘာသာ ပျက်ဖို့ရာသာရှိပါတယ်။

    ကျွန်တော် လိုရာဆွဲပြောတာ တစ်ခုမှ မပါပါဘူး။ နောက် ကျွန်တော် ညွှန်းထားသမျှ အားလုံး ကျွန်တော် ရေးထားတာ တစ်ခုမှ မပါပါဘူး။ PHP Program လေး မတောက်တစ်ခေါက်တော့ ပါပါတယ်။ တကယ်တန်း သုံးထားတာက Natual Sort ဆိုတဲ့ PHP ရဲ့ Built-in Function တစ်ခုမျှသာ ဖြစ်ပါတယ်။

  10. Ngwe Tun says:

    ကိုသီဟရေ…

    ကျွန်တော် Open Office 3.3.0 မှာ မြန်မာလို အက္ခရာစဉ်လို့ရတဲ့ပုံလေးတင်ပေးထားတယ်။

    http://www.facebook.com/photo.php?pid=8588815&l=96885f92b3&id=736155459

  11. Minn Kyaw says:

    Natural Sort နဲ့ စီတဲ့အခါမှာ စီလို့ မရတာကို တွေ့ရပါတယ်။

    Natural Sort နဲ့ စီတဲ့ အရာ ကို ပြောပြပါလား …

    PHP, Open Office ဆိုတာကတွေ software တွေမဟုတ်ဘူးလား။ Open Office မှာအလုပ်လုပ်ဖို့အတွက် ပရိုဂရမ်မာ ရေးထားတဲ့ အတွက် sorting လုပ်လို့ရတာ မဟုတ်ဘူးလား။ အဲ့တာကိုဘဲ ကိုသီဟပြောပြထားတာဘဲ …

    ThanLwinSoft လို မြန်မာစာအတွက် လုပ်ပေးနေတဲ့ နိုင်ငံခြားသားတွေကလည်း လက်မခံပါဘူး။ Locale တစ်ခု ပေါင်းထည့်ပေးရမယ်ဆိုတာ အားလုံး လက်ခံထားပါတယ်။ ………. ဗမာစာအတွက် Sorting စီတဲ့ စနစ်ထည့်လိုက်တဲ့အတွက် မွန်စာ စီမရတော့ဘူးဆိုတာ တကယ်တန်းတော့ ဘာသာ စကားတစ်ခုခြင်းစီမှာသာ သက်ဆိုင်ပါတယ်။ ဘာကြောင့် အဲဒီလို ခွဲခြားပြောရသလဲ။ ဒါကတော့ ရှင်းရှင်းလေးမှာ တစ်ခုနဲ့ တစ်ခု Logical Order မတူလို့ပါ။

    Logical Order အကြောင်းတွေကို ရှင်းပြပါလား။ အဲ့တာတောတော့ မရှိင်းပြဘဲ သိတာလေးနဲ့ ရမ်းတုတ် လုပ်နေလို့ မဖြစ်ဘူးထင်ပါတယ်။ ဗမာစာအတွက် Sorting စီတဲ့ စနစ်ထည့်လိုက်တဲ့အတွက် မွန်စာ စီမရတော့ဘူးဆိုတာ တကယ်တန်းတော့ ဘာသာ စကားတစ်ခုခြင်းစီမှာသာ သက်ဆိုင်ပါတယ်။ ဘာကြောင့် အဲဒီလို ခွဲခြားပြောရသလဲ။ ဒါကတော့ ရှင်းရှင်းလေးမှာ တစ်ခုနဲ့ တစ်ခု Logical Order မတူလို့ပါ။

    Sorting Order တွေ လုပ်နေရပြီဆိုထဲ့က Natual Sort ဖြစ်ပါ့မလား စဉ်းစားစရာပါဘဲ။ အဲ့တာကိုက ယူဇာတွေ ကို အမြင်မှားစေတယ်လို့ မြင်တယ်။ ကျွန်တော်ပြောခဲ့တာဘဲ မွန်စာမှာ သရ က လာပြီးမှ ဗျည်းလာတယ်ဆိုတာ… ဒီထက်သိရှိလေ့လာဖတ်ကြည့်ပါ။

    

    • Thiha says:

      Natural Sort ဆိုတာ Sorting Algorithm တစ်ခု ဖြစ်တယ်ဆို အကို သိမယ်ထင်ပါတယ်။ အဲဒီ Algorithm က ဘယ်နေရာ မဆို ပေါင်းထည့်လို့ရတယ်၊ ဘယ်နေရာမှာ မဆို အကျုံးဝင်မယ် ဆိုတာလဲ အကိုသိမှာပါ။ အဲဒီလို ပေါင်းထည့်ထားတဲ့ စနစ်ရှိတဲ့ ဘယ်နေရာမှာ မဆို Sorting စီလို့ရတာကို Program တစ်ပုဒ်ရေးပြီးမှ စီလို့ရတာနဲ့ နှိုင်းယှဉ်လို့ မရပါဘူး။ တကယ်တော့ User Level Sorting တစ်ခုမျှသာ ဖြစ်ပါတယ်။ အဲဒါကို အကိုက Program အကူအညီ ယူရတယ်လို့ သတ်မှတ်တယ်ဆိုရင်လည်း အကို့သဘောပါပဲ ခင်ဗျာ။ အဲဒီ ကိစ္စကို အကိုနဲ့ အငြင်းမပွားလိုတော့ပါဘူး။ နောက်ပြီး PHP ဆိုတာကို Software လို့ ယူဆတယ် ဆိုရင်လည်း အကို့ သဘောပါပဲခင်ဗျာ။

      Sorting Order တွေနဲ့ ပတ်သက်ပြီး ပြောရရင်တော့ Natural Sort မှာ အနီးစပ်ဆုံး စီနိုင်တာကိုပဲ ကျွန်တော် ပြောသွားတာပါခင်ဗျာ။ Perfect Sorting လို့ ကျွန်တော် မပြေခဲ့ပါဘူးခင်ဗျာ။ အဲဒီလို Natural Sort အပေါ်မှာ Locale တစ်ခု ထည့်သွင်းပေးဖို့ လိုဦးမှာပါ။ ဗီယက်နမ်အတွက်လည်း လိုသလို ဂျာမာန် အတွက်လည်း လိုဦးမှာ ဖြစ်ပါတယ်။ မြန်မာစာမှာ ဗျည်းပြီးတော့ သရလာတယ်ဆိုရင် အဲဒီအတိုင်း စီတဲ့ စနစ်ကို Natural Sort အပေါ်မှာ အုပ်လိုက်ရုံပါပဲ။ မွန်မှာ သရပြီးမှ ဗျည်းလာတယ် ဆိုရင်လည်း အဲဒီအတိုင်း Natural Sort အပေါ်မှာ ထပ်အုပ် ပေးဖို့ လိုဦးမှာ ဖြစ်ပါတယ်။ အဲဒီလို လမ်းအတို ရှိပါလျှက်နဲ့ ပတ်သွားနေမယ်ဆိုရင် ခရီးတွင်မတွင် အကိုပဲ စဉ်းစား ကြည့်ပါခင်ဗျာ။ ကျွန်တော် Logical Order လိုက်နာတဲ့အတွက် Natural Sort ကို သုံးလို့ရမယ်။ အဲဒီမှာ ပိုပြီး လွယ်သွားမယ်လို့ ဆိုလိုရင်း ဖြစ်ပါတယ်။

  12. Minn Kyaw says:

    ကျွန်တော်ကိုယ်တိုင် PHP တစ်ခုတည်း လုပ်နေတာမဟုတ်ပဲ VB6, VB.NET, Java, C++ စသည်ဖြင့် အကုန်လုပ်ဖူးပါတယ်။ သေချာပါတယ်။ ကျွန်တော် အခုရေးသလိုမျိုး ရေးလို့ရမှာပါပဲ။
    အခုပြောတဲ့ ပရိုဂရမ်တွေလုပ်နေတယ်လို့ ဆိုလိုတာလား။ ဒီမှာ ကိုငွေထွန်းပြောထားတာလေးကို ကြည့်လိုက်ပါ။ ဘယ်အတိုင်းအထိ ရနပြေီလဲ ဆိုတာ စဉ်းစားနိုင်အောင်လို့ပါ။
    ကျွန်တော်ပြောတာ အလုပ်မလုပ်တာကို ပြောတာပါ။
    http://ayarunicode.googlecode.com/files/glitch_in_myanmar_unicode.pdf

    ပရိုဂရမ်မကူဘဲ လုပ်လို့ရတဲ့ဆိုတဲ့ ဘာသာစကား မရှိသလောက်နည်းပါတယ်။
    သေချာတာတခုကတော့ အမြင်နဲ့ ပြောနေလို့ မရဘူးဆိုတာဘဲ။

    • Thiha says:

      အပေါ်မှာ အကြောင်းပြန်ထားတာနဲ့ အတူတူပဲ ဖြစ်တဲ့အတွက် ထပ်မရေးတော့ပါဘူး ခင်ဗျာ၊ Natural Sort ကိုသာ ဆိုလိုရင်း ဖြစ်ပါတယ်။ Myanmar Sort မဟုတ် သေးပါဘူးခင်ဗျာ

  13. Minn Kyaw says:

    Program အကူအညီ ယူရတယ်လို့ သတ်မှတ်တယ်ဆိုရင်လည်း အကို့သဘောပါပဲ ခင်ဗျာ။ အဲဒီ ကိစ္စကို အကိုနဲ့ အငြင်းမပွားလိုတော့ပါဘူး။ နောက်ပြီး PHP ဆိုတာကို Software လို့ ယူဆတယ် ဆိုရင်လည်း အကို့ သဘောပါပဲခင်ဗျာ။

    PHP ဆိုတာကို Software လို့ ပြောတာ မဟုတ်ဘူးလေ။ ရောမချပါနဲ့။ ကျွန်တော်ဆိုလိုတာက နောက်က အိုပင်းအောဖ့်ဖစ်ကိုဆိုလိုတာ။PHP ဆိုတာက ပရိုဂရမ်မင်း မဟုတ်ဘူးဆိုရင် ကျွန်တော်အမှား။ သူက ရိုးရိုး text လိုဆိုရင်ပေါ့။

    Sorting Order တွေနဲ့ ပတ်သက်ပြီး ပြောရရင်တော့ Natural Sort မှာ အနီးစပ်ဆုံး စီနိုင်တာကိုပဲ ကျွန်တော် ပြောသွားတာပါခင်ဗျာ။ Perfect Sorting လို့ ကျွန်တော် မပြေခဲ့ပါဘူးခင်ဗျာ။ အဲဒီလို Natural Sort အပေါ်မှာ Locale တစ်ခု ထည့်သွင်းပေးဖို့ လိုဦးမှာပါ။ ဗီယက်နမ်အတွက်လည်း လိုသလို ဂျာမာန် အတွက်လည်း လိုဦးမှာ ဖြစ်ပါတယ်။ မြန်မာစာမှာ ဗျည်းပြီးတော့ သရလာတယ်ဆိုရင် အဲဒီအတိုင်း စီတဲ့ စနစ်ကို Natural Sort အပေါ်မှာ အုပ်လိုက်ရုံပါပဲ။ မွန်မှာ သရပြီးမှ ဗျည်းလာတယ် ဆိုရင်လည်း အဲဒီအတိုင်း Natural Sort အပေါ်မှာ ထပ်အုပ် ပေးဖို့ လိုဦးမှာ ဖြစ်ပါတယ်။ အဲဒီလို လမ်းအတို ရှိပါလျှက်နဲ့ ပတ်သွားနေမယ်ဆိုရင် ခရီးတွင်မတွင် အကိုပဲ စဉ်းစား ကြည့်ပါခင်ဗျာ။ ကျွန်တော် Logical Order လိုက်နာတဲ့အတွက် Natural Sort ကို သုံးလို့ရမယ်။ အဲဒီမှာ ပိုပြီး လွယ်သွားမယ်လို့ ဆိုလိုရင်း ဖြစ်ပါတယ်။

    အဲလိုလွယ်အောင် လုပ်ဖို့လိုတာမှာ အားနည်းချက်ရှိတယ်လေ။ မွန်မှာဆို သြ ဆိုတာ သ ထဲမှာလဲစီတယ်။ သရထဲမှာလဲ စီတယ်။ အ ဆိုတာကို ဗျည်းထဲမထားဘဲ သရထဲမှာထားပါတယ်။
    ဗျည်းမှာ အ ဆိုတာ မွန်မှာ မရှိပါ။ ထို့အတိူ တခြား ပလောင် ကယားတွေမှာလဲ သူဟာနဲ့သူ ရှိပြီးသားတွေရှိပါတယ်။ ငါတို့ဦးတယ်။ ငါတို့လုပ်ထားမှ စတန်းဒတ်ဖြစ်ရင်တော့ မသိပါ။ တကယ်လို့ ရတယ်ဆိုရင် openoffice မှာ စီပြပါလား။ တကယ်လို့ ရနေပြီဆိုရင်။
    အဲ့လိုမျိုးအားနည်းချက်တွေကို အဖြေရှာဖို့ လိုပါတယ်။ အဖြေမရှာဘဲ ရပါပြီလို့ ပြောနေတာကို အားနည်းချက်တခုမြင်မိလို့ပြောမိတာပါဗျာ။ အာနးည်းချက်မဟုတ်ရင်လည်း ထားလိုက်ပါတော့။ မပြောတော့ပါ။ တခါတလေ လှေချည်းထိုး ရိုးရိုးဆိုပေမယ့်လည်း၊ နေရာတိုင်းမှာလှေချည်းထိုး….လို့မရနိုင်ပါ။

    ကျွန်တော်တို့ နေရာတိုင်းကို လွယ်လွယ်တွေးလို့ လွယ်လွယ်လုပ်လို့မရဘူးထင်ပါတယ်။ စနစ်ကောင်းမှ တိုးတတ်မယ်ဆိုတာ သိမှာပါ။ ဥပမာတော့ မပေးလိုတော့ပါဘူး။ ကျွန်တော်ဆိုလိုချင်တာက စနစ်ကောင်းဖို့ ဘယ်လို့လုပ်မလဲ ဆိုတာပါ။

    • Thiha says:

      ဟုတ်ကဲ့ အကိုရေ ခုလို ဆွေးနွေးပေးတာ ကျေးဇူး အများကြီး တင်ပါတယ်ခင်ဗျာ

    • Thiha says:

      အကိုပြောတဲ့အထဲမှာ မွန်ဘာသာအတွက် Sorting Order မရသေးတာ အားနည်းချက် အဖြစ်လက်ခံပါတယ် ခင်ဗျာ။ တစ်ခြား ဘာသာစကားတွေအတွက်လည်း မရသေးတဲ့အတွက် အားနည်းချက် အနေနဲ့ ရှိနေပါသေးတယ်။ တကယ်တန်း ပြောရရင် ကျွန်တော်တို့ ဗမာမှာတောင် အားနည်းချက်တွေ ရှိနေတာ အကိုလည်း အသိပဲ ဖြစ်ပါလိမ့်မယ်။ တကယ်တန်း ၁ ကို ရှေ့ဆုံးမှာ စီသင့်ပေမယ့် မစီသေးတာ၊ ကြိုးနဲ့ ကြိုက်မှာ ကြိုးက အရင်လာရမှာ စတာတွေ မှားနေပါသေးတယ်။ အဲဒီအတွက်လည်း ကြိုးစားနေတယ်လို့ ကျွန်တော် သိရပါတယ်။ အမြန်ဆုံး ထွက်လာပါစေလို့ ဆုတောင်းပါတယ်။ ကိုယ့်က ဦးတယ်၊ ကိုယ်က အရင်ယူထားတယ်ဆိုတာ မဟုတ်ပါဘူး။ တကယ်တော့ ဘယ်သူမှာ မှန်အောင် မစီနိုင်သေးပါဘူး ခင်ဗျာ။ နောက်များလဲ ဆွေးနွေးပေးပါဦးခင်ဗျာ

  14. Minn Kyaw says:

    http://ayarunicode.googlecode.com/files/U1A20.pdf
    http://ayarunicode.googlecode.com/files/U1980.pdf

    သူတို့ဟာလေးတွေကိုလဲ လေ့လာသင့်တယ်တင်ပါတယ်။ သူတို့လဲ မြန်မာအက္ခရာနဲ့ပုံစံတူတွေဘဲလေ။ လူ ၁သန်းလောက်ရှိတဲ့ သူတို့တောင်မှ သူတို့ဘာသာစကားတခုအတွက် သူတို့ သီးသန့်လုပ်နိုင်သေးတာဗျာ။ မွန်၊ ရှမ်း၊ စတာတွေအတွက်ရော … သီးသန့်လုပ်ထားခဲ့ရင် မကောင်းဘူးလား။ ပိုမလွယ်နိုင်ဘူးပေါ့။ ၁ ကတော့ အစကနေ ပြန်စီလို့ရမယ် မထင်၊ သူက အက္ခရာပြီးမှ ဂဏန်းလာတာကိုး။

  15. Ngwe Tun says:

    @Ko Minn Kyaw

    Please test http://demo.icu-project.org/icu-bin/locexp?_=my&d_=en&x=col
    Which can be test and report burmese sorting is wrong or not. You must test with Unicode encoding with logical order. :)

    Actually, Right now, we don’t need to worry about any software or programming to learn for the sorting. Just type Burmese Text in Open Office Spreadsheet and find Sort Button.

    We don’t need to worry about other language. After knowing their sorting order, we can report to CLDR once and get sorting features done in ICU related software. For the CLDR and ICU specification, we don’t need programmer or software developer. Just read http://cldr.unicode.org/index/cldr-spec/collation-guidelines and submit our language nature and collate order. Howdy. it is so easy.

  16. Ngwe Tun says:

    >>> ကျွန်တော်ပြောခဲ့တာဘဲ မွန်စာမှာ သရ က လာပြီးမှ ဗျည်းလာတယ်ဆိုတာ…
    http://img510.imageshack.us/img510/7229/45858435.jpg
    Please double confirm with it. Which combination come Vowel First and Consonants. there are no combination as Vowel First and Consonants latter. It might be Vowel + Vowel pattern in mon.

  17. Minn Kyaw says:

    ကျွန်တော်ပြောနေတာ sorting မှာပါ။ အဲ့အတွက်
    မွန်မြန်မာ အဘီဓါန်တွေကိုပါလေ့လာစေချင်ပါတယ်။ မြန်မာနဲ့ မွန် သဒ္ဒါနှိုင်းယှဉ်ချက်တွေမှာပါ လေ့လာကြည့်ပါ။
    http://i54.tinypic.com/4l0sj8.jpg
    က တခုပါ။ သူက သရထဲမှာလဲနေသလို ဗျဉ်းထဲမှာလဲနေပါတယ်။sorting စစီရင် အကနေစစီပါတယ်။ အ ကို ဗျည်းထဲမှာ မထည့်ပါဘူးခင်ဗျာ။ အဲ့တာမို့ sorting စစီရင် သရ ဖြစ်တဲ့ အ ဆိုတဲ့ သရကို အရင်စီပြီးမှ ဗျည်းက က ကို စီကြောင်း ဖတ်ဖူးမှတ်သားဘူးပါတယ်။

  18. စည်သူ says:

    တကယ်တမ်းပြောရရင် ဘာနည်းသုံးသုံး လက်ရှိယူနီကုတ်ပွိုင့်သတ်မှတ်ချက်တွေနဲ့ မှန်အောင် စီလို့ မရနိုင်သေးပါဘူးဗျာ။ ပြဟန် နဲ့ ပြဿနာ နှစ်ခုကိုစီဖို့လုပ်ကြည့်ပါလား။ အဲဒီတော့ တကယ်တမ်းလိုနေတာကလက်ရှိယူနီကုတ်ပွိုင့်တွေကို အားလုံးအတွက် အဆင်ပြေအောင် ယူနီကုတ် ကွန်ဆော့တီယန် ကိုပြန်တောင်းဖို့ပဲဖြစ်နိုင်တယ်။ ဒါကိုပြန်လုပ်ဖို့ကျတော့ NLP ကသူဦးဆောင်ပြီးလုပ်ခဲ့တာကြီးကိုမှားပါတယ်ဆိုပြီး ၀န်ခံဖို့ခက်နေတယ်ထင်ပါတယ်၊

  19. Ngwe Tun says:

    >>>လက်ရှိယူနီကုတ်ပွိုင့်သတ်မှတ်ချက်တွေနဲ့ မှန်အောင် စီလို့ မရနိုင်သေးပါဘူးဗျာ။ နှစ်ခုကိုစီဖို့လုပ်ကြည့်ပါလား။

    What is right order.
    1. ပြဟန်
    2. ပြဿနာ

    or

    1. ပြဿနာ
    2. ပြဟန်

    Check it here. I don’t know what you are arguing to NLP Lab. If you can improve current standards. Why you keep silent for that?
    http://img141.imageshack.us/img141/9136/icug.png

  20. Lionslayer says:

    စီတယ်ဆိုရင် Encoding နဲ့ မှားပြီး နားလည်နေမယ်။ အက္ခရာစဉ်တယ်လို့ ပြောရအောင်။

    အပေါ်က ကွန်းမန့်တွေမှာ ပြောသွားတာကို ကျွန်တော် နားလည်သလို ပြန်ရေးပြမယ်။ လွဲနေရင် လွဲနေတယ် ပြောပါ။

    ကိုသီဟ။ ။ လောလောဆယ် မြန်မာအက္ခရာစဉ်ထုံးအတိုင်း နေရာတိုင်းမှာ မထောက်ပံ့ပေးထားသော်လည်း ဗျည်းသီးသန့်ကွဲအောင် နေရာတိုင်းမှာ စဉ်လို့ရပြီ။ ဥပမာ မိုက်ကရိုဆော့ အော့ဖစ်၊ SQL၊ ယူနီကုဒ်စာတွေ စဉ်ပေးနိုင်တဲ့ ဘယ် OS မဆို၊ ဘယ် Office suite မဆို။

    ကိုမင်းကျော်။ ။ ယူနီကုတ်စဉ်ဖို့ ဆော့ဝဲအကူလိုတယ်။ ယူနီကုတ်မှာ တိုင်းရင်းသား အက္ခရာတွေ စဉ်လို့မရ။

    ဒီတော့ ကျွန်တော်တို့ ဒီလို စဉ်းစားကြည့်ရအောင်။
    ၁။ နည်းပညာအကူမပါရင် ယူနီကုဒ်စဉ်လို့မရ။
    မှန်ပါတယ်။ A နဲ့ a ဝိတ်အတူတူဖြစ်ပါတယ်ဆိုတာ OS ကိုယ်တိုင်က သတ်မှတ်ပေးထားမှ အမှန်စဉ်လို့ ရပါတယ်။
    ၂။ အိုအက်စ်က ဘာကို စံထားပြီး သတ်မှတ်ပေးမလဲ။
    ရှင်းပါတယ်။ ယူနီကုဒ်ကို စံထားပြီး သတ်မှတ်ပေးပါတယ်။

    အင်္ဂလိပ်စာကို ကုဒ်ပွိုင့်နဲ့ စီလို့မရသလိုပဲ မြန်မာစာကို ကုဒ်ပွိုင့်နဲ့ စီမရပါ။ မြန်မာ အက္ခရာစဉ်ဟာ အသံနဲ့ စဉ်ပါတယ်။ ကုဒ်ပွိုင့်ပြောင်းလိုက်ရုံနဲ့ စီလို့ရမယ် ထင်နေသူများ လုံးဝ(လုံးဝ) မရနိုင်ကြောင်း ရဲရဲကြီး အာမခံပါတယ်။

    ဒါဆို မြန်မာ အက္ခရာစဉ်အမှန်ကို ဆော့ဝဲတိုင်း ပလက်ဖောင်းတိုင်းက ဘယ်လို လိုက်သိနိုင်မလဲ။

    ဒီမှာတင် စံ (စတန်းဒတ်) ဆိုတာ စကားပြောလာပါပြီ။ တံတားပဲဆောက်ဆောက်၊ လမ်းပဲဖောက်ဖောက်၊ စည်သွပ်ဘူးပဲ လုပ်ရောင်းရောင်း ဘယ်နှမီတာ၊ ဘယ်နှမီလီမီတာ ရှိတယ်လို့ပြောရင် လူတိုင်းသိပါတယ်။ ကမ္ဘာသုံးစံ ဖြစ်လို့ပါပဲ။ ထိုနည်းတူစွာ မြန်မာစာ၊ မွန်စာ၊ ရှမ်းစာ၊ ကရင်စာ ဘယ်လိုစီတယ်ဆိုတာ သိဖို့ ယူနီကုဒ် ကွန်ဆော့တီယမ်က ချပေးထားတဲ့စံတွေကို စံ အဖြစ် အကောင်အထည်ဖော်ပေးနေတဲ့ စံ အဖွဲ့အစည်းတွေ စံ ပရောဂျက်တွေ ရှိပါတယ်။ စာလုံးစီနည်းကို Locale တစ်ခုစီအတွက် စီလို့ရအောင် အသင့်သုံးနိုင်တဲ့ နည်းပညာတွေ ပြုလုပ်ပေးနေတဲ့ ICU CLDR ပရောဂျက်တွေ ဖြစ်ပါတယ်။

    မြန်မာကို ၁ ကနေစလို့ အစဉ်လိုက် စီနိုင်အောင် သူတို့က အသင့်လုပ်ပေးပါတယ်။ ထိုနည်းတူစွာ မြန်မာပါဠိ Locale အတွက် တောင်းဆိုမှုတွေ ရှိလာရင် အ ကနေ ပြောင်းပန် ပြန်စဉ်လို့ရအောင် သူတို့ လုပ်ပေးနိုင်ပါတယ်။ ထိုနည်း တူစွာ မွန်စာမှာ သရအနေနဲ့သုံးတဲ့ဝဏ္ဏတွေ ရှေ့က လာပါတယ်ဆိုလည်း အဲဒီအတိုင်း စဉ်လို့ရအောင် အသင့် လုပ်ပေးနိုင်ပါတယ်။ ဒါပေမဲ့ သူတို့က ယူနီကုဒ်စံ အက္ခရာတွေနဲ့ ယူနီကုဒ်စံ Encoding တွေကိုသာ လိုက်နာမှာ ဖြစ်ပါတယ်။

    OSX, Windows, Database system တွေက မြန်မာစာကို Support လုပ်ပြီဆိုတာနဲ့ သူတို့ဟာသူတို့ မြန်မာစာ သင်ပုန်းကြီး လိုက်ဖတ်နေစရာ မလိုပါဘူး။ ICU က အသင့်လုပ်ပေးထားတဲ့ ဒေတာတွေကို အသင့် ကောက်စားလိုက်ရုံပါပဲ။

    အခုဖြစ်နေတဲ့ ပြဿနာတွေက မြန်မာနိုင်ငံကို စီးပွားရေးပိတ်ဆို့ထားတာရယ်၊ Copyright ဥပဒေ မရှိသေးတာရယ်ကြောင့် စီးပွားရေးအကျိုးအမြတ်အခွင့်အလမ်း နည်းလွန်းတဲ့အတွက် အဓိက Vendor တွေက မြန်မာစာနဲ့ အခြားတိုင်းရင်းသားစာတွေကို Support လုပ်ဖို့ စိတ်မဝင်စားတာမို့ OS တွေမှာ Native support မရတာကြောင့် လက်တွေ့ပြလို့ မရတဲ့ ပြဿနာပါ။ မြန်မာစာအတွက် ဦးဦးဖျားဖျား ထောက်ပံ့တယ်ဆိုရမဲ့ Open Office ကတော့ မြန်မာစာအတွက်စံကို အသင့်ယူသုံးလိုက်လို့ လက်တွေ့မြင်နေရတာပါပဲ။ Open Office Developers တွေ မြန်မာစာအတွက် သီးသန့် ပရိုဂရမ်တွေ ကြိုးစားပမ်းစား ဆွဲပေးစရာ မလိုပါခင်ဗျား။

    ဒီလောက်ဆို ရေးထုံးအတိုင်း စဉ်လို့ ရတယ်မရဘူး၊ တိုင်းရင်းသားစာတွေကို စဉ်လို့ရတယ် မရဘူး ရှင်းလောက်ပြီ ထင်ပါတယ်။

  21. [...] အပေါ်က ကွန်းမန့်တွေမှာ ပြောသွားတာကို ကျွန်တော် နားလည်သလို ပြန်ရေးပြမယ်။ လွဲနေရင် လွဲနေတယ် ပြောပါ။ [...]

  22. စည်သူ says:

    ကိုသီဟ က sorting နဲ့ပတ်သက်ပြီး အဓိကထားပြာ သွားပါတယ်။ logical order နဲ့ စီမှသာ sorting မှာအဆင်ပြေ နိုင်တယ်လို့ပြောသွားပါတယ်။ ဒါေပမယ့် ကိုသီဟ အပါအဝင် လက်ရှိ ယူနီကုတ် လုပ်နေတဲ့သူတွေ အားလုံး မလွဲမေသွ လက်ခံရမှာက logical order နဲ့ စီသည်ဖြစ်စေ မစီသည်ဖြစ်စေ၊ လက်ရှိမြန်မာယူနီကုတ်မှာ sorting ကို မှန်အောင် မစီနိုင်သေးဘူး ဆိုတာဖြစ်ပါတယ်။ ကိုသီဟကိုယ်တိုင်ပဲ php ရဲ natsort () function နဲ့စီပြတဲ့ထဲမှာကို logical order ကို လိုက်နာပါရဲ့နဲ့ မြန်မာ ၃ မှာ ကြိုး နဲ့ ကြိုက် ကိုမှန်ေအာင် မစီနိုင်တာတွေ့မှာပါ။ ကျွန်တော်ပြောတဲ့ ဟ နဲ့ ဿ လည်း အဲဒီလိုပဲ စီလို့မရနိုင်ပါဘူး။ အဲဒီလိုလွဲနေတာတွေ အတွက် locale တစ်ခု လိုတယ်လို့ ကိုသီဟပြောတယ်။ ကျွန်တော် နားလည်လိုက်တာက အဲဒီ locale ထဲမှာ sorting မှန်အောင် လုပ်ေပးမယ့် rule တွေထည့်ပေးထားဖို့ လို့ နားလည် လိုက်ပါတယ်။ အဓိပ္ပာယ်က locale ထဲမှာ မှန်အောင် သတ်မှတ်ပေးထားရင် ဘယ်လိုဖြစ်ဖြစ် မှန်အောင် စီနိုင်တယ်လို့ တွက်ရပါမယ်။ ကိုငွေထွန်း ပြောသွားသလို cldr ကို language nature နဲ့ collation တွေ ပို့ပေးလိုက်တာနဲ့ sorting ကို ပူစရာမလုိဘူး ဆိုတာလဲ ဒီသေဘာပဲထင်ပါတယ်၊

    သုံးမယ့် ပရိုဂရမ်တွေက မြန်မာစာရဲ့ သဘာဝကို သိနေမှတော့ စာစီဖို့ကိစ္စ ပူစရာမလိုတော့ဘူးဆိုတာ မှန်ပါတယ်။ ပရိုဂရမ်တွေ ကိုယ်တိုင်က သူ့ဘာသာ မှန်အောင် စီပေးသွားမှာပဲ။ အဲဒီတော့ မေးစရာရှိတာက အဲဒီလို locale မှာ သတ်မှတ်ပေးတာတွေ၊ cldr က collation သတ်မှတ်ချက်တွေမှာ logical order နဲ့စီထားမှသာ အလုပ်လုပ် နိုင်တာလား ဆိုတာပါပဲ၊ တကယ်လို့ တိုင်းရင်းသား စာတွေအတွက် sorting ကို ထည့် စဉ်းစားမယ်ဆိုရင် logical order နဲ့စီမှသာ locale စနစ် cldr ရဲ့ collation စနစ်တွေက အလုပ်လုပ်မယ် ဆိုရင် ကိုမင်းကျော် ပြောသလို မွန်စာမှာ အ က ကြကီးရဲ့ အရင်စီရမယ်ဆိုရင် (ကျွန်တော်လည်း လေ့လာဖူးပါတယ် မြန်မာစာမှာပဲ အ ကဗျည်း အနေနဲ့ရော သရ အနေနဲ့ပါ ရှိတာပါ။ ပါဠိနဲ့ မွန်မှာ အ က သရပါ။ ပါဠိမှာ အံ က ဗျည်းအေနနဲ့ ရှိပါတယ်။) logical order ကိုမလိုက်နာတဲ့အတွက် အခုပြောခဲ့တဲ့ နည်းတွေ အားလုံးနဲ့ အလုပ်ဖြစ်မှာမဟုတ်ပါဘူး။ တကယ်လို့ ရတယ်ဆိုရင်တော့ locale စနစ်တွေ collation စနစ် တွေမှာ logical order ဖြစ်မဖြစ်က အရေးမကြီးဘူးလို့ ပြောနိုင်ပါတယ်။ တကယ်လို့ အဲဒီလိုသာ ဖြစ်မယ်ဆိုရင် ဧရာနဲ့လည်း locale နဲ့ collation စနစ်က ထောက်ပံ့ရင် logical order ဖြစ်မဖြစ်က အရေး မကြီးပါဘူး။ မှန်အောင် စီနိုင်မှာပါပဲ။ အဲဒီလို ပြောမယ်ဆိုရင် ဧရာက logical order နဲ့မစီလို့ sorting မှာပြဿနာ ရှိတယ်ဆိုတာ လိုရာ ဆွဲပြောတာပါပဲ။
    နောက်တစ်ချက် လက်ရှိ မြန်မာ ယူနီကုတ်တွေနဲ့ မတူတဲ့ စာလုံး သုံးလုံး သဝေထိုး ရရစ် နဲ့ ကင်းစီး ဒီသုံးလုံးကို rendering သုံးထားရဲ့သားနဲ့ ဘာလို့ ချန်ထားခဲ့လဲ ဆိုတာပါ။ အခုပြောနေတဲ့ တိုင်းရင်းသား စာတွေကိစ္စ၊ sorting ကိစ္စေတွကို မပြောဘဲ၊ အသုံးဝင်မှု၊ နေရာစုံ အသုံးချနိုင်မှုနဲ့ယှဉ်ရင် ဧရာက rendering သုံးမထားတဲ့ ဇော်ဂျီနဲ့ ယှဉ်နိုင်ပါတယ်။​ ​မို​ဘိုင်း​​တွေလို​ rendering​ လုံးဝ​မ​ရ​တဲ့​​ နေရာ​မှာ​သုံးရင်​တောင်​ ​ဖြစ်​နိုင်​ချေ ​ရှိ​တဲ့​အ​ချက်​ေတွ​ ​ရှိ​ပါ​တယ်​။​​ ​ပ​ထ​မ​ဆုံး​​ ​ကွန်​ပျူတာ ပေါ်မှာပဲ ​သုံး​ရ​တဲ့​​ rendering​ ​မ​ရ​တဲ့​​ ligature​ ​အ​လုပ်​မ​လုပ်​နိုင်​တဲ့​​ ​ပ​ရို​ဂ​ရမ်​တွေ​မှာ ​စမ်း​​ကြည့်​ပါ​။​​ ဧ​ရာ​ဟာ​ ကို​သီ​ဟ​ပြော​သ​လို​ visual​ ordering​ ​ကို​သုံး​ထား​တဲ့​အ​တွက်​ ​လက်​ရှိ​ ​မြန်​မာ​ယူ​နီ​ကုတ်​ ​ဆို​တာ​ေတွ​လို​ ​သ​ဝေထိုး​က​ ​နောက်​မှာ ​ပေါ်နေတာတွေ ​ရ​ရစ်​ကနောက်​မှာ​ ပေါ်နေတာတွေ ​မ​ရှိ​ပါ​ဘူး​​။​​ မြန်​မာ​ ​၃​ ​တို့​​ ​ပိ​တောက်​တို့​လို​ ​မ​လို​အပ်​တဲ့​​ ​အ​ဝိုင်း​​တွေ ပါနေတာ​မျိုး​​ ​မ​ရှိ​ပါ​ဘူး​​။​​ ​ရ​ရစ်​ ​အ​ကြီး အ​သေး​မ​ပြောင်း​နိုင်​တာ​တို့​လို​ ​ပုံပြောင်းတဲ့​ကိ​စ္စ​တွေပဲ​ ​အ​လု​ပ်​မ​လုပ်​နိုင်​တာ ​ဖြစ်ပြီး​​ ​ဖတ်​လို့​ရ​နိုင်​တဲ့​​ ​အ​ခြေအ​နေ​မှာ​ ရှိ​ပါ​တယ်​။​​

    ​ဒါ​ဟာ​ ​လက်​ရှိ​မြန်မာ​ ယူ​နီ​ကုတ်​ေတွ​ ​မ​တတ်​နိုင်​သေး​တဲ့​​ ​ကိ​စ္စ​ပါ​။​​ ​လက်​ရှိ​မြန်မာ ယူ​နီ​ကုတ်​တွေလို​ ​ရ​ရစ်​၊​​ ​သ​ဝေ​ထိုး​​၊​​ ​ကင်း​စီးတို့​ကို​ ​ထား​မယ်​ဆို​ရင်​ေတာ့​​ ​အ​ခု​လို​ ​အ​လုပ်​လုပ်​နိုင်​မှာ​ ​မ​ဟုတ်သေး​ပါ​ဘူ​။​​ နောက်ပြီး​​ adobe​ ​ထုတ်​ကုန်​တွေထဲ​က​ ​ယူ​နီ​ကုတ်​ ထောက်​ပံ့တဲ့​​ ​ပ​ရို​ဂ​ရမ်​တွေမှာ​ ​ကောင်းကောင်း ​သုံး​နိုင်​ပါ​တယ်​။​​ ​စာ​လုံးပုံစံကွဲတွေ ​ဒီ​ဇိုင်း​​ ​အ​မျိုး​မျိုး​နဲ့​​ ​ရှိ​ပါ​တယ်​။​​ ​အဲ​ဒီ​ေတာ့​​ adobe​ indesign​ ​မှာ​ ​သုံး​နိုင်​တယ်​ ​စာ​လုံး​ပုံစံ​ကွဲ​တွေ ​အ​မျိုး​မျိုး​ရှိ​တယ်​ဆို​တဲ့​​ ​အ​ချက်​နဲ့​​ DTP​ ​မှာ​ ကောင်းကောင်း သုံး​နိုင်​ပါ​တယ်​။​​ နောက်​ WebDeveloper​ ​တွေ ​အ​နေနဲ့​လဲ​ ​မိ​မိ​ WebDesign​ ​ကို​ ​စာ​လုံးပုံစံ​ ​အ​မျိုး​မျိုး​​ ​သုံးပြီး အ​လှ​ဆင်​ ​ရေးဆွဲ​နိုင်​တဲ့​ အ​ဆင့် မှာ​ရှိ​ပါ​တယ်​။​​ ​နောက်​ထပ်​လဲ​ ဧ​ရာ​ ​စာ​လုံး​ပုံ​စံ​ကွဲ​တွေ​ ​ထပ်​ထုတ်မယ်​လို့​​ ဧ​ရာ​ယူ​နီ​ကုတ်​ Website​ ​မှာ​ ​တွေ့ရ​ပါ​တယ်​။​​ ​အဲ​ဒီ​တော့ ​လောလောဆယ် အ​ခြေအနေ​ DTP​ ​အ​တွက်​နဲ့​​ Web​ ​အ​တွက်​ကို​ ဧ​ရာ​က​ သုံးဖို့ အသင့်တော်ဆုံ ​ယူ​နီ​ကုတ် တစ်​ခု ဖြစ်​ပါ​တယ်​။
    ​​
    ​နောက်ဆုံး တစ်ခုကတော့ ​တစ်​ချိန်​က​ မြန်မာပြည်က​ Chatting​ ​ဝင်သူ​အ​များ​စု​ ​အိမ်​မက်​မက်​ခဲ့​ရ​ပြီး ဇော်​ဂျီ​က​ ​အ​ကောင်အ​ထည်​ ဖော်ပေး​ခဲ့​တဲ့​​ ​မြန်​မာ​လို​ Chat​ ​နိုင်​ဖို့​ဆို​တဲ့​ကိ​စ္စ​ကို​ ​ဇော်​ဂျီ​လို​ Arial​ Font​ ​ကို​ ​ပြင်ပေး​မှ​ ​ကောင်းကောင်း ​လုပ်​နိုင်​တဲ့​​ ​အ​ဆင့် မ​ဟုတ်​ပဲ​ ဧ​ရာ​ကို​သုံးပြီး​ Chat​ ​နိုင်​ပါ​တယ်​။​​ ​တ​ကယ်​တမ်း​​ ​အ​ကောင်းဆုံးက​တော့​​ ​စံ​မြန်​မာ​က​ ​လုပ်​ထား​တဲ့​ စ​နစ်​မျိုး​ကို​ ​ယူ​နီ​ကုတ်​နဲ့​​ ​ရ​ေအာင်​လုပ်​နိုင်​ရင်​ ​အ​ဆင်​အ​ပြေဆုံး​ပါ​။​​ rendering​ ​မ​လို​တော့ဘူး​​ sorting​ ​မှန်​မယ်​၊​​ searching​ ​အ​တွက်​ ​လက်​ကွက်​ ​ပ​ရို​ဂ​ရမ်​ကောင်းကောင်း​နဲ့​ လုပ်​နိုင်​ရင်​ ​အ​ဆင်​ပြေမယ်​။​​ လက်​ရှိ​ Windows​ 7​ ​မှာ​ပါ​တဲ့​​ Korea​ ​အ​တွက်​ လုပ်​ပေးထား​တဲ့​​ IME​ ​လို​မျိုး​​။​​ ​စံ​မြန်​မာ​စ​နစ်​မှာ​လဲ​ ​လက်​မ​ခံ​နိုင်​တဲ့​အ​ချက်တွေတော့ ​​ ​ရှိ​နေသေး​တယ်​။​​ ​သူ့​လို​မျိုး​​ သူ့ထက်ကောင်းအောင် ​လုပ်​နိုင်​ရင်​တော့​​ မြန်မာ​စာ​အ​တွက်​ ​မြန်​မာ​ ​ကွန်​ပျုတာ​ ​လော​က​အ​တွက်​ ပူ​စ​ရာ​မ​လို​ေတာ့​ဘူး​​။​​ ​အဲ​ဒီ​လို​ဖြစ်​နိုင်​ဖို့​ဆို​တာ​က​လဲ​ ​လက်​ရှိ​ ယူ​နီ​ကုတ်​ သတ်​မှတ်​ချက်​တွေကို​ ​ဒီ​ထက်​ကောင်း​တဲ့​​ ​စ​နစ်​နဲ့​​ ​သတ်​မှတ်​ချက်​ ​အ​သစ်​တွေနဲ့​​ ​အ​စား​ထိုး​နိုင်​မှာ​ ​ဖြစ်​နိုင်​မှာ​ပါ​။​​ ​ကို​ရီး​ယား​စာ​ဟာ ​မြန်​မာ​စာ​ထက်​ ​စာ​လုံး ​အ​ရေအ​တွက်​ နည်း​ပါ​တယ်​။​​ ​တ​ရုတ်​စာ​လုံးတွေကို​ ယူ​သုံး​ထား​တဲ့​​ ​စာ​လုံးတွေ မ​ပါ​သေး​ဘဲ​နဲ့​ကို​ ​ကို​ရီး​ယား​​ ​စာ​အ​တွက်​ရ​ထား​တဲ့​​ ​ယူ​နီ​ကုတ်​ ​အ​မှန်​စဉ်​က​ မြန်​မာ​စာ​နဲ့​​ ​ယှဉ်​ရင်​ ​အ​လွန်​များ​ပါ​တယ်​။​​ u1100-u11FF​ ​ထိ​က​ ​တစ်​အုပ်​စု​ ​နောက်​ u2500​ ​နား​မှာ တစ်​အုပ်​စု​ u-3131​ ​နား​မှာ​ ​တစ်​အုပ်​စု​ u-AC00​ ​နား​မှာ​ ​တစ်​အုပ်​စု​နဲ့​​ ​အားလုံး ပေါင်း​ရင်​ ​စာ​လုံး​​ ​၅၀၀၀​ ​လောက် ရှိ​တယ်​ထင်​ပါ​တယ်​။​​ ​အ​ကုန်​တော့ ​ရေမကြည့်​ဖူး​ပါ​။​​ ​အဲ​ဒီ​တော့ ​ကိုယ့်ထက် ​စာ​လုံး ​အ​ရေအ​တွက်​နည်း​တဲ့​​ ​ကို​ရီး​ယား​လို​ ​ဟာ​မျိုး​တောင်​ ​ဒီလောက်​ရ​နိုင်သေး​ရင်​ ​အ​ခု​ မြန်​မာ​စာ​အ​တွက်​ rendering​ ​မ​လို​တဲ့​အ​ထိ​ ​ဘာ​လို့​ မ​လုပ်ကြ​တာ​လဲ​။​​ ​ကွန်​ပျု​တာ​ ​ပ​ရို​ဂ​ရမ်​တိုင်း​က​ rendering​ ​မ​လုပ်​နိုင်​သ​လို​ ​ကွန်​ပျူ တာ​တိုင်း​က​လဲ​ reordering​ ​ကို​ ​ကောင်း​​ကောင်း ​လုပ်​နိုင်​အောင်​ ​အ​မြန်နှုန်းတွေ ​မန်​မို​ရီ​တွေ ​မကောင်း​​ကြပါ​ဘူး​​။​​ ​မို​ဘိုင်း​​တွေမှာ​ပါ​ ​ကောင်းကောင်း ​သုံး​နိုင်​ဖို့​ဆို​ရင်​ rendering​ ​နဲ့​​ reordering​ ​မ​လို​မှ​ ​ဖြစ်​ပါ​မယ်​။​​ ​မို​ဘိုင်း​​ေတွ​မှာ​ ​အဲ​ဒီ​အ​တွက်​ ​လုံ​လောက်​တဲ့​​ ​မန်​မို​ရီ​ ​နဲ့​​ cpu​ ​အ​မြန်​နှုန်း​​တွေ ​မ​ရှိနိုင်​ပါ​ဘူး​​။​​ ​မို​ဘိုင်း​​တွေရဲ့​​ OS​ ​တွေက​လဲ​ ​အဲ​ဒါ​တွေကို​ ​ထောက်​ပံ့​နိုင်​ဖို့​​ ​မ​လွယ်​ပါ​ဘူး​​။​​ ​အဲ​ဒီ​တော့ ဘယ်​သူ​မှ​ ​မှန်​တယ်​လို့​​ ​ပြော​လို့​မ​ရ​သေး​တဲ့​​ ​အ​ခြေအ​နေမှာ​ ​ဟို​လူ​မှား​တယ်​ ​ဒီ​လူ​မှား​တယ်​ ပြောနေကြမယ့်အ​စား​​ ​ဘာ​လုပ်​သင့်တယ်​ဆို​တာ​ကို​ ​ဆွေးနွေးကြဖို့ သင့်တယ်​လို့​​ ​ပြော​ရင်း​​ ​ဒီ​မှာ​ ​ခ​ဏ​နား​လို​ပါ​တယ်​။​​ ​ကျွန်​တော် ပြောတာကို ဝေဖန်ပြောကြားလာတဲ့ သူရှိရင်တော့ ပြန်လည် ဆွေးနွေးပေးဖို့ အသင့်ပါပဲ။

    ​ေကျး​ဇူး​တင်​ပါ​တယ်​။

  23. Ngwe Tun says:

    @SiThu,
    >>> တကယ်လုိ့ အဲဒီလုိသာြဖစ်ခဲ့မယ်ဆုိရင် ဧရာနဲ့လည်း locale နဲ့ collation စနစ်က ေထာက်ပံ့ရင် logical order ြဖစ်မြဖစ်က အေရးမြကီးပါဘူး။
    Please check at http://scripts.sil.org/cms/scripts/render_download.php?&format=file&media_id=SortingAndCollating&filename=SortingAndCollating.pdf

    In Page 18, Reordering in Thai and Lao, The standard collation framework does not completely handle sorting in Thai and Lao. The characters in these languages are rendered with certain vowels displayed to the left of (before) the preceding consonant. Although the encoding for these languages matches the rendering order, they are sorted using pronunciation order, that is, as if the vowels followed the consonants.
    In order to sort Thai and Lao correctly, a some process must be run over the data to reorder the vowels before calling the standard collation algorithm.

    Well, I already give CLDR & ICU URL. We have tried to use with logical order in those technique with proven software and OS.

    >>> မို​ဘိုင်း​​ေတွ​လို​ rendering​ လံုး​ဝ​မ​ရ​တဲ့​​ေန​ရာ​မှာ​သံုး​ရင်​ေတာင်​ ​ြဖစ်​နိုင်​ေချ​ရှိ​တဲ့​အ​ချက်​ေတွ​ ​ရှိ​ပါ​တယ်​။​​
    It is totally wrong. Ayar can’t use in non-Rendering Machine/Mobile. Let me have proof of enabling. We can’t accept imagination or idea or theory.

    >>> ြမန်​မာ​ ​၃​ ​တို့​​ ​ပိ​ေတာက်​တို့​လို​ ​မ​လို​အပ်​တဲ့​​ ​အ​ဝိုင်း​​ေတွ​ပါ​ေန​တာ​မျိုး​​ ​မ​ရှိ​ပါ​ဘူး​​။​​
    Just check in Unicode Code Chart. Did Unicode accept dotted circle or not. Why they put dotted circle in Unicode Standards?

    >>> rendering​ ​မ​လို​ေတာ့​ဘူး​​ sorting​ ​မှန်​မယ်​
    did you tested well? It is not Unicode standards and can’t sort like ဥုံ ၊ အုံ၊ လည်းကောင်း၊ ၎င်း

    >>> ဟို​လူ​မှား​တယ်​ ​ဒီ​လူ​မှား​တယ်​ ​ေြပာ​ေန​ြက​မယ့်​အ​စား​​ ​ဘာ​လုပ်​သင့်​တယ်​
    So, You did review already. Let me have your solution for it. There are no beneficial to point out each other. And we can’t make similar with korean script. You should propose another better solution to Unicode and ISO. After getting yours, we will follow your forthcoming solution. Right now. Unicode standards is the best suite. something is better than nothing.

    Cheers

  24. Lionslayer says:

    ကိုစည်သူ
    ၁။ ကွန်ပျူတာကို မြန်မာက စထွင်ရင်၊ မြန်မာဟာ ကမ္ဘာ့ အင်အားကြီးနိုင်ငံ ဖြစ်နေရင်တော့ မြန်မာစာအတွက် အက္ခရာနေရာ ၅၀၀၀ တောင်းလို့ ရကောင်းရပါမယ်။ တရုတ် ဂျပန် နဲ့ ကိုရီးယားဟာ ဟန်စာလုံးတွေကို ဘုံယူသုံးတဲ့ ဘာသာသုံးခု ဖြစ်တာကြောင့် သူတို့ကို စာတစ်လုံးစီအတွက် နေရာတစ်ခုစီပေးပါတယ်။ ဒါပေမဲ့ အနောက်အာရှနဲ့ တောင်အာရှဘာသာစကားတွေအတွက် မပေးပါ။ ယူနီကုဒ် အက္ခရာတစ်လုံးစာ တိုးရဖို့ ဘယ်လိုအာပေါက်အောင် အထောက်အထား အကိုးအကားတွေနဲ့ ရှင်းခဲ့ရတယ်ဆိုတာ မသိလို့ပါ။ တကယ်လို့ မြန်မာကိုသာ အဲလိုစာလုံး ၅၀၀၀ ပေးပြီဆိုရင် ဒီသဘောတရားချင်းတူတဲ့ ဘာသာတွေအကုန် လိုက်ပေးမှကို ရပါတော့မယ်။ ဒါတော့ အဓိပ္ပါယ် မရှိလှပါ။ ဘုရားပွဲ ပေါက်ပေါက်ဆုပ်ကြဲသလို ဖြစ်နေရော့မယ်။

    ၂။ ICU မှာ ပါချင်ရင် ဧရာနဲ့ ဇော်ဂျီ နဲ့ စံမြန်မာကို ISO နဲ့ ယူနီကုဒ် ကွန်ဆော့တီယမ် က အသိအမှတ်ပြုအောင် အရင် လုပ်လိုက်ပါ။ စံမြန်မာကတော့ Tried and failed ဖြစ်သွားပြီးပြီ။ ဇော်ဂျီနဲ့ ဧရာကိုတော့ ဘယ်သူကြိုးစားမှာလဲ မသိပါ။

    ၃။ ရှေ့နောက်ပြန်စီတာ မြန်မာတစ်ခုတည်း မဟုတ်။ အာရပ်စာနဲ့ (မွန်နဲ့ ဗမာက ယူရေးရတဲ့) ဟိန္ဒူစာလည်း ပြန်စီရတာပါပဲ။ क्षमा कीजिये أنت غبي

    ၄။ Logical စီတယ်ဆိုတာ ဘယ်လောဂျစ်ပေါ်မှာ စီတာလဲ ပြန်ကြည့်ပါ။ Linguistic ဆိုတဲ့ ဘာသာဗေဒပေါ်မှာ စီတာပါ။ ဘာသာဗေဒဆိုတာ စကားသံပေါ်မှာ အခြေခံတာပါပဲ။ ဒါမှလည်း စီပုံစီနည်း ပုံသေ (Consistent) ဖြစ်မှာပါ။ ဥပမာ – ပြေ / ပျေ/ ပွဲ
    ပ + ရ + အေ/ ပ + ယ + အေ/ ပ + ဝ + အဲ (အသံမူရင်း)
    ပ + ြ + ေ / ပ + ျ+ ေ / ပ + ွ + ဲ(Unicode Standard storage) စီပုံပုံသေ
    ေ + ပ + ြ / ေ + ပ + ျ / ပ + ွ + ဲ (ရေးထုံး) စီပုံကွဲ
    ေ + ြ + ပ / ေ + ပ + ျ / ပ + ွ + ဲ(ဧရာ) စီပုံကွဲ
    ေ + ြ + ပ / ေ + ပ + ျ / ပ + ွ + ဲ (ဇော်ဂျီ) စီပုံကွဲ

    အဲဒီ ဥပမာကို ကြည့်ပါ။ ယူနီကုဒ်သာလျှင် တသမတ်တည်း စံတစ်ခု (ဗျည်း+ဗျည်းတွဲ+သရ)ကို လိုက်နာပြီး Linguistic အတိုင်း စီနိုင်တယ်ဆိုတာ အလွယ်တွေ့နိုင်ပါတယ်။ Linguistic rule ကို မြန်မာစာတစ်ခုတည်း ကွက်ပြီး လိုက်နာနေရတာမဟုတ်ဘဲ အာရပ် ဟင်ဒီဘာသာစကားတွေ ဒီအတိုင်းပဲ လိုက်နာရပါတယ်။ မလိုက်နာခဲ့တဲ့ ထိုငးနဲ့ လာအိုဘာသာတွေ ICU မှာ ကောင်းကောင်းစီမရတဲ့ ပြဿနာ တက်ပါတယ်။

    ၄။ အာရပ်ဘာသာကို Windows, OSX, IOS တွေမှာ ထည့်ပေးတော့ ယူနီကုဒ်သုံးလို့ ဒုက္ခရောက်တယ်ဆိုတာ မကြားစဖူးပါ။ အခုလည်း ဒီဆိုက်ကို အိုင်ဖုန်း အိုင်ပေါ့ပေါ်မှာ အလွယ်ဖတ်လို့ ရပါတယ်။ ပြဿနာ မရှိပါ။ Text ကို Lig ပြောင်းတာလေးနဲ့ စီပီယူကုန် မန်မိုရီစားဆိုတာ ရယ်ဖို့ကောင်းပါတယ်။ ခုခေတ် ဟန်းဖုန်းတွေလောက်မှ စီပီယူမမြန် မန်မိုရီမရှိတဲ့ ကျွန်တော့ရဲ့ ပထမဆုံး ကွန်ပျူတာ Cerelon 566 လေးတောင် ယူနီကုဒ်ကို ပြသနာမရှိ shaping လုပ်ပေးနိုင်ခဲ့ပါတယ်။ Solid factor မရှိဘဲ ဖြစ်မှာပဲလို့ စိတ်ထင်ရာတွေ လျှောက်ပြောနေမယ့်အစား Benchmark လုပ်ကြည့်ပြီးမှပြောရင် ပိုလက်ခံနိုင်လောက်မှာပါ။

  25. Thiha says:

    ကျွန်တော် ပြောသွားတဲ့အထဲမှာ Logical Order စီသင့် မစီသင့်ဆိုတဲ့ အချက်အပေါ်မှာသာ အဓိကထား ဆွေးနွေးသွားတာ ဖြစ်ပါတယ်။ Logical Order စီတဲ့အတွက် ရလာမယ့် အကျိုးကျေးဇူးကို တွက်ဆကြည့်ပြိး အကျိုးများတဲ့ အကြောင်း ထောက်ပြထားတာ ဖြစ်ပါတယ်။ အဲဒီလို ထောက်ပြတဲ့ နေရာမှာ ဒါကတော့ code point အတိုင်းပဲ၊ ဒါကတော့ code point မဟုတ်ဘူး၊ ဒါကတော့ logical Order၊ ဒါကတော့ logical order မဟုတ်ဘူး ဆိုတာတွေကို ထောက်ပြသွားပါတယ်။ အဲဒီအပြင် Logical Order သိမ်းထားတဲ့အတွက် Natural Sort မှာ ရလာတဲ့ အကျိုးကျေးဇူးတွေကို ပြောပြသွားပါတယ်။ ကျွန်တော်ကိုယ်တိုင်လဲ အဲဒီလို အကျိုးကျေးဇူးတွေကို လက်ခံတဲ့အကြောင်း ပြောခဲ့တာပဲ ဖြစ်ပါတယ်။ ကျွန်တော် အဓိက ရည်ရွယ်တာ Data Consistency ဆိုတဲ့ အပိုင်းနဲ့ Sorting အပိုင်းပါ။ ကျွန်တော် လိုရာဆွဲပြောတာ မဖြစ်နိုင်ပါဘူး။ သေချာတာတော့ Program က လိုရာဆွဲပြောသွားတာပဲ ဖြစ်ပါလိမ့်မယ်။ ကျွန်တော် အနေနဲ့ Logical Order ရဲ့ အားကို အသုံးချမယ်ဆိုရင် Sorting တွေ၊ Collation တွေအတွက် အားသာချက် အများကြီး ရှိသွားလိမ့်မယ်လို့ လုံးဝ ယုံကြည် လက်ခံထားပါတယ်။

    ကိုစည်သူ ပြောသွားသလို ကျန်တဲ့နေရာတွေမှာ ဧရာက ဇော်ဂျီနဲ့ ယှဉ်နိုင်တယ်ဆိုတာ ကျွန်တော် လက်မခံပါဘူး။ ဇော်ဂျီလောက် လှလှပပ ပုံဖော်ပေးနိုင်စွမ်း ဧရာမှာ မရှိပါဘူး။ အဓိက ပြဿနာက Rendering လိုနေတဲ့အတွက်ပါ။ နောက် indesign လို နေရာတွေမှာ ရတယ်လို့ ပြောထားပါတယ်။ အဲဒီနေရာမှာပါလဲ သဝေထိုးလိုတွေကို ရှေ့မှာ ထားပေးနိုင်တာ တစ်ခုကလွဲလို့ ရရစ်တွေ၊ အောက်ကမြစ်တွေကို မှန်အောင် စီမပေးနိုင်ပါဘူး။ ဖတ်လို့ရတယ်ဆိုတဲ့ အဆင့်ပဲရှိပါတယ်။ အဲဒီလို ဖတ်လို့ရတဲ့ အဆင့်ကို Indesign လိုနေရာမှာ ဘယ်သူမှ သုံးကြမှာ မဟုတ်ပါဘူး။

    နောက်ထပ် Rendering မလိုတဲ့ မြန်မစာ ဖြစ်လာမယ့်ကိစ္စ အဲဒါဆိုရင်တော့ ဇော်ဂျီကိုပဲ ဆက်သုံးနေရင် ဖြစ်ပါတယ်။ ဒါပေမယ့် ရရစ် ခြောက်မျိုး ဖြစ်လာမှာမျိုးကို ဘယ်လို ဖြေရှင်းကြမလဲ။ မြန်မာစာအတွက် rendering လိုတယ် ဆိုတဲ့ အနေအထားက အသေအချာပါပဲ။ rendering မလိုရင် Data Consistency မဖြစ်ဘူး၊ rendering လိုရင် Data Consistency ဖြစ်မယ်ဆိုတဲ့ ရွေးချယ်စရာ လမ်းနှစ်လမ်းပဲ ရှိပါတယ်။ ကြားလမ်းမရှိဘူးလို့ ကျွန်တော် ထင်ပါတယ်။

    နောက်တစ်ခုက rendering ပါနေတဲ့အတွက် ဖြစ်လာမယ့် ပြဿနာမှာ ဖတ်လို့ ရပါတယ်ကွာလို့ ဆိုပြီး ထားလို့ မရပါဘူး။ မှန်အောင်ကို စီနိုင်စွမ်း ရှိဖို့ လိုပါတယ်။ ဒါလေးကွာ ဖြည့်ဖတ်လိုက်ပါလို့ ပြောလို့မရပါဘူး။ အဲဒီလို ဖြည့်ဖတ်မယ့် အစား ဇော်ဂျီကိုသာ သုံးလိုက်တာက ပိုအဆင်ပြေမှာ ဖြစ်ပါတယ်။ ကျွန်တော်က ဇော်ဂျီကို သုံးရတာ အဆင်မပြေလို့ ပြောင်းလိုက်တာ မဟုတ်ပါဘူး။ အရမ်း အဆင်ပြေပါတယ်။ ဒါပေမယ့် အချက်အလက်တွေ အသုံးဝင်စေချင်တဲ့ အတွက် နောက်တစ်ခု မြန်မာစာသည် စံတစ်ခုတည်း အပေါ်မှာသာ ရှိသင့်တယ်လို့ ယုံကြည်တဲ့အတွက် ပြောင်းလိုက်တာပါ။

    နောက်တစ်ခုက စံသတ်မှတ်ချက်တစ်ခုဆိုတာ ဒီအတိုင်း ဖြစ်မလာပါဘူး။ အနည်းဆုံး တစ်နှစ်စောင့်ရပါတယ်။ အဲဒီလို စောင့်ရတဲ့အချိန်မှာ ကန့်ကွက်မှုတွေ ပြုလို့ရပါတယ်။ အဲဒီအချိန်တုန်းက ကန့်ကွက်မှုတွေ မပြုခဲ့ပဲ စံအဖြစ် သတ်မှတ်လိုက်တော့မှ ပြောင်းလဲမယ်ဆိုတာ ဖြစ်နိုင်မလားဆိုတာ ကိုစည်သူ စဉ်းစားကြည့်ပါ။ တကယ်တန်း စံနှုန်းမကိုက် မကြိုက်တာရှိရင် အဲဒီလို ကန့်ကွက်ဖို့ ဖွင့်ထားတဲ့ အချိန်တုန်းက ဘာကြောင့် မကန့်ကွက်ခဲ့ပါသလဲ။ ကျွန်ောတ်တို့က အခုအချိန်မှာ ရလာတဲ့ စံနှုန်းအပေါ်မှာ အကောင်းဆုံး တည်ဆောက်သွားပြီး အကောင်းဆုံး ဖြစ်အောင် ညီညီညွှတ်ညွှတ် လုပ်သွားရမယ့် အချိန်ပါ။

    အကိုပြောသွားတဲ့ rendering လိုခြင်း မလိုခြင်းကြောင့် ဖြစ်လာတဲ့ ပြဿနာတွေကတော့ မြန်မာစာမှာ ရှိကို ရှိနေဦးမှာ ဖြစ်ပါတယ်။ ယူနီကုဒ်မှာလည်း ရှိသလို ဧရာမှာလည်း ရှိပါတယ်။ ငါကတော့ ဖတ်လို့ရပါတယ်ကွာ ဆိုပေမယ့် ပြဿနာ ရှိတာက ရှိနေတာပါပဲ။ အဲဒီလို ပြဿနာတွေက စနစ်တစ်ခုတည်းနဲ့ ကမ္ဘာကို အသိအမှတ်ပြုခိုင်းမလား၊ စနစ်နှစ်ခုနဲ့ အသိအမှတ်ပြုခိုင်းမလား ဆိုတာတော့ ကိုယ်ရွေးချယ်မှုနဲ့ပဲ ဆိုင်ပါတယ်။ ကျွန်တော်ကို ရွေးချယ်ခိုင်းမယ် ဆိုရင်တော့ အခု ISO လက်မှတ်ရပြီးသား Unicode Standard ကိုပဲ အသိအမှတ်ပြု လက်ခံစေချင်ပါတယ်။

    နောက်တစ်ခု ယူနီကုဒ်နဲ့ ပတ်သက်လို့ Web မှာ သုံးဖို့ အခုအချိန်မှာ Myanmar3, Parabaik, MyMyanmar, Padauk အပြင် ယွန်းချိုလို့ font-face တွေလည်း ထွက်လာပါပြီ။ အဲဒီအပြင် သိပ်မကြာတော့တဲ့ အချိန်မှာ WinUni Kalaw လို Title Font Face လည်းထွက်ဖို့ ရှိပါသေးတယ်။ အဲဒါကြောင့် Website ရေးတဲ့သူတွေအတွက် ရွေးချယ်စရာတွေ ရှိလာဦးမှာ ဖြစ်ပါတယ်။ Rendering လုပ်ကြတာခြင်း အတူတူ ငါကတော့ မှန်းပြီး ဖတ်လို့ရတယ် ဆိုတာတော့ ဘာမှ မထူးဘူးလို့ ကျွန်တော်ထင်ပါတယ်။ ကျွန်တော်ဆို မှန်းပြီး ဖတ်နေမှာ မဟုတ်ပါဘူး။ Win-Innwa ကိုသာ သုံးလိုက်မှာပါ။

  26. Minn Kyaw says:

    ကုိသီဟ
    indesign လို ေနရာေတွမှာ ရတယ်လို့ ပြောထားပါတယ်။ အဲဒီေနရာမှာပါလဲ သဝေထိုးလို ရှေ့မှာ ထားပေးနိုင်တာ တစ်ခုကလွဲလို့ ရရစ်တွေ အောက်ကမြစ်တွေ မှန်အောင် စီမေပးနိုင်ပါဘူး။

    ဆိုတာ စမ်းပြီးပြီလား။ အဲလိုဖြစ်တာ ဧရာ မဟုတ်ပါဘူး။
    http://img.aahara.org/?di=1612953416276

    Web မှာ သုံးဖို့ အခုအချိန်မှာ Myanmar3, Parabaik, MyMyanmar, Padauk အြပင် ယွန်းချိုလို့ font-face ေတွလည်း ထွက်လာပါပြီ။

    Web မှာ ဘဲ သုံးလို့ရတာ မဟုတ်ဘူးလား။ ကိုငွေထွန်းေရးထားတဲ့ http://ayarunicode.googlecode.com/files/glitch_in_myanmar_unicode.pdf မှာပြောထားတယ်လေ။ မဖတ်ရသေး ဘူးထင်တယ်။ ဟုတ်မဟုတ်တော့ ကိုယ်တိုင်စမ်းပါ။ ပြီးတော့ ဝေဖန်ပါ။ ဝေဖန်တာကို အကောင်းဆုံးဖြစ်အောင် လုပ်ဖို့ တိုက်တွန်းတယ်လို့ မှတ်ယူပါတယ်။

    ဧရာမှာ font-face ၁၁ မျိုးတောင် ရှိပါတယ်။ နောက်ထပ်လည်း လုပ်ထားတာေတွ စမ်းနေတာတွေ ရှိပါတယ်။ အားလုံးကို အခမဲ့ ရည်ရွယ် ထားတာတွေပါ။ ရောင်းချဖို့အတွက် လုပ်ထားတာတွေ မပါပါဘူး။

    ကိုစည်သူေရ ဘယ်လိုဘဲဖြစ်ဖြစ် ဆက်မပြောတာ ကောင်းမယ် ထင်ပါတယ်။ အပြုသဘော မဆောင်ဘဲ၊ အပျက် သဘောဖြစ်သွားမယ်။ လူတကိုယ်အကြိုက် တမျိုးဘဲေလ။ အယူအဆဆိုတာ အမျိုးမျိုးဘဲ။ ရှိနေတဲ့ မျက်လုံး ၂လုံးနဲ့ အကုန်လုံးကို ကြည့်နိုင်ဖို့ဘဲ လိုတာပါ။ မဟုတ်ရင်ေတာ့ ကျားကျား မီးယပ်ကတော့ ရှိမှာပေါ့။

    အားလုံးကို လေးစားလျှက်

    • Thiha says:

      ကျွန်တော် စမ်းကြည့်တော့ မရဘူးဗျ၊ ဒါပေမယ့် ဧရာကို ကျွန်တော် ဇော်ဂျီ၊ Win Fonts တွေလောက် မကြိုက်လို့ Indesign မှာ မသုံးဖြစ်ဘူးခင်ဗျ၊ အဲဒီလို ရတယ် သိရလို့ ဝမ်းသားပါတယ်ခင်ဗျာ။ ကျွန်တော် ရေးတဲ့အကြောင်းက Natural Sorting နဲ့ စီတဲ့အကြောင်းလေးပါ၊ ခုလောက်အထိ ကျယ်ပြန့်သွားလိမ့်မယ် မထင်ဘူးခင်ဗျ … ဟီးဟီး

  27. Minn Kyaw says:

    ၄။ Logical စီတယ်ဆိုတာ ဘယ်လောဂျစ်ပေါ်မှာ စီတာလဲ ပြန်ကြည့်ပါ။ Linguistic ဆိုတဲ့ ဘာသာဗေဒပေါ်မှာ စီတာပါ။ ဘာသာဗေဒဆိုတာ စကားသံပေါ်မှာ အခြေခံတာပါပဲ။ ဒါမှလည်း စီပုံစီနည်း ပုံသေ (Consistent) ဖြစ်မှာပါ။ ဥပမာ – ပြေ / ပျေ/ ပွဲ

    ကိုမောင်မောင်ဆန်း မြန်မာစာ သင်ခဲ့တုန်းက အဲလိုသင်ခဲ့တာလား သိချင်ပါတယ်။ စာေရးတဲ့အချိန်မှာ ေ (သေဝထိုး) ကိုစမရေးဘဲ ယူနီကုဒ် စတန်းဒတ်ဖြစ်တဲ့ ကေ လို့ ရေး ခဲ့ပါသလား။ ဆက်ပြောရင် ကပ်ပြောတယ် ဖြစ်နေပါတယ်။ ဒီလောက်ပဲ တော်ပါပြီ။ တကယ်ပြောချင်ရင်၊ သီးသန့် နရာမျိုးမှာပြောတာ ပိုကောင်းပါမယ်။ မလိုအပ်ဘဲ ယူဇာတွေ ကြားထဲမှာ သံသယဖြစ် စရာေတွ ဖြစ်ရင်မကောင်းပါ။ ကျွန်တော်တော့ ထားလိုက်ပါပြီ။ ဆက် မပြောတော့ပါ။
    မှန်ထင်တယ်ရင် လုပ်ပါ။ ကိုယ်လုပ်တာ ကိုယ်တာဝန်ယူဖို့ လိုပါတယ် လို့ဘဲ ေပြာချင်ပါတယ်။

    • Thiha says:

      ကောင်းပါတယ်ဗျာ တစ်ယောက်နဲ့ တစ်ယောက် Mutual Respect လေးရှိကြရင် ဖြင့် ဘယ်လို လိုအပ်ချက်တွေ ရှိတယ် ဘယ်လို အားသာချက်တွေ ရှိတယ်ဆိုတာ သိလာနိုင်ပြီး စနစ်တစ်ခုတည်းမှာ အခြေခံထားတဲ့ နိုင်ငံတကာသုံး မြန်မာစာ စနစ်တစ်ခု ဖြစ်လာစရာ အကြောင်းရှိပါတယ်။ တစ်ဖက်နဲ့ တစ်ဖက် ပုတ်ခတ်တာမျိုး မလုပ်ပဲ၊ ဝေဖန်ထောက်ပြတဲ့အခါ ကောင်းကောင်းမွန်မွန် ပြန်ဆွေးနွေးပေးကြရင် မင်္ဂလာပေါ့ဗျာ။ ကျွန်တော် ရေးတဲ့အထဲမှာလည်း ဇော်ဂျီကတော့ မကောင်းဘူး၊ ဧရာကတော့ မကောင်းဘူးဆိုတာ တစ်လုံးမှ မပါပါဘူးခင်ဗျာ။ ဒီလိုလေးတွေ တွေ့တယ်၊ ဒါကြောင့် ဒီလိုလေးတွေ ချပြတဲ့ သဘောပါပဲ။ နောက် ကျွန်တော် ပြောပြီး ဖြစ်သလို ကျွန်တော် Program Run ပြတာသာ ဖြစ်ပါတယ်။ အဲဒီ Program အပေါ်မှာ Natural Sort ရလာတဲ့ Result ကို ချပြတာ ဖြစ်ပါတယ်။ Code Point တွေ စစ်ကြည့်တယ်၊ ကျွန်တော်လက်ခံထားတဲ့ ဗျည်း၊ ဗျည်းတွဲ၊ သရ အစဉ်နဲ့ တိုက်ကြည့်တယ်၊ ဒီလောက်ပါပဲဗျာ … ခုလို အများကြီး ဆွေးနွေးပေးကြတဲ့ အတွက် ကျေးဇူးအများကြီး တင်ပါတယ်ခင်ဗျာ

  28. Minn Kyaw says:

    ကိုစည်သူေရ
    ထားလိုက်ပါဗျာ။ သူတို့က ကိုယ်ထက် တတ်လို့ လုပ်ေနတယ်လို့ သေဘာထားပါ။
    ေလးစားလျှက်
    မင်းေကျာ်

  29. Ei Maung says:

    >> ထားလိုက်ပါဗျာ။ သူတို့က ကိုယ်ထက် တတ်လို့ လုပ်ေနတယ်လို့ သေဘာထားပါ။

    I used-to this tone when I was 10. And, always used when I fought with my cousins. This is just a childish. Before this, I thought you have your points. But comment like this only make negative impact and just far from the solutions.

  30. Lionslayer says:

    ကိုမင်းကျော် Input system နဲ့ Encoding System ကို သိပ်မရှင်းဘူးထင်တယ်။ စာရေးရင် သင်ပုန်းကြီးအတိုင်း ရေးရုံပါပဲ။ သိမ်းမှသာ Logical order နဲ့ စီသွားတာပါ။ မြန်မာနိုင်ငံထက် ပညာရှင် ရာထောင်ပိုများတဲ့ အိန္ဒိယကတောင် ရှေ့နောက်စီခြင်းရဲ့ အကျိုးရှိပုံကို သိလို့ လက်ခံခဲ့တာ အငြင်းပွားစရာရယ်လို့ မမြင်ပါ။

    ယူနီကုဒ်ဆိုတာ လူတစ်စုတည်းက ကွက်ကွက်လေး လုပ်ချင်ရာလုပ်နေတာမဟုတ်။ တစ်ကမ္ဘာလုံးက ဘာသာဗေဒပညာရှင်တွေ စုစည်းပြီး ဝုိင်းဝန်းဆောင်ရွက်နေတာပါ။ ကွှန်တော် ကိုယ်လုပ်တာ တာဝန်မယူစရာ အကြောင်းမရှိပါ။ Better Burmese အတွက် အကောင်းဆုံး ဖြစ်မယ်လို့ ကိုယ်ယုံကြည်ရာ ကိုယ်လုပ်တာပါပဲ။

    ကိုမင်းကျော်လည်း Ayar ဟာ မှန်တယ်၊ ဖြစ်သင့်တယ်လို့ယုံရင် မြန်မာနိုင်ငံက မြန်မာစာနဲ့ ဘာသာဗေဒ ပညာရှင်တွေနဲ့ ဆွေးနွေးပါ။ Unicode Consortium မှာ တင်ပြပါ။ ရာနဲ့ချီတဲ့ ပညာရှင်တွေရဲ့ ဆုံးဖြတ်မှုကို ခံယူပါ။ ကိုမင်းကျော်ဟာ မှန်ရင် အဲဒါ အတည်ဖြစ်မှာပဲ။ Why not try it?

    • Thiha says:

      Yes, let’s compete together. Who is the best at sorting, language processing and other computer-related products. Who become world-wide standard. No NATO(No Action Talk Only). I’m at the side of Myanmar Unicode and support for Language Resources, Machine Translation, Collation and Locale.

  31. Ngwe Tun says:

    @Ko Minn Kyaw,

    >>> လူတကိုယ်အကြိုက် တမျိုးဘဲေလ။ အယူအဆဆိုတာ အမျိုးမျိုးဘဲ။ ရှိနေတဲ့ မျက်လုံး ၂လုံးနဲ့ အကုန်လုံးကို ကြည့်နိုင်ဖို့ဘဲ လိုတာပါ။
    I agree with you. Every person has favorite things and preferred matters. Well. You recommended/used that your favorite style such as 3 exceptional case from Unicode Standards. Well, We are using 100% Unicode Standards and no exceptional case. So. you should not use Unicode in your web site, label and any expression because you do not follow the 100%. We love the standards and develop/implementing the standards which are accepted by ISO, greater more than 200+ countries. It is not 2 eyes or group of professional or several country.

    If you can defeat recent standards, propose the new things. We will accept and appreciate yours. But, Right now. Just stand up and cheers to our work. And clearly aloud the words “Ayar is not Unicode standards. Ayar is simply fonts. nothing more” OK?

  32. frozencity says:

    No offense but I think you misplaced “0000 – က” under “Order အတိုင်း ပြန်စီကြည့်ရအောင်” paragraph. I think it should be “1000 – က”.
    Thanks.

  33. Sun Tun says:

    Minn Kyaw

    ဘာသာဗေဒဆိုတာ စကားသံပေါ်မှာ အခြေခံတာပါပဲ။ ဒါမှလည်း စီပုံစီနည်း ပုံသေ (Consistent) ဖြစ်မှာပါ။ ဥပမာ – ပြေ / ပျေ/ ပွဲ
    ကိုမောင်မောင်ဆန်း မြန်မာစာ သင်ခဲ့တုန်းက အဲလိုသင်ခဲ့တာလား သိချင်ပါတယ်။ စာရေးတဲ့အချိန်မှာ ေ (သေဝထိုး) ကိုစမရေးဘဲ ယူနီကုဒ် စတန်းဒတ်ဖြစ်တဲ့ ကေ လို့ ရေး ခဲ့ပါသလား။ 

    မင်းကျော်ရေ…. မြန်မာစာမှာ အရေးနှင့် အပြော နှစ်မျိုးရှိတယ်မလား

    အရေးပုံစံမှာ ိ ီ ု ူ ဲ စသည် သရတွေဟာ မူလဗျည်း အနောက်ကပဲ လိုက်ကြပါတယ်။ ရှေ့က မနေကြဘူး။ သဝေထိုးက ဘာလို့ရှေ့ကနေရေးလဲ? အားလုံးထဲမှာမှ သဝေထိုး တစ်ခုပဲ ရှေ့ကရေးနေရတယ် ရေးထုံးဖြစ်နေတာ ဒီ သဝေထိုးက exceptional case ဖြစ်နေတာပါ။

    အသံပုံစံအရ ပြန်စစ်ကြည့်ရင် က အေ မှ ကေ ဖြစ်လာတာပါ။ ဘာလိုလဲ ဆိုတော့ မူလဗျည်း မရှိဘဲ မည်သည့် သရမှ အသံထွက်လို့မရမပါ။ ဗျည်းရှေ့ကသရထည့်ပီး သရသံကို အရင် အသံထွက်အောင် ဖတ်လို့မရပါ။ သရ + ဗျည်း = အသံမရှိ ဆိုတာကို သိစေချင်ပါတယ်။ ဒီသရတွေက သူချည်းသက်သက် ရပ်တည်လို့မရပါ။ ‘က’ ဗျည်းဆို ရင်လည်း သူ့ချည်းသက်သက် အသံထွက်မရပါ။ ‘က’ + အ သရသံ ထည့်မှ “က” လို့အသံထွက်နိုင်တာပါ။

    အဘိဓာန်တို့ သတ်ပုံကျမ်းတို့မှာ အက္ခရာစဉ်ရင် ကေ ဆိုရင် က အုပ်စုထဲမှာပဲ ခေ ဆိုရင် ခ အုပ်စုပဲ သီးသန့် သဝေထိုးနဲ့ စတဲ့ အုပ်စု မရှိပါ။

    p.s စာလုံးပေါင်းပီး ကျက်မှတ်ခဲ့တာကို အတည့်မယူသင့်ပါ ဪ ကို သဝေထိုး သ ရရစ် ရေးချာ ရှေ့ထိုးလို့ ဆိုခဲ့တယ်။ ဒါမမှန်ပါဘူး တစ်လုံးထဲ ဪ ပါ။ ပေါင်းထားတာမဟုတ်ပါ။ ရေးထားတာကိုပဲ ကြည့်မယ်ဆိုရင် ြ ရရစ်လဲ ရှေ့ကပဲ။
    လက်ရေးမှာလဲ ရရစ်ရေးပီးမှ က ခ ရေးကြတာမြင်ဖူးပါတယ်။

  34. [...] lot of people complained that why vowel e is behind the consonant in Unicode encoding. I tried to answered that it’s [...]

Leave a comment


*