Skip to main content

ကျွန်တော် unicode ကို စစိတ်ဝင်စားလာခဲ့တဲ့အကြောင်း

ဒီလောက်ထိ စာအများကြီး တခါမှမရေးဖူးပါဘူး။
ကျွန်တော် အရင်ကတည်းက ရှင်းပြချင်နေတာလေးတွေမို့ ဒီတခါတော့ ကြိုးစားပြီး ရေးထားတယ်။
unicode သမားတွေကို ကျွန်တော် ရန်လုပ်ခဲ့တာတွေဆဲခဲ့တာတွေလည်း ပါပါတယ်။ စိတ်ဝင်စားဖို့ ကောင်းမှာပါ။
စပြောရရင် လွန်ခဲ့တဲ့ တနှစ်ခွဲလောက်က ဗိုက်ခဏခဏ အောင့်တာနဲ့ ဘာ ဆေးမီးတိုသုံးရမလဲ google ကနေရှာတာက စတာပဲ။
ဆေးမီးတိုကို အင်္ဂလိပ်လို ဘယ်လို ခေါ်မှန်း ကျွန်တော် မသိခဲ့ဘူး။
ဒါနဲ့ home cure chest pain ဆိုပြီးရှာတယ်။ home remedies ဆိုတာတွေအများကြီးကျလာတယ်။
home cure လို့ရှာတာနဲ့ google က home remedies ကိုလိုချင်နေမှန်း ဘယ်လိုလုပ် သိတာပါလိမ့်။
သေချာတယ် google က အင်္ဂလိပ်စာ နားလည်လို့ပဲ။
ဒီလိုပုံစံတူ အင်္ဂလိပ်စာကိုသုံးပြီး google မှာလွယ်လွယ်ရှာလို့ရမှန်း အများသိပြီးဖြစ်မှာပါ။
ဟုတ်ပြီ home remedies ဆိုတာတော့ တွေ့ပြီ။
အင်္ဂလိပ်လို ဟိုအပင် ဒီအပင် ရေးထားတာတွေလည်း ကျွန်တော်မသိပြန်ဘူး။
ဘာပင်တွေမှန်းလည်း မသိဘူး။ သူတို့ပြောထားတဲ့အပင်တွေကို စကားလုံးလေး copy ကူး။
ပုံအနေနဲ့ပြန်ရှာကြည့်တယ်။ ပုံမြင်ရတောင် ဘာမှန်းမသဲကွဲပြန်ဘူး။
ဒီတော့ မြန်မာ လိုလေး ရှာလို့ရရင် ပိုမကောင်းဘူးလားဗျာ။
အယ်... မြန်မာလိုရှာတော့ ဒီလောက်မလွယ်တော့ဘူးဗျာ။
online မှာ မြန်မာ data နည်းနေသေးတာရယ်။
google က မြန်မာစကားကို အရမ်းကြီးနားမလည်သေးတာရယ်။
( အရမ်းကြီးနားမလည်သေးတယ်ဆိုတာ အနည်းအကျဉ်းနားလည်နေပြီထင်လို့။ ထင်တာကို ပြောတာနော်။ ဟုတ်မဟုတ် သေချာမသိဘူး )
ကြားဖြတ်ပြောပါရစေ။
"ရှာလို့မလွယ်တော့ ဘာဖြစ်လဲ။ အင်္ဂလိပ်လိုပဲရှာမှာပေါ့"
ဒါဆို အင်္ဂလိပ်စာ မတတ်တဲ့သူတွေအတွက် ကျတော့ရော။
"မတတ် မရှာနဲ့ပေါ့ကွာ။"
လစ်လိုက်တော့။ ခင်ဗျား ဆက်မဖတ်နဲ့တော့။
အိုကေ ခုန ဆေးမီးတို ရှာတဲ့အကြောင်း ပြန်ဆက်ကြရအောင်။
ဒီလို ဘာ ဆေးမီးတို သုံးရမလဲဆိုတာ ရှာချင်တဲ့သူတွေအတွက် လွယ်ကူလာအောင် website လေးတခုထောင်ချင် စိတ်ဖြစ်လာတယ်။
ပထမအဆင့်အနေနဲ့ data ထည့်ပေးမယ့်သူတွေနဲ့ ဘယ်လိုပူးပေါင်းရမလဲ မစဉ်းစားသေးဘူး။
data တွေရှိပြီထား user က ကိုယ်လိုချင်တာ လာရှာတော့ လွယ်မှာလား စဉ်းစားတယ်။
မလွယ်ဘူး သေချာတယ်။ ဘာလို့မလွယ်လဲဆိုတော့
ဥပမာ။ post ရေးတဲ့သူက "ဗိုက်နာ" လို့ရေးမယ်။ ရှာတဲ့လူက "ဗိုက်အောင့်" လို့ရှာမယ်။ ဒါဆို မတွေ့တော့ဘူး။
ဘာလို့ဆို "ဗိုက်နာ" နဲ့ "ဗိုက်အောင့်" နဲ့ဆင်မှန်း ကွန်ပျူတာက မသိလို့။
ဒါ ဥပမာပဲရှိပါသေးတယ်။ မြန်မာစကားက အရမ်းရှုပ်ထွေးပါတယ်။
ဒါဆို ရှာရလွယ်အောင်ဘယ်လိုလုပ်မလဲ စဉ်းစားတယ်။
အဲဒီမှာ လူတွေသုံးတဲ့ ဘာသာစကားကို ကွန်ပျူတာ နားလည်အောင် လုပ်တဲ့ field ကို Natural Language Processing ဆိုပြီး စသိတယ်။
ဒီဟာအဆင်ပြေရင် ကျွန်တော်တို့ဖြစ်နေတဲ့ပြဿနာ အဆင်ပြေပြီ။
NLP အဆင်ပြေသွားရင် ဆေးမီးတို website တင်မဟုတ်ပါဘူး။
မြန်မာတွေအားလုံးအတွက် အသုံးဝင်နိုင်မယ့် ကျန်တဲ့ website တွေပါ အဆင်ပြေပြီ။
website ဆိုတာ မနီးမဝေးမှာရှိတဲ့ platform တခုကို ပြောတာ။
Natural Language Processing ကိုသုံးပြီး ဒီ့ထက်မကဆက်သွားလို့ရတယ်။
Voice Recognition နဲ့ပေါင်းပြီး ဘယ်သူ့ဆီဖုန်းခေါ်လိုက်။ ဘယ်သူ့ဆီ ဘာ message ပို့လိုက် စသဖြင့်လုပ်လို့ရလာမယ်။
ဒီ့ထက်မြင့်လာရင် smart home အိမ်မှာ တပ်ဆင်ပြီး ဘယ်အခန်းမီးတွေပိတ်။ ရေတင်ထားလိုက်။ အစရှိတာတွေလုပ်လို့ရလာမယ်။
ဒီ့ထက်မြင့်လာရင် ကားမှာ AI တပ်ပြီး။ မန္တလေးသို့ မောင်းပါ။ ရန်ကုန်သို့မောင်းပါ။ auto မောင်းခိုင်းလို့ရမယ်။
နောက်တကယ့်လူလို စကားပြောနိူင်တဲ့ domestic robots တွေပေါ်လာမယ်.
ပါးစပ်နဲ့တင်ပြောခိုင်းရုံပဲ။ ဘယ်လောက် ဇိမ်ကျလဲ။
အင်း အဲဒီတော့ Natural Language Processing ဆိုတာကြီးက အသုံးဝင်တာတော့ မှန်ပြီ။
အဲဒါကြီးရအောင် ဘယ်လိုလုပ်မလဲ။
အဲဒါမှ ပြဿနာပဲ။ ဒီ field က ကိုယ်နဲ့ အဝေးကြီးပဲ။
အဲအချိန်က basic algorithm တွေတောင် ကောင်းကောင်းနားမလည်တာ။
အဲဒါကို လေ့လာဖို့ ကျွန်တော့်အတွက် ဘယ်လိုမှမဖြစ်နိုင်ဘူး။
အချိန်တွေအများကြီးပေးရလိမ့်မယ်။
ဒီ field ထဲမှာ ပါဝင်နိုင်ဖို့ အနည်းဆုံး ၁၀ နှစ်လောက်တော့ လေ့လာရမယ်ထင်တယ်။
လေ့လာရမယ့်အချိန်ကိုပဲ ပြောတာနော်။ ဖန်တီးတဲ့အချိန်မပါသေးဘူး။
ဒီတော့ လုပ်နိုင်တဲ့သူတွေလိုက်ကြည့်တယ်။
အဲမှာ Unicode Zawgyi ပြဿနာကို စတွေ့တာပါပဲ။
Zawgyi နဲ့ရေးတာကို Natural Language Processing လုပ်လို့မရဖူးလား စဉ်းစားတယ်။
ဖြစ်နိုင်မှာပါ။ ထင်တာပဲ။ ဒါပေမဲ့ Zawgyi နဲ့လုပ်လိုက်ရင် တိုင်းရင်းသား စာလုံးတွေမပါတော့ဘူး။
တိုင်းရင်းသားတွေကို ပြစ်ပယ်လွန်းရာကျသွားပြီ။
နဂိုကတည်းကမှ ဗမာတွေက တိုင်းရင်းသားတွေကို လူရာမသွင်းဘူးဆိုပြီး ထင်နေကြတာ။
နောက်တချက်က Zawgyi နဲ့လုပ်ထားတာကို standard မဟုတ်လို့ဆိုပြီး ဘယ် company မှယူသုံးမှာမဟုတ်ဘူး။
Standard မဟုတ်တော့ဘာဖြစ်လို့လဲ performance optimized မဖြစ်နိုင်ဘူး။
အလွယ်ပြောရရင် သူတို့ software တွေ platform တွေမှာ မမြန်ဘူးဆိုပါတော့။
အဲအခါကျ လုပ်သမျှအကုန် သဲထဲ ရေသွန်ပဲ။
နောက်တချက်က မြန်မာစာက နဂိုကတည်းက အရမ်းရှုပ်ထွေးနေပြီးသားပါ။
standard မဟုတ်တာနဲ့ဆို standard ထက်အများကြီးပိုခက်လိမ့်မယ်။
standard ဆိုတာလည်း ဒါတွေအတွက် လွယ်အောင် standard သတ်မှတ်ပေးထားတာ။
ရေရှည်ကောင်းအောင် foundation ချပေးထားတယ်ဆိုပါတော့။
ဒီတော့ နောက်တမျိုးစဉ်းစားတယ်။
Unicode code point တွေကို Zawgyi နဲ့ခပ်ဆင်ဆင်ဖြစ်အောင် ပြင်ပေးလို့မရဘူးလား။
အဲမှာ ကျွန်တော် Unicode သမားတွေကို လိုက်ဆဲတော့တာပဲ။
standard ဆိုတာကြီးက ပြင်လို့မရဘူးလား။ Standard ဆိုတာ လူတွေသတ်မှတ်တာပဲမလား။
လူသုံးများနေတဲ့ဟာနဲ့ တပုံစံတည်းမတူတောင် ခပ်ဆင်ဆင်ဖြစ်အောင် ပြင်မရဘူးလား။
ဘာလို့ လူသုံးမများတာကြီးကိုပဲ လိုက်သုံးခိုင်းနေရတာလဲ။ လိုက်ရန်လုပ်တယ်။
Unicode က Zawgyi ကို အကုန်လုံး မဖတ်နိုင်တောင် အနည်းအကျဉ်းတော့ဖတ်နိုင်ရမယ်။
ခင်ဗျားတို့မပြင်လည်း ကျွန်တော်ဘာသာ ပြင်မယ်။
Unicode Consortium ကို submit လုပ်မယ်ဆိုပြီး ကိုယ့်စိတ်ထဲတင်ကိုယ် ကြိမ်းဝါးနေတယ်။
ကြိမ်းတာ ကြိမ်းဝါးတာ အဲဒါနဲ့ပတ်သက်ပြီး ဘာမှမလေ့လာဖြစ်ခဲ့ပါဘူး။
Unicode သမားတွေကိုပဲ ဆဲမြဲ လိုက်ဆဲနေခဲ့တာ။
ကျွန်တော် ဘယ်လိုတွေဆဲခဲ့တယ်။ ဘာတွေပြောခဲ့တယ် ဆိုတာ MUA ကလူတွေတော်တော်များများသိကြပါတယ်။
အဲလိုတွေပြောရင်းကနေ ကျွန်တော် ဆဲနေ ပြောနေတာကို ကိုဆန်းလင်းနိုင် နဲ့ ကိုရဲဇာနည်အောင်က တွေ့ပြီး ဘာကြောင့်ပြင်မရတယ်ဆိုတာ ရှင်းပြတယ်။
သူတို့နှစ်ယောက်ကပဲ ကျွန်တော့ကို ဝိရာမဆိုတာလေး ကို စပြီး မိတ်ဆက်ပေးလိုက်တယ်။
အဲမှာ သဘောပေါက်သွားပြီ။ Zawgyi ကဘယ်လိုမှ Standard ဖြစ်မလာနိုင်သလို။
Unicode ကလည်း Zawgyi နဲ့ဆင်အောင် ပြင်လို့မဖြစ်နိုင်ဘူး
ဘာကြောင့် ဘာလို့ မရတယ်ဆိုတာ MUA ကလူတွေရေးထားတဲ့ post တွေအများကြီးရှိလို့ ကျွန်တော်မရေးတော့ပါဘူး။
ဖတ်ချင်တယ်ဆိုရင် ကျွန်တော် link ပြန်ရှာပေးပါ့မယ်။
ဒါက ကျွန်တော့် unicode ဘက်ကို ပြောင်းချင်လာရတဲ့အကြောင်း။
အများပြောနေကြတဲ့ unicode သမားတွေ ကြီးကျယ်တယ် စမာန်တက်တယ်။
ဟုတ်ချင်လည်း ဟုတ်မှာပါ။ အကုန်လုံးတော့မဟုတ်ပါဘူး။
ကျွန်တော်မြင်နေတဲ့ MUA ထဲကလူတွေ ကျွန်တော့် မိတ်တွေတွေကတော့ အဲလိုမဟုတ်တာသေချာပါတယ်ဗျာ။
သူတို့တွေလည်း သာမာန် user တွေပါ။
နောက်ပြီး သာမာန် လူသားတွေပဲ ဖြစ်တဲ့အတွက် တခါတလေ ဒေါသအလျောက်ပြောမိတာတွေလည်း ရှိမှာပါ။
ငါ စံစနစ် လိုက်နာသူကြီး။ ငါကွ ဆိုပြီး ကြီးကျယ်နေကြတာတော့ မဟုတ်ပါဘူး
ဟုတ်တယ်ပဲထားပါဦးဗျာ။
သူတို့ စမာန်တက်တာ မတက်တာ တကယ်အရေးမကြီးတဲ့ ကိစ္စပါ။
ကျွန်တော် သူတို့ကို ဆဲနေတဲ့အချိန်တုန်းကလဲ သူတို့ကို အလကားနေရင်း စမာန်တက်နေတဲ့သူတွေလို့မြင်ခဲ့တာပါပဲ။
ဒါပေမဲ့ ကျွန်တော့် စိတ်ထဲမှာ NLP ရဖို့ပိုအရေးကြီးနေခဲ့တယ်။
ဒါကြောင့်ပြောင်းဖြစ်လာခဲ့တယ်။
နှစ်ခုစလုံးသုံးနေတယ်ဆိုပိုမှန်ပါတယ်။
အော်။ ဘာကြောင့် နှစ်ခုလုံးသုံးလဲ ဆို ကျွန်တော်တို့အနေနဲ့ ပေါင်းကူးလိုအပ်ပါတယ်။ အခုဆို Zawgyi  80% Unicode 100% ရောမြင်ရတဲ့ ZawDecode ဆိုတဲ့ font ရှိနေပါပြီ။ ကျွန်တော်လည်း ဒီ font ကိုပဲသုံးပါတယ်။ Keyboard ကတော့ KeyMagic, Zawgyi Keyboard နဲ့ English Keyboard သုံးမျိုးသုံးပါတယ်. ZawDecode ကို ဒီမှာဒေါင်းလို့ရပါတယ်.
http://guides.mmunicode.org/index.php/File:ZawDecode1.1_for_Windows01.ttf
အခက်အခဲတစုံတရာရှိရင် ကျွန်တော်တို့ကို မေးပါ. ကူညီဖို့ အဆင်သင့်ရှိပါတယ်။
နောက်ဆုံးပြောချင်တာက လူအများပြောနေကြတဲ့အချက်ပါ။
“Unicode သမားတွေက ကိုယ့်ပစ္စည်းကို လူသုံးများလာအောင် customer တွေကြိုက်အောင် လုပ်ရမယ်ဆိုတဲ့၊
customer တွေကို support တွေပေးရမယ်" ဆိုတဲ့အချက်ပါ။
တကယ်က
“Unicode ကို ပိုင်တဲ့လူမရှိသလို unicode customer ဆိုတာလည်း မရှိပါဘူး။
Unicode ကအများပိုင်ပါ။ Unicode user ဆိုတာပဲရှိပါတယ်။"
ကျေးဇူးတင်ပါတယ်။
Written by Aung Thiha

Comments

Popular posts from this blog

Contacts တွေကို one click နဲ့ unicode ပြောင်းနည်း

ios သမားတွေကတော့အရင်ဆုံး App Store ထဲဝင်ပြီး search ကနေ pyaung လို့ရိုက်ရှာပါ။ ပြီးရင် Download လုပ်ပါ။ ရှာ မတွေ့ရင် ဒီ link ကနေ download လုပ်လို့လည်း ရပါတယ်။ https://apps.apple.com/us/app/pyaung/id1039690192 home screen မှာ pyaung app ပေါ်လာရင် ဝင်လိုက်ပါ။Contact ဆိုတဲ့ tap ထဲဝင်ပါ။ zawgyi to uni , uni to zawgyi ကို စိတ်ကြိုက်ပြောင်းနိုင်ပါပြီ။ Android သမားတွေကတော့ ကိုနေရှိန်ဦး လုပ်ပေးထားတဲ့ app ကို အောက်က link ကနေ Download လုပ်ပြီး zawgyi to uni , uni to zawgyi ကို စိတ်ကြိုက်ပြောင်းနိုင်ပါတယ်။ https://play.google.com/store/apps/details?id=com.nso.unicc https://m.apkpure.com/unicontact-converter/com.nso.unicc နောက်တခုက Dev House က ထုတ်တဲ့ MM contact converter ပါ။ သူကတော့ Android သီးသန့်ပါပဲ။ Contacts တွေမှာ zawgyi နဲ့ unicode ရောနေရင်တောင် အဆင်ပြေပါတယ်။  ပြောင်းနေရင်း ဟန်းသွားတာမျိုးမဖြစ်ပါဘူး။ (Main thread မှာအလုပ်လုပ်မလုပ်ပဲ thread ခွဲပြီးပြောင်းလို့ပါ) https://play.google.com/store/apps/details?id=me.myatminsoe.mmcontactsconverter

မြန်မာအဘိဓာန်အက္ခရာစဉ်နည်း

မြန်မာအက္ခရာစဉ်ရာတွင် ၁။ ဗျည်းအက္ခရာစဉ် ၂။ ဗျည်းတွဲ ၃။ သရကာရန် ၄။ အသတ်ကာရန် ဟူ၍ ၄ ဆင့်ရှိပါသည်။ ၁။ ဗျည်းအက္ခရာစဉ် ****************** ဗျည်းအက္ခရာ စဉ်ရာတွင် က မှ အ အထိ အစဉ်လိုက်သာဖြစ်သည်။ မှတ်သားရန်မှာ ဉကလေးကို ညကြီးရှေ့တွင် စဉ်ရသည်။  ဥပမာ >>>ဗျည်းစဉ်များကို သိရန် အောက်ပါစာများကို အက္ခရာစဉ်ကြည့်ပါ။ အိတ်ကပ်၊ ခါသာ၊ မာလာ၊ ငါးသိုင်း၊ ဉာဏ၊ ညအခါ၊ ကတိ။ ကတိ၊ ခါသာ၊ ငါးသိုင်း၊ ဉာဏ၊ ညအခါ၊ မာလာ၊ အိတ်ကပ်။ ဟု အဖြေရပါသည်<<< ၂။ ဗျည်းတွဲ ********** ပင့်၊ရစ်၊ဆွဲ၊ထိုး သည် ယ၊ရ၊ဝ၊ဟ ၏ စာလုံးဆင့်ပုံစံ ဖြစ်ပါသည်။ ထို့ကြောင့် ယ၊ရ၊ဝ၊ဟ အစဉ်လိုက်အတိုင်းစဉ်ရသည်။ ကျ၊ကြ၊ကှ၊ကွ။ ကျွ၊ ကြွ။ ကျှ၊ကြှ၊ကွှ။ ကျွှ၊ကြွှ။ (ကဗျည်းနှင့် ပေါင်းပြထားပါသည်) ရှင်းအောင်ပြရပါက ကျ=က ယ။ ကြ=က ရ။ ကှ=က ဟ။ ကွ=က ဝ ကျွ=က ယ ဝ။ ကြွ=က ရ ဝ ကျှ=က ယ ဟ။ ကြှ=က ရ ဟ။ ကွှ=က ဝ ဟ ကျွှ=က ယ ဝ ဟ။ ကြွှ=က ရ ဝ ဟ ဖြစ်ပါသည်။ ဥပမာ >>>မျောက်ကြီး၊ မွဲတေ၊ မျှတ၊ မြို့မ၊ မှတ်ခြင်၊ မြွေပါ၊ မွှေးပျံ့။ မျောက်ကြီး၊ မြို့မ၊ မွဲတေ၊ မှတ်ခြင်၊ မြွေပါ၊ မျှတ၊ မွှေးပျံ့။ <<< ...

MacOS Myanmar Unicode Keyboard

  MacOS မှာ ဘယ်တုန်းက ပါလာမှန်းတော့ မသိဘူး။ အစက keymagic နဲ့ပဲ မြန်မာစာကို ရိုက်နေတာ။ သဝေထိုးကို ရှေ့က ရိုက်တာ အကျင့်ပါနေလို့။ ခုကျ ubuntu မှာ messenger က chrominium based ဆိုတော့ သဝေထိုးရှေ့က ရိုက်ရင် bug ပါပြီး ရိုက်မရဖြစ်နေတာနဲ့ default keyboard ကို သုံးရပြန်ရော။ ခုမှ သတိရလို့ Mac မှာပြန်ကြည့်တော့ mac မှာ မြန်မာစာအတွက် ကီးဘုတ်က ၂ ခုပါတာပဲ။ တခုက ရိုက်နေကျ myanmar 3 layout နဲ့ နောက်တခုက ဘာကြီးလဲကို မသိတာ။ စာလုံးတွေက တနေရာစီ။ အဲ့တော့ default myanmar 3 layout keyboard နဲ့ ဆိုတော့ keymagic တောင် ထည့်စရာမလိုတော့ဘူး။ သဝေထိုးကို နောက်မှ ရိုက်တာကလည်း အသားကျနေပြီးသား။  System preferences > keyboard > input source ကနေ  + ကို နှိပ် Burmese ကို ရွေး ။အပေါ်က Myanmar ကို ရွေး။  ရပြီ။  P.S- Catalina နဲ့ BigSur မှာတော့ ရတယ်။ ကျန်တဲ့ အဟောင်းတွေတော့ မသိဘူး။