အခုတလော အင်တာနက်ပေါ် လှုပ်လှုပ်ရွရွဖြစ်နေတဲ့ကိစ္စတစ်ခုကို ပြောပါဆိုရင် ယူနီကုဒ်နဲ့ ဇော်ဂျီတို့ရဲ့ ကိစ္စကိုပြောရပါလိမ့်မယ်။ Unicode အတွက် ကြိုးစားကြနေသူတွေ အားကောင်းလာကြသလို google translate မှာ မြန်မာစာပါလာတဲ့ကိစ္စ၊ OS version အသစ်တွေ ထွက်လာတဲ့ကိစ္စတွေဟာလည်း Unicode နဲ့ Zawgyi တို့ရဲ့ ရှည်ကြာနေပြီဖြစ်တဲ့ ပဋိပက္ခကို တစ်ဖန်ပြန်လည်ပြင်းထန်စေခဲ့ပါတယ်။
ယူနီကုဒ်ဆိုတာဘာလဲ၊ ဇော်ဂျီဆိုတာဘာလဲ၊ အဲဒီနှစ်ခု ဘာတွေကွာခြားလဲ၊ ဘာကြောင့် အဲဒီနှစ်ခု ပြဿနာဖြစ်နေကြသလဲ၊ ကိုယ်ကိုယ်တိုင်ကကော အခုလက်ရှိ ဘာကိုသုံးနေသလဲ ဆိုတာတွေဟာ အင်တာနက်ပေါ်မှာ မြန်မာစာရေးနေဖတ်နေသူတိုင်း သိကိုသိထားရမယ့် အကြောင်းအရာတွေဖြစ်ပါတယ်။
ယူနီကုဒ်ရယ် ဇော်ဂျီရယ်လို့ ခွဲမပြောခင် ကွန်ပျူတာ၊ ဖုန်းတွေမှာ စာတွေကို ဘယ်လိုသိမ်းသလဲဆိုတာကို အကြမ်းဖျင်း နားလည်ထားသင့်ပါတယ်။ စာဖတ်သူက 'က' (ကကြီး) လို့ရိုက်လိုက်ပေမယ့် ကွန်ပျူတာတွေ ဖုန်းတွေက ကကြီးရယ်လို့ သိတာမဟုတ်ပါဘူး။ သူတို့နားလည်တဲ့ နံပါတ်တွေ (ဥပမာ - ကကြီးဆိုရင် 1000) နဲ့ပဲ မှတ်သားထားတာပါ။
စာဖတ်သူက ကကြီးလို့ရိုက်ပြီး တစ်ဖက်ကဖုန်းတစ်လုံးကို လှမ်းပို့လိုက်တယ်ဆိုပါစို့။ စာဖတ်သူက ကကြီးလို့ ရိုက်လိုက်တယ်။ ဖုန်းက 1000 လို့ ပြောင်းလိုက်တယ်။ တစ်ခြားဖုန်းကို လှမ်းပို့လိုက်တယ်။ တခြားဖုန်းက သူ့ဆီရောက်လာတဲ့ 1000 ကို ကကြီးလို့ ဘာသာပြန်တယ်။ အဲဒီဖုန်းပိုင်ရှင်ကို ကကြီးလို့ ပြန်ပြပေးတယ်။ စာဖတ်သူရေးလိုက်တဲ့ ကကြီးက တစ်ခြားသူဆီ ရောက်သွားတယ်။
တကယ်လို့များ စာဖတ်သူပို့လိုက်တဲ့ 1000 ကို တစ်ဖက်ဖုန်းက ကကြီးလို့ ဘာသာမပြန်ဘဲ ခခွေးလို့ ဘာသာပြန်လိုက်ရင် တလွဲတွေဖြစ်ကုန်မှာပါ။ 'ကွေးနေပါ' လို့ ပို့လိုက်တာက တစ်ဖက်မှာ 'ခွေးနေပါ' လို့ ဖြစ်သွားမှာပါ။ ဒီလိုပြဿနာတွေ မဖြစ်အောင်လို့ နှစ်ဖက်စလုံး သဘောတူလက်ခံနိုင်မယ့် စံ တစ်ခုလိုပါတယ်။ ဥပမာ - ကကြီးဆိုရင် 1000 ၊ ခခွေးဆိုရင် 1001 အစရှိသဖြင့်ပေါ့။
ဒီအထိနားလည်ပြီးပြီဆိုရင် နောက်တစ်ဆင့်ထပ်တက်ပါမယ်။ မြန်မာအချင်းချင်း နားလည်ရုံနဲ့မပြီးဘဲ တစ်ကမ္ဘာလုံးနဲ့ ဆက်သွယ်နိုင်မယ့် စံ တစ်ခုလည်း လိုပါတယ်။
ဥပမာ - အင်္ဂလိပ်အက္ခရာ 'A' (အေ အကြီး) ကို 41 လို့ တစ်ကမ္ဘာလုံးက သတ်မှတ်ထားပါတယ်။ 41 ဆိုတာမြင်လိုက်တာနဲ့ တစ်ကမ္ဘာလုံးက ကွန်ပျူတာတွေ၊ ဖုန်းတွေ၊ tablet တွေ၊ MP3 player တွေ၊ DVD player တွေ၊ ဂိမ်းစက်တွေ အစရှိသဖြင့် ရှိသမျှပစ္စည်းအကုန်လုံးက အေ အကြီးဆိုတာကို သိကြပါတယ်။ အဲဒါကို တစ်ဦးတစ်ယောက်တည်းကပဲ 41 ဆိုတာ 'B' ပါလို့ လုပ်လာရင် တစ်ကမ္ဘာလုံး Apple ဖြစ်နေချိန်မှာ သူ့တစ်ယောက်တည်းမှာပဲ Bpple ဖြစ်နေမှာပါ။ စံ ဆိုတာ ချဖို့အရေးကြီးသလို အဲဒီစံအတိုင်း လိုက်နာဖို့လည်း အရေးကြီးတယ်လို့ ဆိုလိုတာပါ။
ဒါဖြင့် အဲဒီ စံ ဆိုတာကြီးကို ဘယ်သူက ချပေးလဲဆိုတာ အရေးကြီးလာပါတယ်။ Unicode Consortium ဆိုတဲ့ NGO အဖွဲ့အစည်းကြီးတစ်ခုကနေ တစ်ကမ္ဘာလုံးက ဘာသာစကားတွေအတွက် စံနှုန်းကိုချပေးပါတယ်။ သူတို့သဘောနဲ့သူတို့ ချပေးတာတော့ မဟုတ်ပါဘူး။ သက်ဆိုင်ရာ နိုင်ငံအလိုက်၊ သက်ဆိုင်ရာ ဘာသာစကားအလိုက် အဖွဲ့အစည်းတွေနဲ့ ဆွေးနွေးပြီးမှ ချပေးတာပါ။ ကကြီးကို 1000 လို့ သတ်မှတ်ကြမယ်၊ ခခွေးကိုတော့ 1001 လို့ သတ်မှတ်ကြမယ်၊ ယပင့်ကို 103B လို့ သတ်မှတ်ကြမယ် အစရှိသဖြင့်ပေါ့။
အဲဒီအဖွဲ့က ချပေးထားတဲ့ စံ အတိုင်း လိုက်နာတာ ယူနီကုဒ်ပါ။ ဇော်ဂျီကတော့ မလိုက်နာပါဘူး။
ယူနီကုဒ်မှာ 103B ဟာ ယပင့်ပါ။ ဇော်ဂျီမှာတော့ 103B ဟာ ရရစ်ဖြစ်နေပါတယ်။ ယူနီကုဒ်မှာ 'ချစ်' လို့ရေးတာဟာ ဇော်ဂျီမှာ 'ခစြျ' လို့ သွားပေါ်ပါလိမ့်မယ်။
ယူနီကုဒ်မှာ 103D ဟာ ဝဆွဲပါ။ ဇော်ဂျီမှာတော့ 103D ဟာ ဟထိုးဖြစ်နေပါတယ်။ ယူနီကုဒ်မှာ 'ရွာ' ဆိုတာဟာ ဇော်ဂျီမှာ 'ရှာ' ဖြစ်နေပါလိမ့်မယ်။
ကောင်းပါပြီ။ အခု စာဖတ်သူသုံးနေတာ ယူနီကုဒ်လား၊ ဇော်ဂျီလားလို့ စစ်ကြည့်ကြပါမယ်။
browser ထဲမှာ http://www.google.com.mm ကို သွားကြည့်ပါ။ Google ဆိုတာ တစ်ကမ္ဘာလုံး အင်တာနက်သုံးနေသူတိုင်း မသိမဖြစ်သိကြတဲ့ search engine ကြီးတစ်ခုပါ။ သုံးစွဲသူအားလုံး အဆင်ပြေစေဖို့အတွက် သက်ဆိုင်ရာဘာသာစကားနဲ့ အသုံးပြုနိုင်အောင်လို့ Google က စီစဉ်ပေးထားပါတယ်။ Google ဟာ Unicode က ချပေးထားတဲ့ စံကိုသုံးပါတယ်။ သူ့ website မှာ unicode စံ အတိုင်း မြန်မာစာတွေကို ရေးထားပါတယ်။ အဲဒီစာတွေကို ဖတ်မရဘူးဆိုရင် စာဖတ်သူသုံးနေတာ ယူနီကုဒ်မဟုတ်ပါဘူး။ ဇော်ဂျီပါ။
နောက်ထပ် http://my.wikipedia.org ကို သွားကြည့်ပါမယ်။ Wikipedia ဆိုတာကတော့ တစ်ကမ္ဘာလုံးကလူတွေ ဝိုင်းရေးဝိုင်းဖတ်ကြတဲ့ စွယ်စုံကျမ်းကြီးပါ။ သူ့မှာလည်း သက်ဆိုင်ရာဘာသာစကားအလိုက် အကြောင်းအရာတွေကို ရေးသားထားပါတယ်။ မြန်မာစာအတွက်လည်း ပါပါတယ်။ ယူနီကုဒ်စံကိုသုံးကြောင်း ရေးထားပါတယ်။ အဲဒီစာတွေကို ဖတ်ရတယ်ဆိုရင် ယူနီကုဒ်ပါ။ ဖတ်မရဘူးဆိုရင် ဇော်ဂျီပါ။
အခု ဒီစာကိုရေးထားတာလဲ ဇော်ဂျီကို သုံးပြီး ရေးထားတာပါ။
ယူနီကုဒ်နဲ့ ဇော်ဂျီနဲ့ ဘာတွေကွာသေးလဲ။ ဘယ်လို အားသာချက်၊ အားနည်းချက်တွေရှိသလဲဆိုတာ ဆက်ပါဦးမယ်။ ဒီထဲမှာ မှားနေတာတွေရှိရင်လည်း ထောက်ပြပြင်ပေးကြပါ။
ယူနီကုဒ်နဲ့ ဇော်ဂျီတို့ရဲ့ နောက်ထပ်ကွာခြားမှုကတော့ စာလုံးစီပုံပါ။
ဇော်ဂျီဟာ စာလုံးတွေကို အမြင်အတိုင်း စီပါတယ်။ ဥပမာ - 'မောင်' ဆိုတာကို 'ေ'+'မ'+'-ာ'+'င'+' -်' ဆိုပြီး စီပါတယ်။
ယူနီကုဒ်ကတော့ သတ်မှတ်ထားတဲ့ စည်းမျဉ်းတွေအတိုင်း စီပါတယ်။ ဥပမာ - 'မောင်' ဆိုတာကို 'မ'+'ေ'+'-ာ'+'င'+' -်' လို့ စီပါတယ်။ (ဒီလို သဝေထိုးကို နောက်မှာစီပေမယ့် ပုံဖော်တဲ့အခါမှာတော့ ရှေ့မှာပေါ်အောင် ဖော်ပေးပါတယ်။ သဝေထိုးကို နောက်မှာစီတဲ့အတွက် အားသာချက်တွေကို နောက်မှာဆက်ရေးပါဦးမယ်။)
ဒါကြောင့် 'အ'+'ေ'+'မ' ဆိုတာကို ဇော်ဂျီက 'အမေ' လို့ပြပေးပြီး ယူနီကုဒ်ကတော့ 'အေမ' လို့ နားလည်ပါတယ်။
ဒီလိုမျိုး code point တွေ မတူတာ (ဇော်ဂျီက အသတ် ' -်' ဟာ ယူနီကုဒ်မှာ ယပင့် ' -ျ' ဖြစ်နေတာ)၊ စာလုံးစီပုံမတူတာတွေကြောင့် ယူနီကုဒ်နဲ့ ဇော်ဂျီဟာ အတူတူတွဲမရှိနေနိုင်ပါဘူး။
စာဖတ်သူဖုန်းမှာ ဇော်ဂျီသွင်းထားတယ်ဆိုရင် ယူနီကုဒ်စာတွေဟာ ဖတ်မရအောင်ပျက်နေမှာဖြစ်ပြီး ယူနီကုဒ်သွင်းထားတယ်ဆိုရင်လည်း ဇော်ဂျီနဲ့ရေးထားတာတွေကို ဘယ်လိုမှ ဖတ်လို့ရမှာမဟုတ်ဘူးလို့ အကြမ်းဖျင်းနားလည်ထားရပါမယ်။ ဒီလို အတူတူရှိမနေနိုင်တာဟာ ယူနီကုဒ်နဲ့ ဇော်ဂျီတို့ ပြဿနာဖြစ်ရတဲ့ အဓိကအကြောင်းရင်းပါပဲ။
စာဖတ်သူက ယူနီကုဒ်သုံးပေမယ့် စာဖတ်သူရဲ့သူငယ်ချင်းတွေက ဇော်ဂျီကိုသုံးတယ်ဆိုရင် တစ်ယောက်နဲ့တစ်ယောက်ဆက်သွယ်ဖို့ အဆင်ပြေမှာမဟုတ်ပါဘူး။ စာဖတ်သူက ဇော်ဂျီသုံးတယ်ဆိုရင် ယူနီကုဒ်နဲ့ရေးထားတဲ့ Wikipedia လို website တွေကို ကြည့်ဖို့ ဘယ်လိုမှအဆင်ပြေမှာမဟုတ်ပါဘူး။ ဒါကြောင့် ယူနီကုဒ်မဟုတ်ရင် ဇော်ဂျီ၊ ဇော်ဂျီမဟုတ်ရင် ယူနီကုဒ်၊ နှစ်ခုထဲက တစ်ခုပဲရွေးလို့ရမှာပါ။ နှစ်ခုစလုံး ရွေးဖိို့မဖြစ်နိုင်ပါဘူး။
နောက်တစ်ခု သိထားသင့်တာက စာဖတ်သူသုံးနေတဲ့ ကီးဘုတ်နဲ့ ဖောင့်တွေပါ။
ယူနီကုဒ်နဲ့ ဇော်ဂျီဆိုပြီး နှစ်ခုကွဲနေတော့ ဇော်ဂျီကီးဘုတ်၊ ယူနီကုဒ်ကီးဘုတ်၊ ဇော်ဂျီဖောင့်၊ ယူနီကုဒ်ဖောင့်ဆိုပြီး လိုက်ကွဲပါတယ်။
Android တွေမှာ အသုံးများတဲ့ ကီးဘုတ်တွေဆိုရင် Frozen တို့ Bagan တို့ရှိပါတယ်။ တခြားကီးဘုတ်တွေလည်း အများကြီးပါပဲ။
ရိုက်လိုက်လို့ ယူနီကုဒ်အတိုင်းထွက်လာတယ်ဆိုရင် ယူနီကုဒ်ကီးဘုတ်တွေပါ။ အဲလိုမှမဟုတ်ရင် ဇော်ဂျီကီးဘုတ်တွေပါ။ ပုဂံကီးဘုတ်ဆိုရင် ယူနီကုဒ်နဲ့ရိုက်ချင်လား၊ ဇော်ဂျီနဲ့ရိုက်ချင်လား ရွေးပေးလို့ရပါတယ်။
ဒါကြောင့် ဇော်ဂျီလို့ပြောလိုက်ရင် ဇော်ဂျီအတိုင်းရိုက်ပေးတဲ့ ကီးဘုတ်ရယ်၊ ဇော်ဂျီအတိုင်းပြပေးတဲ့ ဖောင့်ရယ်လို့ အတွဲလိုက်နားလည်ရပါမယ်။ ယူနီကုဒ်ဆိုရင်လည်း အဲဒီလိုပါပဲ။
နှစ်ခုထဲက တစ်ခုကိုရွေးရမယ်ဆိုတော့ အားသာချက်၊ အားနည်းချက်တွေကို သိထားရပါမယ်။
- ယူနီကုဒ်က တစ်ကမ္ဘာလုံးအသိအမှတ်ပြုထားတဲ့ စံနဲ့ကိုက်ညီပါတယ်။ ဘယ်နိုင်ငံမှာပဲသုံးသုံး ဘယ်စက်ပေါ်မှာပဲသုံးသုံး ဒီအတိုင်းပါပဲ။ ဇော်ဂျီကတော့ အဲဒီစံနဲ့ မကိုက်ညီပါဘူး။ ဆိုလိုတာကတော့ ဇော်ဂျီနဲ့ရိုက်ထားတာတွေကို မြန်မာအချင်းချင်းသာ အသိအမှတ်ပြုမယ်၊ ကမ္ဘာကတော့ အသိအမှတ်မပြုပါဘူး။ ကမ္ဘာကျော် website ကြီးတွေက မြန်မာစာကိုထောက်ပံ့ပေးတယ်ဆိုရင်လည်း ယူနီကုဒ်ပဲဖြစ်မှာပါ။ အခုဆိုရင် Android, Windows စတဲ့ OS တွေမှာ မြန်မာစာကို ထောက်ပံ့ပေးနေပါပြီ။ မြန်မာစာအတွက် တကူးတက အလုပ်ရှုပ်ဖို့ မလိုတော့ပါဘူး။ ဒါပေမယ့် ယူနီကုဒ်ပါ။
- တိုင်းရင်းသားဘာသာစကားတွေကို ယူနီကုဒ်က ထောက်ပံ့ပေးနိုင်ပါတယ်။ ကရင်၊ ရှမ်း အစရှိတဲ့ဘာသာစကား အက္ခရာတွေကို တစ်ခါတည်းထောက်ပံ့ပေးထားပါတယ်။ ဇော်ဂျီက တိုင်းရင်းသားဘာသာစကားတွေအတွက်ထားတဲ့ code point တွေ ယူသုံးထားတဲ့အတွက် တိုင်းရင်းသားဘာသာစကားတွေကို အသုံးပြုလို့မရပါဘူး။
- အမြင်အတိုင်းရိုက်တဲ့အတွက် ဇော်ဂျီမှာ စာလုံးပေါင်းအမှားအမှန် မခွဲနိုင်ပါဘူး။ များသောအားဖြင့် ဇော်ဂျီမှာ သုညလား၊ ဝလုံးလားမခွဲတော့ဘဲ ဝိုင်းဝိုင်းမြင်တာနဲ့ လုံးကြီးတင်လိုက်ကြတာပါပဲ။ ယူနီကုဒ်မှာတော့ အဲဒီလိုမဖြစ်အောင် ကာကွယ်ပေးနိုင်ပါတယ်။ ယူနီကုဒ်မှာ သုညကို လုံးကြီးတင်ချင်လို့မရပါဘူး။
- ဇော်ဂျီကို အင်တာနက်ပေါ်ပြန်ရှာတဲ့အခါ မူကွဲတွေအများကြီးနဲ့ ဒုက္ခရောက်ပါတယ်။ ဥပမာ - 'ကိုင်ဇာ' ဆိုတာကို ဇော်ဂျီသုံးပြီးရိုက်ရင် ကကြီးလုံးကြီးတင်တစ်ချောင်းငင်နဲ့ ကကြီးတစ် - တိုင်းရင်းသားဘာသာစကားတွေကို ယူနီကုဒ်က ထောက်ပံ့ပေးနိုင်ပါတယ်။ ကရင်၊ ရှမ်း အစရှိတဲ့ဘာသာစကား အက္ခရာတွေကို တစ်ခါတည်းထောက်ပံ့ပေးထားပါတယ်။ ဇော်ဂျီက တိုင်းရင်းသားဘာသာစကားတွေအတွက်ထားတဲ့ code point တွေ ယူသုံးထားတဲ့အတွက် တိုင်းရင်းသားဘာသာစကားတွေကို အသုံးပြုလို့မရပါဘူး။
- အမြင်အတိုင်းရိုက်တဲ့အတွက် ဇော်ဂျီမှာ စာလုံးပေါင်းအမှားအမှန် မခွဲနိုင်ပါဘူး။ များသောအားဖြင့် ဇော်ဂျီမှာ သုညလား၊ ဝလုံးလားမခွဲတော့ဘဲ ဝိုင်းဝိုင်းမြင်တာနဲ့ လုံးကြီးတင်လိုက်ကြတာပါပဲ။ ယူနီကုဒ်မှာတော့ အဲဒီလိုမဖြစ်အောင် ကာကွယ်ပေးနိုင်ပါတယ်။ ယူနီကုဒ်မှာ သုညကို လုံးကြီးတင်ချင်လို့မရပါဘူး။ ချောင်းငင်လုံးကြီးတင်ဆိုပြီး နှစ်မျိုးရိုက်လို့ရပါတယ်။ ဒါကြောင့် နှစ်မျိုးလုံးရိုက်ရှာမှ အဖြေအကုန်ထွက်မှာပါ။ ယူနီကုဒ်မှာတော့ တစ်မျိုးတည်းပဲ ရိုက်လို့ရပါတယ်။ တစ်ချောင်းငင်လုံးကြီးတင်ဆိုရင် အမှားပြပါလိမ့်မယ်။
- မြန်မာအက္ခရာစဉ်ဖြစ်တဲ့ ဗျည်းစဉ်၊ ဗျည်းတွဲစဉ်၊ အသတ်စဉ် စတာတွေကို ယူနီကုဒ်က ထောက်ပံ့ပေးနိုင်ပါတယ်။ (သဝေထိုးကို နောက်မှာစီလို့ရတဲ့ အကျိုးကျေးဇူးပါ။) ဇော်ဂျီမှာ မရနိုင်ပါဘူး။
- ယူနီကုဒ်ကိုသုံးသင့်တဲ့ တခြားသောအားသာချက်တွေ အများကြီးရှိနေပါသေးတယ်။
ဒီလောက်ကောင်းတဲ့ ယူနီကုဒ်ကိုမသုံးဘဲ ဘာကြောင့် ဇော်ဂျီကိုဖက်တွယ်ထားကြတာလဲဆိုတော့ ဇော်ဂျီက သုံးစွဲသူတွေနဲ့ နှစ်ပေါင်းများစွာ ရင်းနှီးကျွမ်းဝင်ပြီးဖြစ်နေလို့ပါ။ သုံးစွဲသူတွေဟာ ဇော်ဂျီသုံးရတာ အသားကျနေကြပါပြီ။ ဖုန်းတွေ၊ ကွန်ပျူတာတွေအားလုံးနီးပါးလောက်မှာ ဇော်ဂျီတွေက နေရာဝင်ယူထားကြပါပြီ။ ဒါတွေကိုပြောင်းဖို့ဆိုတာ တော်တော်ကြီးကို ကြိုးစားရပါမယ်။ တစ်ယောက်အားနဲ့လည်း မရပါဘူး။ အကုန်လုံး ဝိုင်းပြောင်းမှ ရမှာပါ။ အစိုးရကပါ ဝင်ကူမှ ဖြစ်နိုင်ပါလိမ့်မယ်။
ယူနီကုဒ်ကိုပြောင်းသုံးဖို့ တခြားသောအခက်အခဲများလည်း ရှိနေပါသေးတယ်။ စာဖတ်သူအနေနဲ့ ကွန်ပျူတာပေါ်မှာဖြစ်ဖြစ်၊ ဖုန်းပေါ်မှာဖြစ်ဖြစ် မြန်မာစာရေးတဲ့ဖတ်တဲ့အခါ ယူနီကုဒ်နဲ့ ဇော်ဂျီရယ်လို့ နှစ်မျိုးရှိတယ်၊ ဘယ်လိုကွာခြားကြတယ်၊ ဘာကိုသုံးသင့်တယ်၊ စာဖတ်သူ အခုသုံးနေတာက ဇော်ဂျီလား၊ ယူနီကုဒ်လားဆိုတာရယ်လောက်ကိုတော့ သိထားသင့်ပါတယ်။
Dr. Kyaw Zaw Naing
ကျွန်တော်ရဲ့ blog လေးမှာ zawgyi ရော unicode ရော ဖတ်လို့ရအောင် ဘယ်လိုလုပ်ရမလဲခင်ဗျ ကျွန်တော်က Unicode ကို သုံးထားတာပါ
ReplyDelete