Here is the source git.
https://github.com/NChanko/Myanmar-Ebook-OCR
အရင်ဆုံး brew ကို install လုပ်ရပါ့မယ်။
Terminal မှာ ဒီ command ကို paste လုပ်ပြီး enter ခေါက်ပါ။
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
Brew ကို install ပြီးသွားရင်
brew install poppler
နဲ့
brew install tesseract
ကို ထပ်ပြီး install ပေးပါ။
Tesseract OCR မှာ မြန်မာစာ အတွက် မပါသေးတော့ မြန်မာစာအတွက် ထပ်ပြီး install ပေးရပါမယ်။
brew install tesseract-lang
အဲ့တာပြီးရင်တော့ input_pdf folder ထဲမှာ ပြောင်းချင်တဲ့ pdf file ကိုထည့်ပြီး
pdf_to_text.sh ကို run လိုက်ရင် ရပါပြီ။
မြန်မာစာ OCR အတွက် fine tuned လုပ်ထားတဲ့ trained data အတွက် ဒီဟာလေးလည်း တွေ့လို့ ထပ်ဖြည့်ထားလိုက်တယ်။ ဒီကောင်ကို
/usr/local/Cellar ထဲက tesseract folder ထဲက language ထဲမှာ override လုပ်ပေးလိုက်ရင်ရပါပြီ။ မူရင်းဖိုင်ကိုတော့ override မလုပ်ခင် backup လုပ်ထားစေချင်တယ်။
ios သမားတွေကတော့အရင်ဆုံး App Store ထဲဝင်ပြီး search ကနေ pyaung လို့ရိုက်ရှာပါ။ ပြီးရင် Download လုပ်ပါ။ ရှာ မတွေ့ရင် ဒီ link ကနေ download လုပ်လို့လည်း ရပါတယ်။ https://apps.apple.com/us/app/pyaung/id1039690192 home screen မှာ pyaung app ပေါ်လာရင် ဝင်လိုက်ပါ။Contact ဆိုတဲ့ tap ထဲဝင်ပါ။ zawgyi to uni , uni to zawgyi ကို စိတ်ကြိုက်ပြောင်းနိုင်ပါပြီ။ Android သမားတွေကတော့ ကိုနေရှိန်ဦး လုပ်ပေးထားတဲ့ app ကို အောက်က link ကနေ Download လုပ်ပြီး zawgyi to uni , uni to zawgyi ကို စိတ်ကြိုက်ပြောင်းနိုင်ပါတယ်။ https://play.google.com/store/apps/details?id=com.nso.unicc https://m.apkpure.com/unicontact-converter/com.nso.unicc နောက်တခုက Dev House က ထုတ်တဲ့ MM contact converter ပါ။ သူကတော့ Android သီးသန့်ပါပဲ။ Contacts တွေမှာ zawgyi နဲ့ unicode ရောနေရင်တောင် အဆင်ပြေပါတယ်။ ပြောင်းနေရင်း ဟန်းသွားတာမျိုးမဖြစ်ပါဘူး။ (Main thread မှာအလုပ်လုပ်မလုပ်ပဲ thread ခွဲပြီးပြောင်းလို့ပါ) https://play.google.com/store/apps/details?id=me.myatminsoe.mmcontactsconverter
Comments
Post a Comment