RSS

បណ្ណសារចំណាត់ក្រុម៖ HWR

មិន​គួរ​ធ្លាក់​ខ្លួន​ ធ្លាក់​ដល់​ថ្នាក់​ណឹង

ម្សិល​មិញ ថ្ងៃ​អាទិត្យ​សោះ ដោយ​សារ​តែ​អផ្សុក​ពេក ក៏​នឹក​ឃើញ​ចង់​ធ្វើ​ការ។ ដំបូង​ឡើយ​ ខ្ញុំ​គិត​ថា ចំណាយ​ពេល​ប្រហែល​ជា ៣០​នាទី គឺ​គ្រប់​គ្រាន់​ហើយ។ ព្រោះ​អ្វីៗ មាន​អស់ហើយ គ្រាន់​តែ​ផ្គុំ​គ្នា​ប៉ុណ្ណោះ។

បើក​កុំព្យូទ័រ​ឆ្វាច់ ចាក់​ចំរឿង​ឆ្វាច់ ទៅ​អង្គុយ​ផ្អែក​សាឡុង​ធ្វើ​ការ​យ៉ាង​សប្បាយ​ចិត្ត។ ទី​បំផុត សរសេរ​រួច​ហើយ ក៏​សាក​មើល មាន​អី “segmentation fault”។ ហេសហេ តែ​ប៉ុណ្ណេះ មាន​ការ​ងារ​ធ្វើ​ហើយ​ខ្ញុំ។

ម៉ោង​ប្រហែល​ជា ៧​​ល្ងាច​ល្មម។ អង្គុយ​រក​ដល់​ម៉ោង ១២ កណ្ដាល​យប់​ហើយ​នៅ​តែ​រក​អត់​ឃើញ។ ថ្ងៃ​នេះ​រក​ទៀត នៅ​តែ​មិន​ឃើញ។

 

មិន​គួរ​សោះ មិន​គួរ​ធ្លាក់​ខ្លួន​ ធ្លាក់​ដល់​ថ្នាក់​ណឹង​ទេ។ ពេល​នេះ មាន​តែ​ឈប់​រក​ហើយ។ ចាំ​មិត្តភក្តិ​ទំនេរ ចាំ​ពឹង​គេ​អោយ​ជួយ​មើល​ប្រសើរ​ជាង។ ព្រោះ​នេះ​ជា​តំណោះ​ស្រាយ​មួយ​ដែរ ព្រោះ​ពេល​ខ្លះ យើង​ស្មុគ្រ​ពេក ក៏​រក​មិន​ឃើញ​ដែរ។

(http://www.cartoonstock.com/directory/s/system_error.asp)

 

ទី​បំផុត​ចេញ​រូប​រាង​មក​ខ្លះៗ​ហើយ

ខាង​ក្រោម​នេះ ជា​រូប​ភាព​របស់​កម្ម​វិធី​​របស់​ខ្ញុំ​មួយ​ តែ​មិន​មាន​លក្ខណៈ​ផ្លូវ​ការ សម្រាប់​លក់​ដូរ​អី​ទេ តែ​គ្រាន់​តែ​ប្រើ​សម្រាប់​ជា​ការ​បង្ហាញ​ក្នុង​កម្មវត្ថុ​នៃ​ការ​រៀន​សូត្រ​របស់​ខ្ញុំ​តែ​ប៉ុណ្ណោះ។ ផ្ទាំង​ក្រហ្វិច​​នេះគឺ​ប្រើ​ប្រាស់​ភាសា Python ដែល​ធ្វើ​ដោយ​សិស្ស​កម្ម​សិក្សា​ម្នាក់ ហើយ​ចំណែក​ឯ​របស់​ដំណើរ​ការ​ខាង​ក្រោយ​ទាំង​អស់ គឺ​ធ្វើ​ដោយ​ខ្ញុំ​​ដោយ​ប្រើ​ប្រាស់ ភាសា C++ និង​បណ្ណាល័យ​ដែល​មាន​ស្រាប់​​មួយ​ចំនួន​ជា​ជំនួយ​ដូចជា OpenCV, LibSVM, និង LibLinear។

កម្ម​វិធី​នេះ អ្នក​អាច​សរសេរ​ពាក្យ​មួយ​​ដោយ​ដៃ ដែល​ពេល​នេះ​ប្រើ​បាន​តែ​ពាក្យ​ដែល​​ប្រើ​ប្រាស់​អក្សរ​ឡាតាំង និង​មាន​នៅ​ក្នុង​វចនានុក្រម​ដែល​ខ្ញុំ​បាន​កំណត់​ប៉ុណ្ណោះ ហើយ​ពាក្យ​នោះ​នឹង​ត្រូវ​ស្គាល់​ថា​ជា​ពាក្យ​អ្វី​ជា​អក្សរ​កុំព្យូទ័រ (Text) ដែល​មាន​ន័យ​ថា​កុំព្យូទ័រ​អាច​ស្គាល់​ពាក្យ​ដែល​អ្នក​សរសេរ​នោះ ដែល​នេះ​គេ​ហៅ​ថា Handwriting Recognition។ ជា​ការ​ពិត​ណាស់ បើ​ប្រៀប​ធៀប​ជាមួយ​មីក្រូសូហ្វ ឫ​ក៏​ក្រុម​ហ៊ុន​ដែល​មាន​បទ​ពិសោធ​ច្រើន​ឆ្នាំ (អាច​ថា​ជាង​ដប់​ឆ្នាំ​ឡើង​លើ) គឺ​មិន​បាន​មួយ​ចំណិត​នឹង​គេ​ផង។ តែ​មិន​ជា​អ្វី​ទេ ព្រោះ​ខ្ញុំ​នៅ​ក្មេង​ខ្ចី​ណាស់ ក្នុង​ការងារ​នេះ។ បើ​ប្រៀប​ធៀប​នឹង​គ្រូៗ ដែល​ខ្ញុំ​បាន​ស្គាល់ នឹង​ជា​អ្នក​មាន​បទ​ពិសោធ​ច្រើន គឺ​គាត់​មាន​បទ​ពិសោធ​លើ​ការងារ​នេះ​ស្មើ​នឹង​អាយុ​របស់​ខ្ញុំ​ទៅ​​ហើយ។

 
7 Comments

Posted by ​នៅ ខែ​ឧសភា 30, 2011 in ព័ត៌មានវិទ្យា, HWR

 

Optical Character Recognition

Optical Character Recognition(OCR) គួរតែប្រែជាភាសារខ្មែរយើងថាយ៉ាងម៉េច? ខ្ញុំសូមបកប្រែក្រៅផ្លូវការសំរាប់ប្រើដោយខ្លួនឯងថា ប្រព័ន្ធអានរូបភាពអក្សរ។

ប្រព័ន្ធអានរូបភាពអក្សរ គឺជាប្រព័ន្ធមួយដែលអាចមានសម្ថភាពបំលែងអក្សរដែលជារូបភាព អោយទៅជាអក្សរកុំព្យូទ័រ (ASCII ឫ Unicode)។ ធម្មតាកុំព្យូទ័រមិនយល់នូវអក្សរទាំងនោះទេ ដោយគ្រាន់តែចាត់ទុកថា រូបភាពទាំងអស់ គឺគ្រាន់ជាតារាងនៃ Pixels ដូចជារូបភាពធម្មតាតែប៉ុណ្ណោះ។ ប្រព័ន្ធអានរូបភាពនេះ ត្រូវបានគេយកទៅប្រើប្រាស់យ៉ាងច្រើន។ ឧទាហរណ៏ កាលពីមិនទាន់មានប្រព័ន្ធអានរូបភាពអក្សរ ដើម្បីចំលងឯកសារលើក្រដាស់ ចូលកុំព្យូទ័រជាអក្សរកុំព្យូទ័រ យើងត្រូវចំណាយពេលវេលា ដើម្បីវាយបញ្ចូលដោយដៃ។ ក្រោយមក ដោយប្រើប្រាស់ ប្រព័ន្ធអានរូបភាពអក្សរ យើងអាចបំលែងឯកសារដែលគេចំលងចូលកុំព្យូទ័រជារូបភាព (Scan) អោយទៅជាឯកសារកុំព្យូទ័រ បាយដោយងាយ មិនចំណាយពេលយូ និង មានតំលៃថោកជាងការដែលបញ្ចូលដោយដៃ។

តាមពិត OCR ឫ ប្រព័ន្ធអានរូបភាពអក្សរនេះ ត្រូវបានគេចាប់ផ្តើមស្រាវជ្រាវតាំងពីឆ្នាំ ១៩២៩ មកម្លេះ។ នៅឆ្នាំ ១៩៤៩ ក្រុមស្រាវជ្រាវរបស់ RCA បានបង្កើតប្រព័ន្ធអានអក្សរមួយសំរាប់ជាជំនួយដល់មនុស្សងងឹត។ ប៉ុន្តែពូកគេ មិនត្រឹមតែបំលែងរូបភាពអក្សរ អោយទៅជាអក្សរកុំព្យូទ័រទេ គឺគេថែមទាំងបំលែងអោយទៅជាសំលេងទៀត ដែលជាហេតុធ្វើអោយ វាមានតំលៃថ្លៃហួសហេតុពេក​ ទើបមិនត្រូវបានដាក់អោយប្រើប្រាស់។ សូមបញ្ជាក់ដែរថា សព្វថ្ងៃនេះ ប្រព័ន្ធបែបនេះគឺមានហើយ ថែមទាំង តំណើរការបានយ៉ាងល្អទៀតផង។

នៅឆ្នាំ ១៩៥០ លោក David H. Shepard អ្នកវិភាពអាថកំបាំង(cryptanalyst) អោយ Armed Forces Security Agency នៅសហរដ្ឋអាមេរិច បានបង្កើតម៉ាស៊ីនមួយសំរាប់បំលែងសំបុត្រអោយទៅជាអក្សរកុំព្យូទ័រ។ ក្រោយមកគាត់ក៏បានបង្កើត Intelligent Machines Research Corporation (IMR) ដែលជាប្រព័ន្ធអានរូបអក្សរដែលបានធ្វើអាជីវកម្មតំបូងគេ ដែលបានប្រើប្រាស់ដោយក្រុមហ៊ុនធំៗជាច្រើនដូចជា Reader’s Digest ក្រុមហ៊ុន Standard Oil ដើម្បីអានកាតធានាគា និងក្រុមហ៊ុន IBM ជាដើម។
រហូតមកដល់បច្ចុប្បន្ននេះ ប្រព័ន្ធអានរូបភាពអក្សរពុម្ព ត្រូវបានចាត់ទុកថាជាប្រព័ន្ធដែលអាមានសម្ថតភាពគ្រប់គ្រាន់ ក្នុងការបំលែងរូបភាពអក្សរពុម្ពអោយទៅជាអក្សរកុំព្យូទ័រដែលមានកំហុសតិចតួចបំផុត។ ក្រៅពីនេះ គេក៏បានបង្កើតប្រព័ន្ធអានអក្សររូបភាពឆ្លាតវៃ (Intelligence Character Recognition – ICR ) ដែលមានសមត្ថភាពអានរូបភាពអក្សរដែលមានទំរង់ខុសគ្នា និងអក្សរដែលសរសេរដោយដៃផងដែរ។

ក្រោយមកទៀត គេក៏ចាប់ផ្តើមបង្កើតប្រព័ន្ធដែលអាចមានសមត្ថភាព អានពាក្យដែលសរសេរដោយដៃ (Handwriting Word Recognition-HWR) or (Intelligence Word Recognition) ដែលជាបញ្ហាមួយដែលលំបាកជាងគេប្រព័ន្ធអានរូបភាពអក្សរ។ ប៉ុន្តែមួយរយៈចុងក្រោយនេះ Microsoft បានអះអាងថា ពួកគេបានបង្កើតប្រព័ន្ធអានអក្សរសរសេរដោយដៃបានដោយជោគជ័យរូចទៅហើយ។ ទោះបីជាយ៉ាងណាក៏ដោយ គេនៅតែមានការស្រាវជ្រាវជាច្រើនទាក់ទងនឹងការបង្កើតប្រព័ន្ធ អានពាក្យដែលសរសេរដោយដៃ។

សព្វថ្ងៃនេះ ខ្ញុំឃើញមានតែភាសារធំៗមួយចំនួនប៉ុណ្ណោះ ដែលត្រូវបានស្រាវជ្រាវនិងបង្កើតប្រព័ន្ធអានរូបភាពអក្សរនេះ។ ភាសារទាំងនោះមានដូចជា ភាសារដែលប្រើអក្សរឡាតាំង ដូចជា បារាំង អង់គ្លេស អេស្ប៉ាញ … ភាសារអារ៉ាប់ ភាសារចិន ភាសារជប៉ុន ភាសារកូរ៉េ(អត់ដឹងព្រោះខ្ញុំមិនដែលបានជួបអ្នកធ្វើការលើភាសារកូរ៉េនៅឡើយទេ) ភាសារហ៊ីនឌី។​ ក្រៅពីនោះ ភាសារ វៀតណាម ម៉ាឡេស៊ី ដែលជាភាសារប្រើប្រាស់អក្សរឡាតាំងដែលនោះ ក៏កំពុងតែមានការស្រាវជ្រាវផងដែរ។ សំរាប់ភាសារ ថៃ ឡាវ ខ្ញុំក៏មិនធ្លាប់បានដឹងដែរ។ ខ្ញុំធ្លាប់ទៅចូលរូម សន្និសិទខ្លះដែរតែមិនដែលឃើញមានគេនិយាយពីអក្សរ ថៃ និងឡាវនៅឡើយ សូម្បីតែអក្សរវៀតណាម ក៏នៅដែរ។

ដោយឡែក សំរាប់ភាសារខ្មែរ ប្រហែលជាធ្លាប់មានអ្នកធ្វើការស្រាវជ្រាវដែរ តែខ្ញុំក៏មិនបានដឹងថាតើគេធ្វើអ្វីខ្លះនោះទេ!

 
7 Comments

Posted by ​នៅ ខែ​កុម្ភៈ 15, 2011 in ព័ត៌មានវិទ្យា, HWR

 

Hello Indian

I just got this message

Dear Author,
We are pleased to inform you that the following paperyou have submitted to ICFHR 2010
has been accepted for presentation in the International Conference on Frontiers in Handwriting Recognition (ICFHR), 2010. The mode (Oral or Poster) of presentation will soon be communicated to you. …..

In conclusion, I will go to Indian this November for an International Conference on Frontiers in Handwriting Recognition 2010 because my paper that I have submited for this conference is accepted,   just after another conference at Turkey which I used to post in this article. I’m very happy to have a chance to go to Indian, the country which has a deep relation of culture with Cambodia. Yet, I don’t know how many peoples of my Lab will go to joint this conference. I don’t want to go alone :D .

Since now, another important daily task is watching films :D . It is what my teacher told me, just to improve my english skill, especially for speaking skill. They wonder that I could not speak english. Yes, I know about that, both French, English not only speaking, even writing, reading, … I’m very poor :( .

 
11 Comments

Posted by ​នៅ ខែ​ឧសភា 31, 2010 in ព័ត៌មានវិទ្យា, HWR

 

ត្រៀមខ្លួនទៅលេងអ៊ីស្តង់ប៊ុល

ខ្ញុំបានកក់អូតែលរួចហើយសំរាប់ការដើទៅលេងខែក្តៅ ការទៅចូលរួម International Conference (ICPR 2010) ដោយសារតែ Paper របស់ខ្ញុំដែលបានដាក់នោះ គឺគេយល់ព្រមទទូលអោយចុលរួមហើយ។ តែពេលនេះខ្ញុំមិនទាន់ដឹងថាតើនឹងត្រូវទៅធ្វើបទបង្ហាញរឺគ្រាន់តែជា Poster នោះទេ។ តែអ្វីដែលសំខាន់នោះ គឺនឹងបានទៅដល់ទឹកដីនៃប្រទេស ទួរគី នៅទីក្រូង អ៊ីស្តង់ប៊ុលចំនូន៥ ទៅ ៦ ថ្ងៃដែរ។ ដំបូងឡើយខ្ញុំគិថាប្រទេសនេះ ជាប្រទេសក្រីក្រទេ តែតាមពិតគឺខ្ញុំច្រលំធំហើយ ហេហេហេ។ ខ្ញុំភ្ញាក់ខ្លួននៅពេលដែលកក់អូតែលទេតើតាមពិតទៅ។ អូតែលខ្ញុំកក់នោះឈ្មោះ Midtown ផ្កាយបួន។ ហើយតំ ដែលខ្ញុំកក់នោះ ថោកជាងគេហើយ គឺប្រហែល 110 អឺរ៉ូមួយយប់។ កត្តាមួយទៀត ទីក្រូងនេះគឺធំ នឹងពោរពេញទៅដោយកន្លែងទេសចរណ៏ច្រើនផង។

La Mosquée bleue. http://fr.wikipedia.org/wiki/Istanbul

 
 
តាមដាន

Get every new post delivered to your Inbox.

Join 41 other followers