ศึกษาและพัฒนา Hand - Written OCR
การศึกษารวบรวมข้อมูลที่เกี่ยวข้องกับการทำ OCR (Optical Character Recognition) และรวบรวมตัวอย่างลายมือจากแหล่งต่างๆ เพื่อนำมาศึกษาสภาพปัญหา พบปัญหาที่สำคัญ ได้แก่ ปัญหาในการตัดตัวอักษร รูปแบบของตัวอักษรที่คล้ายกันมาก เช่น ด-ค-ต , ก-ถ-ภ , ผ-ฝ-พ-ฟ การเขียน ผิดรูปซึ่งมีผลให้ตัวอักษรที่ต่างกันมีลักษณะคล้ายกัน เช่น ย-ผ , ร-ช , พ-ม และความหลากหลายของ ลายมือ ดังนั้นการจะจดจำลักษณะตัวอักษรแต่ละตัวได้ ควรจะเน้นที่การจดจำลักษณะร่วมหรือลักษณะเด่น ของตัวอักษรนั้น จากลายมือที่ต่างกัน โดยการพิจารณาว่าตัวอักษร คือ กราฟที่ประกอบด้วยจุดยอดและขอบที่ลากเชื่อมจุด แล้วแทนอักษรแต่ละตัวด้วยจุด แต่เกิดปัญหาว่าไม่สามารถระบุได้ชัดเจน ว่า ลักษณะของจุดนั้นจะใช้แทนตัวอักษรตัวใด จึงเพิ่มแฟกเตอร์บางอย่างเข้าไป คือ เพิ่มจำนวนจุดในบริเวณ จุดตัด จุดปลายและจุดสุดขอบด้านต่าง ๆ กำหนดลำดับของจุด อักษรที่คล้ายกันมากและใช้ลักษณะเด่น ของตัวนั้นแทนจุดในบางตำแหน่ง ทำให้ความชัดเจนมากขึ้นและจะได้พิจารณาวิธีการอื่น ๆ เช่น การใช้อัตราส่วนของระยะระหว่างจุด การพิจารณาจุดเริ่มต้นและจุดสุดท้ายของตัวอักษรในการแบ่งกลุ่มตัวอักษรให้เหลือตัวที่พิจารณาน้อยลง แต่เนื่องจากตัวอักษรภาษาไทยมีความซับซ้อนและมีรายละเอียดค่อนข้างมาก จึงมุ่งเน้นให้สามารถรู้จำตัวเลข 0-9 ให้ได้ก่อน เพื่อนำไปใช้ในการคัดแยกจดหมาย เนื่องจากรูปแบบลายมือที่พบบ่อยในการเขียนตัวเลขมีไม่มากนัก เมื่อแทนตัวเลขด้วยจุดที่มีการกำหนดลำดับ พิจารณาจุดเริ่มต้นและจุดสุดท้ายของตัวเลขแล้ว ก็สามารถแยกความแยกต่างของตัวเลขแต่ละตัวได้ค่อนข้างมาก นอกจากนี้จะใช้วิธีต่าง ๆ มาประกอบเพื่อเพิ่มความถูกต้อง ได้แก่ การพิจารณาตำแหน่งของจุดโดยให้ความสำคัญกับทิศทางมากกว่าระยะทาง โดยกำหนดทิศทางเพียง 8 ทิศ ถ้ามีทิศต่างไปจากทิศที่กำหนด จะหาว่ามีทิศใกล้เคียงกับทิศใดที่มกที่สุดและกำหนดให้เป็นทิศนั้น พิจารณาจากจำนวนจุดที่ใกล้เคียงกัน และพิจารณาจากลักษณะเด่ของตัวเลข ก็จะเพิ่มความถูกต้องได้ในระดับหนึ่ง สำหรับปัญหาในการอ่านตัวเลขซึ่งอาจพบได้ เช่น การเขียนตัวเลขสองตัวติดกัน หรือการเขียนตัวเลขตัวเดียวแต่เส้นไม่ต่อเนื่องอาจทำให้เกิดความสับสนได้ และปัญหาที่สำคัญอีกประการหนึ่งคือ การเขียนผิดรูปซึ่งทำให้ยากแก่การจำแนกว่าตัวเลขตัวใด ซึ่งยังจะต้องศึกษาและพัฒนาต่อไป
-
4892 ศึกษาและพัฒนา Hand - Written OCR /project-all/item/4892-hand-written-ocrเพิ่มในรายการโปรด