วันนี้แนะนำ Document OCR Software เอาไว้ใช้สำหรับทำการแปลงไฟล์รูปภาพที่มีตัวอักษรเป็นส่วนประกอบหลัก ให้เป็นไฟล์ตัวอักษร ซึ่งจะช่วยให้เราไม่ต้องมานั่งพิมพ์ให้เสียเวลา เพียงแค่เราเลือกไฟล์รูปภาพเข้าไปโปรแกรมก็จะแปลงออกมาเป็นตัวอักษรให้เราคัดลอกไปใส่โปรแกรม notepad หรือ MS-word ให้เราได้ในทันที ลอง download free doucment ocr ไปใช้งานกันได้เลย

โดยไฟล์รูปภาพที่ดีควรจะเป็นรูปถ่ายของเอกสาร หรือจากเครื่องสแกน ที่มีความแตกต่างของพื้นหลัง กับตัวอักษรกันอย่างชัดเจน เพราะจะส่งผลต่อความแม่นยำในการถอดรหัสของตัวโปรแกรม ลองศึกษาบทความ Digital Image เพื่อทำความเข้าใจในการแปลงจากไฟล์รูปภาพที่เป็นอนาล็อกมาเป็นค่าทางดิจิตอล OCR ยังสามารถใช้เป็นเครื่องมือในการตรวจสอบความถูกต้องแบบอัตโนมัติได้อีกด้วย โดยการนำค่าที่อ่านได้เทียบกับค่าต้นแบบที่ถูกบันทึกเก็บไว้ก่อนหน้านั้น อาทิเช่น การตรวจสอบความถูกต้องของตัวอุปกรณ์อิเล็กทรอนิกส์โดยเปรียบเทียบจากค่าตัวเลขที่ติดอยู่บนอุปกรณ์ โดยการถ่ายภาพ แล้วนำภาพที่ได้ไปเปรียบเทียบกับภาพต้นแบบ ถ้าค่าที่ได้ออกมาเท่ากันหรือใกล้เคียงกันจะถือว่าถูกต้อง ซึ่งการตรวจสอบนี้จะต้องกระทำอยู่ในขอบเขตที่เหมาะสม เรียกกันโดยทั่วไปว่า ROI (Region of interest)  ซึ่งก็คือขอบที่บ่งบอกถึงขอบเขตการประมวลผล ไม่ให้มีพื้นที่กว้างมากจนเกินไป จนอาจจะเกิด Overflow ขึ้นมาได้ เอาพอประมาณ ไม่ต้องคิดมา donwload ไปติดตั้ง แล้วเลือกไฟล์รูปภาพ จากนั้นแปลงเลย ง่ายดี ยังมี Japanese OCR Online ให้ลองใช้งานดูเพิ่มเติมอีกด้วย

ทีนี้เราลองมาดูตัวอย่างกันว่าเครื่องคอมพิวเตอร์จะรู้ได้อย่างไรว่าอันไหนเป็นตัวอักษรอะไร เราก็ลองไปทำการสร้างไฟล์รูปภาพที่เป็นตัวอักษรแบบเดียวกัน ที่มีขนาดรูปภาพเท่ากัน บันทึกเป็นรูปภาพแบบ Gray Scale จากนั้นลองเปิดดูข้อมูลรูปภาพเฉพาะ ก็จะเห็นตัวเลขที่ไม่ซ้ำใครของแต่ละตัวอักษรออกมา

อย่างชื่อเว็บไซท์ erakii ตัวเลขเฉพาะของตัว e ในที่นี้คือ 4 ทุกครั้งที่โปรแกรมอ่านค่ารูปภาพที่อยู่ในกรอบ ROI ได้ 4 ก็จะตีความหมายว่าเป็นตัวอักษรอี แล้วนำค่าที่ได้ไปกำหนดใน Charset ปัจจุบันรูปแบบที่นิยมใช้ก็คือ UTF-8 ค่า Code ที่ได้ของตัว E ก็คือ 45 เราจึงได้เป็นตัวอักษร E ออกมาแบบไม่ต้องพิมพ์

Image Unique Number UTF-8 Code
E 4 45
R 165 52
A 215 41
K 176 4b
I 2 49
I 2 49

ระบบ OCR จึงจัดว่าเป็น Algorithm หนึ่งที่ใช้ในกระบวนการ AOI ซึ่งย่อมาจาก Automated Optical Inspection อันนี้อย่าจำสับสนกับดารา AV ของญีปุ่นนะครับ เดี๋ยวเลือกกันไม่ถูกว่าจะศึกษาอันไหนก่อนหลังกันพอดี กล้อง AOI อาจจะต้องเปลี่ยนระยะซูมกันใหม่ สงสัยจะไม่พอ