Friday, August 27, 2021

Python OCR

OCR adalah singkatan dari Optical Character Recognition, konversi dari gambar menjadi tulisan. Teknik ini salah satunya digunakan untuk melakukan pengenalan nomor plat pada kendaraan bermotor

Kita akan mencoba program sederhana untuk mengenali tulisan dari gambar.

Gambar yang akan kita gunakan adalah sebagai berikut :


List program sederhana nya adalah berikut:


Hasil eksekusi program tersebut adalah sebagai berikut :


Penjelasan dari list program diatas adalah sebagai berikut:

[ line 8] import cv2
[ line 9] import pytesseract

Pertama tama yang di perlukan sebelum melakukan running adalah menginstall modul Opencv dan modul pytesseract

>>> conda install -c conda-forge opencv

        untuk menginstall module opencv

>>> conda install -c conda-forge pytesseract

        untuk menginstall module pytesseract OCR

Sebelumnya, aplikasi tesseract di download dulu untuk kemudian di install

Source untuk download tesseract : 

https://github.com/UB-Mannheim/tesseract/wiki


[ line 14] img_1 = cv2.imread(input_img)

Module Opencv[cv2] akan membaca gambar dalam format BGR dan di simpan di variabel img_1

Module tesseract akan membaca gambar dalam format RGB, sehingga variabel img_1 harus dirubah dulu kedalam format RGB dan di simpan di variabel img_2

Berikut perbandingan isi variabel img_1 dan img_2 :


Tampak bahwa : 

[ line 17] img_2 = cv2.cvtColor(img_1, cv2.COLOR_BGR2RGB) 

>>> hanya membalik urutan pixel dari BGR --> RGB

Setelah tadi tesseract di download, di install dan di import , sekarang kita harus memberitahu kepada python, PATH untuk menjalankan tesseract tersebut.

[ line 20] pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'

Selanjutnya konversi gambar dilakukan dengan perintah :

[line 23] text= pytesseract.image_to_string(img_2)

Hasil pembacaan dan konversi gambar berupa "string" yang di simpan dalam variabel text 




No comments:

Post a Comment