Friday, August 27, 2021

Python OCR

OCR adalah singkatan dari Optical Character Recognition, konversi dari gambar menjadi tulisan. Teknik ini salah satunya digunakan untuk melakukan pengenalan nomor plat pada kendaraan bermotor

Kita akan mencoba program sederhana untuk mengenali tulisan dari gambar.

Gambar yang akan kita gunakan adalah sebagai berikut :


List program sederhana nya adalah berikut:


Hasil eksekusi program tersebut adalah sebagai berikut :


Penjelasan dari list program diatas adalah sebagai berikut:

[ line 8] import cv2
[ line 9] import pytesseract

Pertama tama yang di perlukan sebelum melakukan running adalah menginstall modul Opencv dan modul pytesseract

>>> conda install -c conda-forge opencv

        untuk menginstall module opencv

>>> conda install -c conda-forge pytesseract

        untuk menginstall module pytesseract OCR

Sebelumnya, aplikasi tesseract di download dulu untuk kemudian di install

Source untuk download tesseract : 

https://github.com/UB-Mannheim/tesseract/wiki


[ line 14] img_1 = cv2.imread(input_img)

Module Opencv[cv2] akan membaca gambar dalam format BGR dan di simpan di variabel img_1

Module tesseract akan membaca gambar dalam format RGB, sehingga variabel img_1 harus dirubah dulu kedalam format RGB dan di simpan di variabel img_2

Berikut perbandingan isi variabel img_1 dan img_2 :


Tampak bahwa : 

[ line 17] img_2 = cv2.cvtColor(img_1, cv2.COLOR_BGR2RGB) 

>>> hanya membalik urutan pixel dari BGR --> RGB

Setelah tadi tesseract di download, di install dan di import , sekarang kita harus memberitahu kepada python, PATH untuk menjalankan tesseract tersebut.

[ line 20] pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract'

Selanjutnya konversi gambar dilakukan dengan perintah :

[line 23] text= pytesseract.image_to_string(img_2)

Hasil pembacaan dan konversi gambar berupa "string" yang di simpan dalam variabel text 




Python Module

Python module adalah kumpulan fungsi-fungsi yang ada dalam standard library python. Module harus di panggil terlebih dahulu supaya fungsi fungsi yang ada di dalam nya bisa dipergunakan.

Karena begitu banyaknya module, tantangan nya adalah pemilihan module yang tepat sehingga beban memori dan kecepatan eksekusi program bisa optimal.

Beberapa module yang sering dipanggil untuk keperluan pemrograman python:

1.Numpy : operasi numerik dasar dan operasi matrik

2. Scipy :  scientific library

3.Matplotlib : visualisasi data

4. Pandas : manipulasi struktur data, input output file xls

5. Statsmodel :  fungsi statistik tingkat lanjut

6. sklearn : untuk Machine Learning

7. cv2 : untuk keperluan pemrosesan Computer vision (Opencv)

Cara pemanggilan module-module tersebut adalah sebagai berikut  :

1. import <nama module>   

    >>>import math 

    >>> a= math.sqrt(81) 

2. import <nama module> as <nama variabel>

   >>> import numpy as np

  >>> a=np.array([1,2])

3. from < nama module> import <nama fungsi>

    >>> from math import sqrt

   >>> a= sqrt(81)

Perhatikan nomor 1 dan 3 , yang membedakan adalah pemakaian "." untuk pemanggilan fungsi.

Sebelum module di panggil, terlebih dahulu module tersebut harus di install di environment yang di pergunakan.

Cara penginstallan module sebagai berikut:

1. Dari pycharm masuk ke terminal , perintah penginstallan sebagai berikut:

   pip install < nama module>,  selanjutnya tekan enter

   misal : pip install numpy

               pip install matplotlib

2. Dari Anaconda Navigator ada dua pilihan :

    a. Install melalui environment       

Pilih environment

scroll down bagian installed



Search module yang kita pilih selanjutnya klik "apply" di pojok kanan bawah

    b. Install dengan perintah:  conda install <nama module>

       Terlebih dahulu masuk kedalam prompt Anaconda, kemudian ketik perintah 

       dengan conda     


       >>> conda install -c conda-forge opencv

              untuk menginstall module opencv

      >>> conda install -c conda-forge pytesseract

              untuk menginstall module pytesseract OCR


Thursday, August 26, 2021

Bekerja Dengan DataBase

 Untuk keperluan bekerja dengan data dalam jumlah besar, di perlukan database untuk menyimpan data mentah maupun data hasil proses pengolahan python.

Berikut beberapa database yang bisa digunakan:

1. Sqlite (relational DBMS)

   module : Sqlite

   dB browser :  https://sqlitebrowser.org/dl/   



2. MySQL (relational DBMS)

   module : Mysql-connector

   dB browser : https://www.heidisql.com/download.php   

3. Mongodb (non-relational DBMS)

  module : PyMongo

  dB browser: https://www.mongodb.com/try/download/community

  support : https://robomongo.org/download



  

Tuesday, August 24, 2021

Python Editor

File python ber-extensi py, dapat di edit dan dibuat dengan editor text biasa kemudian di Save as ber extensi ".py"

Beberapa editor yang biasa di gunakan :

1. Notepad



2. Notepad++

    https://notepad-plus-plus.org/downloads/


3. Pycharm

   https://www.jetbrains.com/pycharm/download


4. Spyder

   https://www.anaconda.com/products/individual


5. Visual Studio Code

   https://code.visualstudio.com/download




Install Python

 Installer python bisa di download di : https://www.python.org/downloads/



Pilih versi yang akan di download 32 bit atau 64 bit

Pilih versi yang akan di download, untuk windows saat ini adalah versi 3.9.6


Setelah download complete, jalankan installernya, 

Apabila sudah pernah menginstall versi sebelumnya, dialog boxnya terbuka dengan 3 pilihan : Modify, Repair, Uninstall

Apabila belum pernah menginstall, dialog box terbuka dengan 2 pilihan 


Apabila yang dipilih adalah Install Now, Python akan di install hingga selesai


Apabila yang di pilih adalah Customize installation, maka step dialog box nya sebagai berikut:


Pilih lokasi folder dan klik Install dan Python akan di install sampai selesai.

File python nya akan terinstall pada folder yang kita pilih. Pada contoh ini kita buat pada folder Python39

Isi folder tersebut sebagai berikut :

Jalankan python nya untuk membuka window python interpreter


Di belakang tanda ">>>" bisa dituliskan instruksi-instruksi untuk dikerjakan oleh python , kemudian di ikuti tombol enter, seperti contoh berikut:


Untuk selanjutnya bisa di coba help( ) untuk mendapatkan dokumentasi selanjutnya : https://docs.python.org/3.9/tutorial/


Setelah proses Install selesai, IDLE python terinstall di windows program. IDLE adalah text editor bawaan python. IDLE singkatan dari Integrated development and Learning Environment


window IDLE terbuka sebagai berikut:



untuk keluar dari IDLE gunakan perintah quit()