OCR! Apakah itu?


OCR (Optical Character Recognition) merupakan sebuah teknologi yang dapat membaca dan mengenali teks dari suatu gambar. Gambar yang dimaksud biasanya berupa hasil scan yang mengandung teks, tentunya teks di dalamnya tidak bisa di olah atau di edit karena masih berupa format gambar. Dengan OCR, teks dalam gambar tersebut dapat di ubah menjadi teks yang bisa di olah kembali.
So, OCR sangat berguna ketika “kita” malas mengetik suatu naskah. Tapi ini sangat tidak dianjurkan untuk menyelesaikan paper atau tugas-tugas sekolah. Pada dasarnya mengetik ulang suatu naskah adalah juga proses belajar,  bahkan lebih efektif daripada sekedar membaca suatu naskah! Berikut ini artikel tentang penggunaan OCR, saya kutip langsung dari (sekalian, melalui tulisan ini saya minta izin kepada yang punya Blog [Mas/Om  Adnan Hidayat Prihastomo] untuk memuatnya di sini)  http://komputok.blogspot.com/2010/05/malas-mengetik-pakai-ocr-saja.html.
Dengan OCR, pekerjaan mengetik dokumen dapat benar-benar dimudahkan. Cukup scan dokumen yang tadinya mau di ketik lalu buka hasil scan dengan software OCR. Dan teks di dalamnya langsung dapat digunakan, entah untuk di edit atau di olah kembali tanpa harus mengetik dari awal sampai akhir.
Salah satu software OCR yang lumayan bagus adalah Simple OCR.  Meskipun keakuratan pengenalan karakternya bukan yang terbaik, namun fasilitas editing yang disediakan olehnya sangat membantu untuk mengoreksi kata-kata yang salah secara manual.
Selain itu, Simple OCR juga dilengkapi dengan kamus kata, dia akan menebak kata yang agak sulit di baca dengan kata yang paling mendekati di kamusnya. Namun, hanya efektif untuk tulisan yang berbahasa inggris, karena isi kamusnya masih berbahasa inggris.
Berikut ini, langkah demi langkah cara menggunakan Simple OCR
  1. Download software Simple OCR di http://www.simpleocr.com/Download.asp dengan ukuran sekitar 9 MB, lalu instal seperti biasa. Download Simple OCR
  2. Setelah selesai di instal, jalankan simple OCR. Akan muncul pilihan, apakah mau Machine Print, yaitu hasil ketikan komputer atau hand writing, yakni tulisan tangan. Hand writing apabila ingin mengubah tulisan tangan menjadi teks di komputer, namun penggunaannya dibatasi 14 hari saja, selebihnya bayar. Karena yang akan kita gunakan kali ini adalah teks hasil ketikan komputer, maka klik Machine Print.
  3. Di jendela selanjutnya, pilih [Select]. Setelah itu, jendela utama Simple OCR akan muncul. Untuk memulai, klik [add page] Akan terdapat beberapa pilihan, apakah mau langsung dari scanner, file, Batch(untuk halaman dalam jumlah banyak sekaligus), atau membuka file dengan format inklink. Pilih sesuai kebutuhan, namun dalam tutorial kali ini, yang dipilih adalah [file], dengan asumsi, file yang akan di akan di baca sudah ada sebelumnya, lalu klik ok.
  4. Buka file gambar yang akan di baca. Sebelumnya, pastikan file yang akan di baca memiliki teks yang mudah di baca dan memiliki resolusi tinggi, semakin tinggi, maka semakin mudah simple OCR mengenali teks di dalamnya. Rata-rata resolusi hasil scan scanner sudah mencukupi untuk dilakukan pembacaan.
  5. Setelah di pilih, maka akan di tampilkan preview gambarnya, bila sudah yakin gambar tersebut yang mau di baca , klik [continue].
  6. Selanjutnya, lakukan editing gambar yang akan di baca. Untuk memisahkan teks dengan gambar, gunakan icon picture region  untuk menyeleksi gambarnya , mengabaikan area tertentu agar sofware tidak membacanya, gunakan ignore region {icon_1.bmp} atau menghapus area tertentu, gunakan delete region { Ketiga tool tersebut ada di toolbar Simple OCR. Setelah yakin semua sudah di edit dengan baik, klik [convert to text]. Simple OCR akan membaca dan mengenali semua teks dalam gambar dan menampilkan teks hasil pembacaannya.
  7. Dalam proses pembacaan, Simple OCR mungkin akan salah membaca beberapa teks. Dapat disebabkan karena memang teks tersebut agak sulit terbaca atau resolusinya kurang baik. Karena itu, tugas terakhir kita adalah mengoreksinya. Editornya langsung dari simple OCR, sederhana, efektif dan mudah digunakan.
  8. Warna huruf menandakan tingkat akurasi kata yang di koreksi, warna hitam artinya kata sudah akurat. Biru, artinya mendekati akurat dan warna merah artinya perlu di koreksi lagi. Gunakan tombol enter untuk berpindah dari kata ke kata lainnya, dan bandingkan kata yang sedang di edit dengan kata yang masih dalam format gambar di atasnya.
  9. Apabila semua kata sudah di koreksi, save teks hasil pembacaan tadi di format doc atau txt.
Proses ini hanya membutuhkan waktu sebentar, tergantung dari banyaknya revisi yang harus dilakukan, tentunya jauh lebih singkat bila dibandingkan mengetik sendiri secara manual. Pekerjaan mengetik dapat di hindari untuk bisa mengerjakan pekerjaan lain yang lebih penting.
Selain Simple OCR, masih banyak software-software OCR lain yang bisa digunakan secara gratis :
Tidak hanya software, ada juga website yang menyediakan fasilitas OCR. Tidak perlu instal atau registrasi apapun, tinggal kunjungi dan upload gambarnya. Website tersebut diantaranya :
Alternatif lain, jika ingin menghemat waktu, MS Office OneNote 2007 juga menyediakan fasilitas OCR. Cara pakainya tinggal buka file gambarnya di OneNote, klik kanan, lalu pilih “copy text from picture”, lalu paste di teks editor seperti Word, atau notepad. Hanya saja, fasilitas yang disediakan tidak sebanyak softwae OCR lainnya.

Sumber tulisan:

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s