OCR

Cara menjalankan tesseract pada fail GIF di linux

Cara menjalankan tesseract pada fail GIF di linux
Tesseract adalah sistem OCR (Optical Character Recognition), antara yang terbaik. Perisian OCR mampu memahami teks dari gambar dan dokumen yang diimbas (termasuk tulisan tangan jika anda melatihnya). Sistem OCR boleh berguna untuk banyak tugas seperti menghitung perkataan yang diimbas dokumen, transkripsi automatik, penukaran watak dari gambar ke teks dan banyak lagi.

LinuxHint telah menerbitkan tutorial yang menerangkan cara memasang dan memahami latihan Tesseract.

Tutorial ini menunjukkan proses pemasangan Tesseract dalam sistem Debian / Ubuntu tetapi tidak akan dilanjutkan mengenai fungsi latihan, jika anda tidak terbiasa dengan perisian ini membaca artikel yang disebutkan mungkin merupakan pengenalan yang baik.  Kemudian kami akan menunjukkan kepada anda cara memproses gambar GIF dengan Tesseract untuk mengeluarkan teks daripadanya.

Pemasangan Tesseract:

Jalankan:

pasang tesseract-ocr

Sekarang anda perlu memasang imagemagick yang merupakan penukar gambar.

Setelah dipasang kita sudah boleh menguji Tesseract, untuk mengujinya saya dapati sebuah gif berlesen untuk digunakan semula.

Sekarang mari kita lihat apa yang berlaku ketika kita menjalankan tesseract pada gambar gif:

tesseract 2002NY40.hasil gif 1

Sekarang lakukan "kurang" pada 1 hasil.txt

kurang 1 hasil.txt

Inilah gambar dengan teksnya:

Dalam tetapan lalai Tesseract ini cukup tepat, biasanya untuk mendapatkan ketepatan itu memerlukan latihan. Mari cuba satu lagi gambar percuma yang saya dapati di Wiki Commons, setelah memuat turunnya dijalankan:

tesseract Actualizar_GNULinux_Terminal_apt-get.hasil gif 2

Sekarang periksa kandungan fail.

kurang 2 hasil.txt


Itulah hasilnya sementara kandungan gambar asal adalah:

Untuk meningkatkan pengecaman watak, kami mempunyai banyak pilihan dan langkah untuk diikuti yang diperincikan dalam tutorial kami sebelumnya: penghapusan sempadan, penghapusan bunyi, pengoptimalan ukuran dan penggiliran halaman antara fungsi lain seperti pemangkasan.

Untuk tutorial ini kita akan menggunakan textcleaner, skrip yang dikembangkan oleh Fred's ImageMagick Scripts.

Muat turun skrip dan jalankan:

./ textcleaner -g -e stretch -f 25 -o 10 -s 1
Sebenar_GNULinux_Terminal_apt-get.ujian gif.gif

Nota: sebelum menjalankan skrip berikan izin pelaksanaan dengan menjalankan “chmod + x textcleaner"Sebagai akar atau dengan sudo awalan.

Di mana:

pembersih teks: memanggil program

-g: Tukar gambar ke skala kelabu

-e: enache

-f: tapiskan

-s: sharpamt, jumlah penajaman piksel untuk digunakan pada hasilnya.

Untuk maklumat dan contoh penggunaan dengan textcleaner lawati http: // www.fmwconcepts.com / imagemagick / textcleaner / index.php

Seperti yang anda lihat textcleaner mengubah warna latar belakang, meningkatkan kontras antara fon dan latar belakang.

Sekiranya kita menjalankan tesseract mungkin hasilnya akan berbeza:

ujian tesseract.hasil ujian gif

kurang testoutput

Seperti yang anda lihat hasilnya benar-benar meningkat walaupun tidak tepat.

Arahan menukar disediakan oleh imagemagick membolehkan kami mengekstrak bingkai dari gambar gif untuk diproses kemudian oleh Tesseract, ini berguna jika terdapat kandungan yang boleh dilekatkan dalam bingkai gambar gif yang berbeza.

Sintaksnya mudah:

menukar

Hasilnya akan dihasilkan dalam jumlah file sebagai bingkai dalam gif, dalam contoh yang disediakan hasilnya adalah: output-0.jpg, output-1.jpg, output-2.jpg, dan lain-lain.

Kemudian anda boleh memprosesnya dengan tesseract, memerintahkannya memproses semua fail dengan wildcard menyimpan hasilnya dalam satu fail dengan menjalankan:

untuk i dalam output- *; lakukan hasil keluaran $ i; selesai;

Imagemagick mempunyai banyak pilihan untuk mengoptimumkan gambar dan tidak ada mod generik, untuk setiap jenis senario anda harus membaca halaman arahan pengguna.

Saya harap anda mendapati tutorial ini di Tesseract berguna.

Enjin Permainan Sumber Percuma dan Terbuka untuk Membangunkan Permainan Linux
Artikel ini akan merangkumi senarai enjin permainan sumber percuma dan terbuka yang dapat digunakan untuk mengembangkan permainan 2D dan 3D di Linux. ...
Shadow of the Tomb Raider untuk Tutorial Linux
Shadow of the Tomb Raider adalah penambahan kedua belas untuk siri Tomb Raider - francais permainan aksi-pengembaraan yang dibuat oleh Eidos Montreal....
Cara Meningkatkan FPS di Linux?
FPS bermaksud Bingkai sesaat. Tugas FPS adalah mengukur kadar bingkai dalam pemutaran video atau persembahan permainan. Dengan kata mudah bilangan gam...