PDF

Cara Mengekstrak Teks Sorotan dari PDF sebagai Fail Teks Biasa?

Cara Mengekstrak Teks Sorotan dari PDF sebagai Fail Teks Biasa?

Menonjolkan teks dalam dokumen PDF sangat berguna untuk menandakan kawasan penting yang boleh anda akses kemudian dengan cepat. Anda boleh menggunakan Microsoft Edge untuk menonjolkan PDF atau perisian lain yang disertakan dengan ciri penyorotan PDF. Kadang-kadang, anda mungkin juga merasa perlu hanya mempunyai teks yang disorot sehingga anda dapat memiliki ringkasan PDF yang berisi semua teks penting. Sekiranya anda mencari beberapa cara untuk menyimpan teks yang diserlahkan hanya dari PDF sebagai fail TXT, maka catatan ini dapat membantu.

Ekstrak Teks Sorotan dari PDF

Terdapat beberapa perisian percuma dan perkhidmatan untuk mengekstrak teks yang disorot dari fail PDF dan menyimpannya sebagai fail teks:

Mari periksa perisian PDF Highlight Extractor ini satu persatu.

1] Pengekstrak Sorotan PDF

PDF Highlight Extractor adalah salah satu pilihan termudah untuk mengekstrak teks yang diserlahkan dari fail PDF. Ini sumber terbuka Pengekstrak sorotan teks PDF mempunyai dua ciri yang menarik perhatian. Awak boleh pratonton teks yang diserlahkan PDF pada antara muka perisian.

Ciri kedua ialah anda boleh tetapkan halaman permulaan atau akhir atau julat halaman untuk mengekstrak teks. Oleh itu, daripada mengimbas keseluruhan PDF, anda boleh menentukan nombor halaman untuk mendapatkan teks yang diserlahkan.

Ciri lain yang baik ialah anda mempunyai pilihan untuk simpan teks sebagai teks biasa atau Fail Excel.

Pada antara muka, tambahkan fail PDF anda menggunakan pilihan yang diberikan, dan kemudian tekan Ekstrak butang. Nyahtanda Semua Halaman pilihan jika anda ingin menetapkan julat halaman atau membiarkannya seperti sedia ada. Setelah teks diambil, anda boleh melihatnya. Akhirnya, tekan Teks atau Excel butang untuk menyimpan teks yang diserlahkan.

Anda boleh memuat turun perisian ini dari sini. Java juga diperlukan untuk menggunakan perisian ini. Jadi, pasang Java (jika belum) dan jalankan perisian ini untuk digunakan.

2] Pembaca Foxit

Foxit Reader adalah salah satu pembaca PDF percuma terbaik. Anda boleh membuka banyak fail PDF dalam tab berasingan, menyerlahkan PDF, menambah catatan, komen eksport, tambah tandatangan, dan banyak lagi. Di antara senarai ciri yang besar, mengekstrak teks yang diserlahkan dari PDF juga ada. Bahagian terbaik dari ciri ini juga menyimpan nombor halaman bersama dengan teks yang diekstrak.

Untuk mengambil teks yang disorot dari PDF, buka fail PDF di antara muka, dan akses ke Komen tab. Pada tab itu, klik pada Eksport pilihan tersedia dalam Urus Komen bahagian. Anda akan melihat Teks yang diserlahkan pilihan. Gunakan pilihan itu dan kemudian anda boleh menyimpan semua teks yang disorot sebagai fail teks.

Berikut adalah pautan muat turun untuk perisian ini. Semasa pemasangan, anda harus memilih pemasangan khas untuk memasukkan hanya komponen yang diperlukan dalam perisian ini.

3] Sumnotes.bersih

Sumnotes.net adalah perkhidmatan percuma yang membolehkan anda memberi penjelasan PDF serta mengekstrak teks yang diserlahkan. Semua teks yang diserlahkan dapat dilihat secara berasingan di bar sisi kiri. Dengan menggunakan bar sisi itu, anda juga boleh buang teks yang diserlahkan yang tidak anda perlukan dan kemudian muat turun selebihnya teks yang diserlahkan.

Sebelum memuat turun teks yang diserlahkan, anda juga boleh memasukkan nombor halaman dan tidak termasuk yang teks warna yang diserlahkan.

Anda juga mempunyai pilihan untuk simpan teks yang diserlahkan dari PDF sebagai Excel atau Perkataan fail. Jadi, ciri-cirinya bagus. Anda boleh mendaftar dengan rancangan percuma dan kemudian ekstrak 50 sorotan atau penjelasan setiap muat turun, yang mencukupi dalam kebanyakan kes.

Berikut adalah pautan ke laman webnya. Untuk mengekstrak teks yang disorot dari PDF, tambahkan PDF dari PC atau Google Drive. Semasa PDF dimuat naik, anotasi dan teks yang disorot dapat dilihat di sebelah kiri. Menggunakan Muat turun Anotasi dan kemudian anda boleh menyimpan teks yang diserlahkan TXT, XLSX, atau DOC fail format.

4] DyAnnotationExtractor

Perisian DyAnnotationExtractor dapat membantu anda mengekstrak teks yang disorot dan komen dari dokumen PDF. Ia adalah baris perintah perisian, tetapi menggunakannya sangat mudah. Hanya satu arahan akan mengambil teks yang diserlahkan dalam fail PDF input.

Anda boleh mendapatkan perisian ini menggunakan pautan ini. Muat turun fail ZIPnya dan kemudian ekstraknya. Untuk mempermudah menjalankan perintah, anda juga harus meletakkan PDF di folder yang sama di mana anda mengekstrak perisian ini. Selepas itu, buka Arahan prompt tetingkap dalam folder itu. Anda boleh melakukannya dengan menaip cmd di kotak alamat folder itu dan kemudian menekan Masukkan kunci.

Apabila tetingkap CMD dibuka, tambahkan file BAT perisian ini, perintah input termasuk jalur input PDF, perintah output, dan nama file output bersama dengan '.sambungan txt '. Perintah penuh akan-

DyAnnotationExtractor.bat -input jalan input PDF -output outputfilename.txt

Laksanakan perintah. Tunggu beberapa saat dan fail teks biasa akan siap berisi semua teks dan komen yang disorot yang diambil dari PDF itu. Fail output disimpan dalam folder input yang sama.

Jadi, ini adalah beberapa pilihan yang boleh anda gunakan untuk mengekstrak teks yang diserlahkan dari PDF dan kemudian menyimpan output sebagai fail teks. Semoga pertolongan ini.

Cara Menggunakan AutoKey untuk Mengautomasikan Permainan Linux
AutoKey adalah utiliti automasi desktop untuk Linux dan X11, yang diprogramkan dalam Python 3, GTK dan Qt. Dengan menggunakan skrip dan fungsi MACRO, ...
Cara Menunjukkan Kaunter FPS dalam Permainan Linux
Permainan Linux mendapat dorongan utama ketika Valve mengumumkan sokongan Linux untuk klien Steam dan permainan mereka pada tahun 2012. Sejak itu, ban...
Cara memuat turun dan Mainkan Sid Meier's Civilization VI di Linux
Pengenalan permainan Civilization 6 adalah konsep moden mengenai konsep klasik yang diperkenalkan dalam siri permainan Age of Empires. Idea itu cukup ...