Apache Solr

Enjin Carian Diri Terbaik

Enjin Carian Diri Terbaik
Adakah bos anda tahu bahawa anda sedang mencari pekerjaan lain? Sudahkah anda memberitahu yang penting mengenai ketidakmampuan untuk memutuskan sama ada anda ingin mempunyai anak atau tidak? Adakah anda ibu bapa tahu mengenai orientasi seksual anda? Yah, Google dan enjin carian utama lain.

"Sebilangan besar pengguna mencari di Google semasa masuk, jadi semua maklumat mengenai kehidupan dalam talian mereka tersedia: carian YouTube, e-mel, dan sejarah carian sebelumnya," kata Adam Tauber, pemaju utama mesin metasearch yang mementingkan privasi Searx.

Sudah tentu, anda boleh menggunakan Tor untuk tanpa nama dan selalu menghapus semua jejak aktiviti anda selepas setiap carian, tetapi melakukannya setelah setiap carian kemungkinan besar akan menjadi tua dengan cepat. Sebaliknya, anda harus mempertimbangkan untuk memasang enjin carian yang dihoskan sendiri yang mampu mengambil maklumat untuk anda tanpa mendedahkan perkara sensitif mengenai anda.

Kami telah memilih dua enjin carian seperti itu, dan kami juga memperkenalkan tiga enjin carian tambahan untuk menunjukkan kepada anda bahawa alternatif yang sangat baik untuk enjin carian proprietari seperti Google atau Bing sudah ada dan lebih mudah dipasang dan digunakan daripada yang anda fikirkan.

1. YaCy

YaCy adalah mesin pencari peer-to-peer yang diedarkan secara percuma yang komponen utamanya ditulis di Jawa. Kerana semua pengguna YaCy adalah sama, dan kerana mesin pencari tidak menyimpan permintaan carian pengguna, penapisan tidak mungkin dilakukan.

Pada masa ini, YaCy mengindeks kira-kira 1.4 bilion dokumen dalam indeksnya berkat aktiviti lebih daripada 600 pengendali rakan sebaya yang menyumbang kepadanya setiap bulan. Sebagai perbandingan, indeks Carian Google mengandungi beratus-ratus bilion halaman web dan berukuran lebih dari 100,000,000 gigabait.

Walaupun YaCy masih memiliki jalan panjang sebelum dapat menyaingi enjin carian terpusat terbesar di dunia, ia sudah dapat digunakan sebagai portal carian untuk intranet peribadi dan aplikasi khusus projek kerana YaCy dapat beroperasi sebagai alat carian tunggal tanpa jaringan dengan yang lain rakan sebaya.

YaCy dapat disatukan dengan mudah ke dalam laman web mana pun berkat coretan kodnya yang mudah disalin dan ditampal dengan mudah tanpa sebarang pengubahsuaian.

2. Searx

Searx digambarkan sebagai enjin carian metasearch yang menghormati privasi. Ia tersedia di bawah GNU Affero General Public License versi 3, dan tujuan utamanya adalah untuk melindungi privasi penggunanya dengan tidak pernah berkongsi alamat IP pengguna atau sejarah carian dengan mesin pencari dari mana ia mengumpulkan hasil.

"Semasa menggunakan Searx, alamat IP Searx, Ejen Pengguna rawak dan pertanyaan carian dihantar ke Google secara lalai," Adam Tauber, aka asciimoo, menjelaskan bagaimana mesin metasearchnya berfungsi. “Sudah tentu, anda dapat menyesuaikan Searx untuk meneruskan parameter tambahan lain seperti bahasa carian atau nombor halaman dari halaman hasil yang diminta."

Searx secara automatik menyekat semua kuki pelacakan yang dilayan oleh mesin pencari untuk mengelakkan pengubahsuaian hasil berdasarkan profil pengguna, yang dapat dihasilkan dari mesin pencari yang berusaha melaksanakan carian yang dibuat secara individu berdasarkan apa yang diketahui oleh mesin mengenai pengguna. Searx adalah 100 peratus percuma, dan sesiapa sahaja dapat mengubahnya mengikut keperluan. Anda bahkan boleh menggunakan kod Searx dan menjalankan mesin carian metas pada pelayan anda sendiri, yang pastinya dapat mengatasi segala kebimbangan anda mengenai log.

3. Pencarian Elastik

ElasticSearch adalah enjin carian berdasarkan Lucene, perpustakaan perisian pengambilan maklumat bebas dan sumber terbuka yang disokong oleh Apache Software Foundation dan dikeluarkan di bawah Lesen Perisian Apache.

ElasticSearch menyediakan enjin carian teks penuh dengan antara muka web HTTP. Mesin pencari boleh digunakan untuk mencari semua jenis dokumen, dan dapat diedarkan dengan mudah di beberapa nod.

Anda boleh membina enjin carian yang dihoskan sendiri menggunakan ElasticSearch dan Docker, dan anda boleh mendapatkan tutorial yang menerangkan prosesnya di sini.

4. Ambar

Ambar adalah mesin carian dokumen sumber terbuka dengan banyak ciri berguna. Ia menyokong perayapan automatik, penandaan, dan carian teks penuh segera, hanya untuk memberikan beberapa contoh. Salah satu ciri Ambar yang paling menarik adalah kemampuannya melakukan OCR pada gambar dan fail PDF. Bahasa yang disokong merangkumi bahasa Inggeris, Jerman, Rusia, Itali, Perancis, Sepanyol, Poland, dan Belanda.

Ambar dapat disebarkan dengan mudah dengan satu fail penyusun dok, dan anda boleh belajar melakukannya di sini.

5. Apache Solr

Ditulis di Java, Apache Solr adalah platform carian perusahaan yang merangkumi carian teks penuh, penyorotan klik, carian faset, pengindeksan masa nyata, pengelompokan dinamik, dan banyak lagi ciri penting lainnya. Ia dibuat pada tahun 2004 untuk projek dalaman di CNET Networks. CNET Networks dengan hormat menyumbangkannya kepada Apache Software Foundation pada tahun 2006, di mana ia lulus dari status inkubasi menjadi projek peringkat tertinggi yang berdiri sendiri pada tahun 2007.

Hari ini, Solr adalah platform carian perusahaan yang sangat dipercayai, berskala, dan bertolak ansur, yang memberi kuasa kepada ciri carian dan navigasi dari banyak laman web internet terbesar di dunia, termasuk DuckDuckGo, eHarmony, dan BestBuy. Awak boleh

Cara Memasang dan Mengkonfigurasi YaCy

Pemasangan YaCy sangat mudah, dan hanya memerlukan beberapa minit kerana anda tidak perlu memasang pangkalan data luaran atau pelayan web-YaCy dilengkapi dengan semua yang diperlukan.

  1. Pergi ke laman web rasmi YaCy dan muat turun pakej terbaru untuk Linux.
  2. Pasang persekitaran runtime OpenJDK 8.
    • Sekiranya anda menggunakan pengedaran berasaskan Debian, gunakan arahan berikut: $ sudo apt-get install openjdk-8-jre
    • Sekiranya tidak, ikuti arahan khusus untuk pengedaran anda.
  3. Ekstrak pakej yang dimuat turun ke lokasi pilihan anda.
  4. Pergi ke folder baru dan mulakan "startYACY.skrip sh ”di Terminal.
  5. Anda akan melihat mesej pengesahan yang memberitahu anda bahawa YaCy bermula sebagai daemon

Kesimpulannya

Enjin carian lebih mengetahui tentang kami daripada yang ingin diakui oleh kebanyakan orang. Sekiranya anda ingin berhenti memberi makan kepada syarikat besar dengan data yang berair, anda boleh mengambil barang sendiri dan menyediakan mesin carian yang dihoskan sendiri untuk melindungi privasi anda. Walaupun enjin carian yang dihoskan sendiri masih mempunyai jalan yang panjang untuk dapat digunakan sepenuhnya, potensi untuk mereka mengungguli Google seperti ada dan menangkapnya hanya untuk menarik lebih banyak pengguna.

Alat Berguna untuk Pemain Linux
Sekiranya anda suka bermain permainan di Linux, kemungkinan anda telah menggunakan aplikasi dan utiliti seperti Wine, Lutris dan OBS Studio untuk meni...
HD Remastered Games untuk Linux yang Tidak Pernah Melancarkan Linux Sebelumnya
Banyak pembangun dan penerbit permainan hadir dengan penghapus HD permainan lama untuk memperpanjang usia francais, harap peminat meminta keserasian d...
Cara Menggunakan AutoKey untuk Mengautomasikan Permainan Linux
AutoKey adalah utiliti automasi desktop untuk Linux dan X11, yang diprogramkan dalam Python 3, GTK dan Qt. Dengan menggunakan skrip dan fungsi MACRO, ...