Sains Data

10 Perpustakaan Pembelajaran Mesin untuk Python

10 Perpustakaan Pembelajaran Mesin untuk Python

Apa yang anda mahu buat? Soalan penting!

Anda datang ke sini untuk menggunakan Pembelajaran Mesin (ML) . Adakah anda telah mempertimbangkan dengan teliti untuk apa? Apabila anda memilih Perpustakaan Pembelajaran Mesin, anda perlu bermula dengan cara anda menggunakannya. Walaupun anda hanya berminat untuk belajar, anda harus mempertimbangkan di mana Pembelajaran Mesin digunakan dan mana yang paling dekat dengan minat utama anda. Anda juga harus mempertimbangkan jika anda ingin menumpukan perhatian untuk mendapatkan sesuatu yang berlaku di mesin tempatan anda atau jika anda berminat menyebarkan komputer anda ke banyak pelayan.

Pada mulanya, mulakan dengan membuat sesuatu berfungsi.

Tempat Pembelajaran Mesin digunakan

Anda boleh menemui banyak projek yang menggunakan ML, sebenarnya begitu banyak sehingga setiap kategori panjang halaman. Versi pendek 'di mana-mana', ini tidak benar tetapi seseorang mula bertanya-tanya. Yang jelas adalah enjin cadangan, pengecaman gambar dan pengesanan spam. Oleh kerana anda sudah memprogram di Python, anda juga akan berminat dengan perisian penyelesaian kod The Kite. Ini adalah kegunaan lain untuk mengesan kesalahan dari kemasukan data manual, diagnosis perubatan dan penyelenggaraan untuk kilang-kilang utama dan industri lain

Singkatnya perpustakaan:

  1. Scikit-belajar, Dari scikit; Rutin dan perpustakaan di atas NumPy, SciPy dan Matplotlib. Perpustakaan ini bergantung secara langsung pada rutin di perpustakaan matematik yang berasal dari Python. Anda memasang scikit-learn dengan pengurus pakej Python biasa anda. Scikit-learning kecil dan tidak menyokong pengiraan GPU, ini mungkin membuat anda tidak tahu tetapi ini adalah pilihan yang sedar. Pakej ini lebih kecil dan lebih mudah untuk dimulakan. Ia masih berfungsi dengan baik dalam konteks yang lebih besar walaupun untuk membuat kelompok pengiraan raksasa, anda memerlukan pakej lain.
  2. Scikit-gambar Khas untuk gambar! Scikit-image mempunyai algoritma untuk analisis dan manipulasi gambar. Anda boleh menggunakannya untuk memperbaiki gambar yang rosak serta memanipulasi warna dan atribut gambar yang lain. Idea utama pakej ini adalah untuk menyediakan semua gambar untuk NumPy supaya anda dapat membuat operasi pada mereka sebagai hari jadi. Dengan cara ini anda mempunyai gambar yang tersedia sebagai data untuk menjalankan algoritma.
  3. Shogun: Pangkalan C ++ dengan antara muka API yang jelas ke Python, Java, Scala dll. Banyak, mungkin kebanyakan algoritma tersedia untuk bereksperimen. Yang ini ditulis dalam C ++ untuk kecekapan, ada juga cara untuk mencubanya di cloud. Shogun menggunakan SWIG untuk berinteraksi dengan banyak bahasa pengaturcaraan, termasuk Python. Shogun merangkumi kebanyakan algoritma dan digunakan secara meluas dalam dunia akademik. Pakej ini mempunyai kotak alat yang tersedia di https: // www.kotak alat shogun.org.
  4. Spark MLlib: Terutama untuk Java tetapi boleh didapati melalui Perpustakaan NumPy untuk pembangun Python. Spark MLlib dikembangkan oleh pasukan Apache sehingga bertujuan untuk persekitaran pengkomputeran yang diedarkan dan mesti dijalankan dengan tuan dan pekerja. Anda boleh melakukan ini dalam mod mandiri tetapi kekuatan sebenar Spark adalah kemampuan untuk menyebarkan pekerjaan ke banyak mesin. Sifat Spark yang diedarkan menjadikannya popular di banyak syarikat besar, seperti IBM, Amazon dan Netflix. Tujuan utamanya adalah untuk menambang "Big Data", yang bermaksud semua serbuk roti yang anda tinggalkan semasa anda melayari dan membeli-belah dalam talian. Sekiranya anda ingin bekerja dengan Pembelajaran Mesin, Spark MLlib adalah tempat yang baik untuk memulakan. Algoritma yang disokongnya tersebar luas. Sekiranya anda memulakan projek hobi, mungkin ini bukan idea terbaik.
  5. H2O: Ditujukan untuk proses perniagaan sehingga menyokong ramalan untuk cadangan dan pencegahan penipuan. Perniagaan, H20.ai bertujuan untuk mencari dan menganalisis kumpulan data dari sistem fail yang diedarkan. Anda boleh menjalankannya di kebanyakan sistem operasi konvensional tetapi tujuan utamanya adalah untuk menyokong sistem berasaskan awan. Ini merangkumi kebanyakan algoritma statistik sehingga dapat digunakan untuk kebanyakan projek.
  6. Mahout: Dibuat untuk algoritma Pembelajaran Mesin yang diedarkan. Ini adalah sebahagian daripada Apache kerana sifat pengiraan yang diedarkan. Idea di sebalik Mahout adalah untuk ahli matematik melaksanakan algoritma mereka sendiri. Ini bukan untuk pemula, jika anda baru belajar, anda lebih baik menggunakan yang lain. Oleh itu, Mahout dapat berhubung dengan banyak bahagian belakang sehingga apabila anda telah membuat sesuatu untuk melihat apakah anda ingin menggunakan Mahout untuk frontend anda.
  7. Cloudera Oryx: Terutamanya digunakan untuk Pembelajaran Mesin pada data masa nyata. Oryx 2 adalah seni bina yang menyusun semua kerja untuk membuat sistem yang dapat bertindak balas terhadap data masa nyata. Lapisan juga berfungsi dalam jangka waktu yang berbeda, dengan lapisan batch yang membangun model dasar dan lapisan kecepatan yang mengubah model ketika data baru masuk. Oryx dibina di atas Apache Spark dan mencipta keseluruhan seni bina yang menerapkan semua bahagian aplikasi.
  8. Theano: Theano adalah Perpustakaan Python yang disatukan dengan NumPy. Ini adalah yang paling dekat dengan Python yang anda dapat. Apabila anda menggunakan Theano, anda dinasihatkan untuk memasang gcc. Sebabnya ialah Theano dapat menyusun kod anda menjadi kod yang paling sesuai. Walaupun Python hebat, dalam beberapa kes C lebih cepat. Jadi Theano dapat menukar ke C dan menyusun menjadikan program anda berjalan lebih cepat. Secara pilihan, anda boleh menambahkan sokongan GPU.
  9. Aliran Tensor: Tensor pada nama menunjukkan tensor matematik. Tensor seperti itu mempunyai tempat 'n' dalam matriks, bagaimanapun, Tensor adalah tatasusunan pelbagai dimensi. TensorFlow mempunyai algoritma untuk membuat pengiraan untuk Tensors, oleh itu namanya, anda boleh memanggilnya dari Python. Ia dibina dalam C dan C ++, tetapi mempunyai bahagian depan untuk Python. Ini menjadikannya mudah digunakan dan berjalan pantas. Tensorflow dapat dijalankan pada CPU, GPU atau diedarkan melalui rangkaian, ini dicapai oleh mesin eksekusi yang bertindak sebagai lapisan antara kod anda dan pemproses.
  10. Matplotlib: Apabila anda menghadapi masalah yang dapat anda selesaikan dengan Pembelajaran Mesin, kemungkinan besar anda ingin menggambarkan hasil anda. Di sinilah matplotlib masuk. Ia direka untuk menunjukkan nilai grafik matematik dan banyak digunakan dalam dunia akademik.

KESIMPULAN

Artikel ini telah memberi anda idea tentang apa yang tersedia untuk diprogram dalam Pembelajaran Mesin. Untuk mendapatkan gambaran yang jelas tentang apa yang anda perlukan, anda mesti memulakan dengan membuat beberapa program dan melihat bagaimana ia berfungsi. Sehingga anda tahu bagaimana sesuatu dapat dilakukan, anda dapat mencari jalan penyelesaian yang tepat untuk projek anda yang seterusnya.

Simpan Binaan Python Mudah Alih Ini untuk Linux Sentiasa Bersama Anda
Sebilangan besar pengedaran Linux dilengkapi dengan pakej Python yang telah dipasang sebelumnya. Pakej-pakej ini sangat disepadukan ke dalam OS dan be...
Cara Membuat dan Menguruskan Persekitaran Maya Python
Cukup biasa melihat pembangun Python memasang dan menaik taraf pakej dari sumber standard dan bukan standard untuk mengembangkan aplikasi. Alasan dapa...
Penghantaran Fail Python Socket Hantar
Tujuan artikel ini adalah untuk belajar cara memindahkan fail teks melalui rangkaian melalui program python. Pemindahan fail ini berdasarkan model kli...