ML & AI

20 Pakej Pembelajaran Mesin R Terbaik Terbaik Untuk Melihat Sekarang

20 Pakej Pembelajaran Mesin R Terbaik Terbaik Untuk Melihat Sekarang

Hampir semua saintis data pemula dan pemaju pembelajaran mesin keliru memilih bahasa pengaturcaraan. Mereka selalu bertanya bahasa pengaturcaraan mana yang terbaik untuk pembelajaran mesin dan projek sains data mereka. Sama ada kita akan mencari python, R, atau MatLab. Nah, pilihan bahasa pengaturcaraan bergantung pada pilihan pemaju dan keperluan sistem. Di antara bahasa pengaturcaraan lain, R adalah salah satu bahasa pengaturcaraan yang paling berpotensi dan hebat yang mempunyai beberapa pakej pembelajaran mesin R untuk kedua-dua projek ML, AI, dan sains data.

Akibatnya, seseorang dapat mengembangkan projeknya dengan mudah dan efisien dengan menggunakan pakej pembelajaran mesin R ini. Menurut tinjauan Kaggle, R adalah salah satu bahasa pembelajaran mesin sumber terbuka yang paling popular.

Pakej Pembelajaran Mesin R Terbaik


R adalah bahasa sumber terbuka supaya orang dapat menyumbang dari mana saja di dunia. Anda boleh menggunakan Kotak Hitam dalam kod anda, yang ditulis oleh orang lain. Di R, Kotak Hitam ini disebut sebagai pakej. Pakej ini hanyalah kod pra-tulisan yang boleh digunakan berulang kali oleh sesiapa sahaja. Di bawah ini, kami mempamerkan 20 pakej pembelajaran mesin R terbaik.

1. KERETA


Pakej CARET merujuk kepada latihan klasifikasi dan regresi. Tugas pakej CARET ini adalah untuk menggabungkan latihan dan ramalan model. Ini adalah salah satu pakej R terbaik untuk pembelajaran mesin dan juga sains data.

Parameter dapat dicari dengan mengintegrasikan beberapa fungsi untuk menghitung prestasi keseluruhan model tertentu dengan menggunakan kaedah pencarian grid paket ini. Setelah berjaya menyelesaikan semua percubaan, carian grid akhirnya menemui kombinasi terbaik.

Setelah memasang pakej ini, pembangun dapat menjalankan nama (getModelInfo ()) untuk melihat 217 kemungkinan fungsi yang dapat dijalankan hanya dengan satu fungsi. Untuk membina model ramalan, pakej CARET menggunakan fungsi kereta api (). Sintaks fungsi ini:

kereta api (formula, data, kaedah)

Dokumentasi

2. randomForest


RandomForest adalah salah satu pakej R yang paling popular untuk pembelajaran mesin. Pakej pembelajaran mesin R ini dapat digunakan untuk menyelesaikan tugas regresi dan klasifikasi. Selain itu, ia boleh digunakan untuk melatih nilai dan garis besar yang hilang.

Pakej pembelajaran mesin dengan R ini biasanya digunakan untuk menghasilkan pelbagai keputusan. Pada asasnya, ia mengambil sampel rawak. Dan kemudian, pemerhatian diberikan ke dalam pokok keputusan. Akhirnya, output biasa yang berasal dari pokok keputusan adalah output utama. Sintaks fungsi ini:

randomForest (formula =, data =)

Dokumentasi

3. e1071


E1071 ini adalah salah satu pakej R yang paling banyak digunakan untuk pembelajaran mesin. Dengan menggunakan pakej ini, pembangun dapat menerapkan mesin vektor sokongan (SVM), pengiraan jalur terpendek, pengelompokan bagged, pengklasifikasi Naive Bayes, transformasi Fourier jangka pendek, pengelompokan kabur, dll.

Sebagai contoh, untuk sintaks SVM data IRIS adalah:

svm (Spesies ~ Sepal.Panjang + Sepal.Lebar, data = iris)

Dokumentasi

4. Rpart


Rpart bermaksud latihan partisi dan regresi rekursif. Pakej R ini untuk pembelajaran mesin dapat dilakukan baik tugas: klasifikasi dan regresi. Ia bertindak menggunakan langkah dua peringkat. Keluaran model pokok binari. Fungsi plot () digunakan untuk memplot hasil output. Juga, ada fungsi alternatif, fungsi prp (), yang lebih fleksibel dan kuat daripada fungsi plot dasar ().

Fungsi rpart () digunakan untuk menjalin hubungan antara pemboleh ubah bebas dan bersandar. Sintaksnya adalah:

rpart (formula, data =, kaedah =, kawalan =)

di mana rumus adalah gabungan pemboleh ubah bebas dan bersandar, data adalah nama set data, kaedahnya adalah objektif, dan kawalan adalah keperluan sistem anda.

Dokumentasi

5. KernLab


Sekiranya anda ingin mengembangkan projek anda berdasarkan algoritma pembelajaran mesin berasaskan kernel, maka anda boleh menggunakan pakej R ini untuk pembelajaran mesin. Pakej ini digunakan untuk SVM, analisis ciri kernel, algoritma peringkat, primitif produk titik, proses Gauss, dan banyak lagi. KernLab digunakan secara meluas untuk pelaksanaan SVM.

Terdapat pelbagai fungsi kernel yang ada. Beberapa fungsi kernel disebutkan di sini: polydot (fungsi kernel polinomial), tanhdot (Fungsi kernel tangen hiperbolik), laplacedot (fungsi kernel laplacian), dll. Fungsi-fungsi ini digunakan untuk melakukan masalah pengecaman corak. Tetapi pengguna dapat menggunakan fungsi kernel mereka dan bukannya fungsi kernel yang telah ditentukan.

Dokumentasi

6. nnet


Sekiranya anda ingin mengembangkan aplikasi pembelajaran mesin anda menggunakan rangkaian saraf tiruan (ANN), pakej nnet ini mungkin dapat membantu anda. Ini adalah salah satu paket rangkaian neural yang paling popular dan mudah. Tetapi batasannya adalah lapisan nod tunggal.

Sintaks pakej ini adalah:

nnet (formula, data, saiz)

Dokumentasi

7. dplyr


Salah satu pakej R yang paling banyak digunakan untuk sains data. Ia juga menyediakan beberapa fungsi yang mudah digunakan, cepat, dan konsisten untuk manipulasi data. Hadley Wickham menulis pakej pengaturcaraan ini untuk sains data. Pakej ini terdiri daripada set kata kerja i.e., mutasi (), pilih (), tapis (), ringkaskan (), dan susun ().

Untuk memasang pakej ini, seseorang mesti menulis kod ini:

pasang.pakej ("dplyr")

Dan untuk memuatkan pakej ini, anda mesti menulis sintaks ini:

perpustakaan (dplyr)

Dokumentasi

8. ggplot2


Satu lagi pakej R kerangka grafik paling elegan dan estetik untuk sains data adalah ggplot2. Ini adalah sistem membuat grafik berdasarkan tatabahasa grafik. Sintaks pemasangan untuk pakej sains data ini adalah:

pasang.pakej ("ggplot2")

Dokumentasi

9. Kerangka perkataan


Apabila satu gambar terdiri daripada ribuan perkataan, maka ia disebut Wordcloud. Pada dasarnya, ini adalah visualisasi data teks. Pakej pembelajaran mesin ini menggunakan R digunakan untuk membuat perwakilan kata, dan pengembang dapat menyesuaikan Wordcloud sesuai dengan pilihannya, seperti menyusun kata-kata secara rawak atau kata frekuensi yang sama bersama-sama atau kata frekuensi tinggi di tengah, dll.

Dalam bahasa pembelajaran mesin R, dua perpustakaan tersedia untuk membuat wordcloud: Wordcloud dan Worldcloud2. Di sini kita akan menunjukkan sintaks untuk WordCloud2. Untuk memasang WordCloud2, anda mesti menulis:

1. memerlukan (devtools)
2. install_github ("lchiffon / wordcloud2")

Atau anda boleh menggunakannya secara langsung:

perpustakaan (wordcloud2)

Dokumentasi

10. tidyr


Pakej r lain yang digunakan secara meluas untuk sains data adalah tidyr. Matlamat pengaturcaraan r untuk sains data ini adalah merapikan data. Dalam keadaan kemas, pemboleh ubah diletakkan ke dalam lajur, pemerhatian ditempatkan ke dalam baris, dan nilainya ada di dalam sel. Pakej ini menerangkan cara standard menyusun data.

Untuk pemasangan, anda boleh menggunakan fragmen kod ini:

pasang.pakej ("tidyr")

Untuk memuatkan, kodnya adalah:

perpustakaan (tidyr)

Dokumentasi

11. berkilat


Pakej R, Shiny, adalah salah satu kerangka aplikasi web untuk sains data. Ia membantu membina aplikasi web dari R dengan mudah. Sama ada pembangun boleh memasang perisian pada setiap sistem pelanggan atau teksi yang menghoskan laman web. Juga, pembangun boleh membina papan pemuka atau dapat memasukkannya ke dalam dokumen R Markdown.

Selain itu, aplikasi Shiny dapat diperluas dengan berbagai bahasa skrip seperti widget html, tema CSS, dan tindakan JavaScript. Dengan kata lain, kita dapat mengatakan bahawa pakej ini adalah gabungan kekuatan komputasi R dengan interaktiviti web moden.

Dokumentasi

12. tm


Tidak perlu dikatakan, perlombongan teks adalah aplikasi pembelajaran mesin yang muncul sekarang. Pakej pembelajaran mesin R ini menyediakan kerangka kerja untuk menyelesaikan tugas perlombongan teks. Dalam aplikasi perlombongan teks, i.e., analisis sentimen atau klasifikasi berita, pembangun mempunyai pelbagai jenis kerja yang membosankan seperti membuang perkataan yang tidak diingini dan tidak relevan, membuang tanda baca, membuang kata berhenti, dan banyak lagi.

Pakej tm mengandungi beberapa fungsi fleksibel untuk membuat kerja anda mudah seperti removeNumbers (): untuk menghapus Numbers dari dokumen teks yang diberikan, weightTfIdf (): untuk istilah Frekuensi dan frekuensi dokumen terbalik, tm_reduce (): untuk menggabungkan transformasi, removePunctuation () ke hapus tanda baca dari dokumen teks yang diberikan dan banyak lagi.

Dokumentasi

13. Pakej MICE


Pakej pembelajaran mesin dengan R, MICE merujuk kepada Multivariate Imputation via Chained Sequences. Hampir sepanjang masa, pemaju projek menghadapi masalah umum dengan set data pembelajaran mesin yang merupakan nilai yang hilang. Pakej ini dapat digunakan untuk menyiratkan nilai yang hilang menggunakan pelbagai teknik.

Pakej ini mengandungi beberapa fungsi seperti memeriksa corak data yang hilang, mendiagnosis kualiti nilai yang disiratkan, menganalisis set data yang lengkap, menyimpan dan mengeksport data yang tersirat dalam pelbagai format, dan banyak lagi.

Dokumentasi

14. igraph


Pakej analisis rangkaian, igraph, adalah salah satu pakej R yang kuat untuk sains data. Ini adalah koleksi alat analisis rangkaian yang kuat, cekap, mudah digunakan, dan mudah alih. Juga, pakej ini adalah sumber terbuka dan percuma. Selain itu, igraphn boleh diprogramkan di Python, C / C ++, dan Mathematica.

Pakej ini mempunyai beberapa fungsi untuk menghasilkan grafik rawak dan biasa, visualisasi grafik, dll. Anda juga boleh menggunakan graf besar anda menggunakan pakej R ini. Terdapat beberapa syarat untuk menggunakan pakej ini: untuk Linux, penyusun C dan C ++ diperlukan.

Pemasangan pakej pengaturcaraan R ini untuk sains data adalah:

pasang.pakej ("igraph")

Untuk memuatkan pakej ini, anda mesti menulis:

perpustakaan (igraph)

Dokumentasi

15. ROCR


Pakej R untuk sains data, ROCR, digunakan untuk menggambarkan prestasi pengelasan pemarkahan. Pakej ini fleksibel dan mudah digunakan. Hanya diperlukan tiga perintah dan nilai lalai untuk parameter pilihan. Pakej ini digunakan untuk mengembangkan lengkung prestasi 2D yang dipar parameter. Dalam pakej ini, terdapat beberapa fungsi seperti ramalan (), yang digunakan untuk membuat objek ramalan, prestasi () digunakan untuk membuat objek prestasi, dll.

Dokumentasi

16. Penjelajah Data


Pakej DataExplorer adalah salah satu pakej R yang paling mudah digunakan untuk sains data. Di antara banyak tugas sains data, analisis data penerokaan (EDA) adalah salah satunya. Dalam analisis data penerokaan, penganalisis data harus lebih memperhatikan data. Bukan kerja yang mudah untuk memeriksa atau mengendalikan data secara manual atau menggunakan pengekodan yang buruk. Automasi analisis data diperlukan.

Pakej R untuk sains data ini menyediakan automasi penerokaan data. Pakej ini digunakan untuk mengimbas dan menganalisis setiap pemboleh ubah dan memvisualisasikannya. Ia berguna apabila set data besar-besaran. Oleh itu, analisis data dapat mengekstrak pengetahuan tersembunyi data dengan cekap dan mudah.

Pakej boleh dipasang dari CRAN secara langsung menggunakan kod di bawah:

pasang.pakej ("DataExplorer")

Untuk memuatkan pakej R ini, anda mesti menulis:

perpustakaan (DataExplorer)

Dokumentasi

17. mlr


Salah satu pakej pembelajaran mesin R yang paling luar biasa adalah pakej mlr. Pakej ini adalah penyulitan beberapa tugas pembelajaran mesin. Ini bermakna anda dapat melakukan beberapa tugas dengan hanya menggunakan satu paket, dan anda tidak perlu menggunakan tiga paket untuk tiga tugas yang berbeza.

Pakej mlr adalah antara muka untuk banyak teknik klasifikasi dan regresi. Tekniknya merangkumi deskripsi parameter yang dapat dibaca mesin, pengelompokan, pengambilan sampel umum, penyaringan, pengekstrakan fitur, dan banyak lagi. Operasi selari juga boleh dilakukan.

Untuk pemasangan, anda mesti menggunakan kod di bawah:

pasang.pakej ("mlr")

Untuk memuatkan pakej ini:

perpustakaan (mlr)

Dokumentasi

18. arul


Pakej ini, arules (Peraturan pergaulan penambangan dan Item Kerap), adalah pakej pembelajaran mesin R yang banyak digunakan. Dengan menggunakan pakej ini, beberapa operasi dapat dilakukan. Operasi tersebut adalah perwakilan dan analisis transaksi data dan corak dan manipulasi data. Pelaksanaan C algoritma perlombongan persatuan Apriori dan Eclat juga tersedia.

Dokumentasi

19. mboost


Pakej pembelajaran mesin R lain untuk sains data adalah mboost. Pakej penambahbaikan berasaskan model ini mempunyai algoritma penurunan kecerunan fungsional untuk mengoptimumkan fungsi risiko umum dengan menggunakan pohon regresi atau anggaran kuadrat terkecil komponen. Ia juga menyediakan model interaksi untuk data dimensi tinggi yang berpotensi.

Dokumentasi

20. pesta


Pakej lain dalam pembelajaran mesin dengan R adalah pesta. Kotak alat pengiraan ini digunakan untuk partition rekursif. Fungsi utama atau teras pakej pembelajaran mesin ini adalah ctree (). Ini adalah fungsi yang digunakan secara meluas yang mengurangkan masa latihan dan berat sebelah.

Sintaks ctree () adalah:

 ctree (formula, data)

Dokumentasi

Pemikiran Berakhir


R adalah bahasa pengaturcaraan yang terkenal yang menggunakan kaedah statistik dan grafik untuk meneroka data. Tidak perlu dikatakan, bahasa ini mempunyai sebilangan besar pakej pembelajaran mesin R, alat RStudio yang luar biasa, dan sintaks yang mudah difahami untuk membangunkan projek pembelajaran mesin lanjutan. Dalam pakej R ml, terdapat beberapa nilai lalai. Sebelum menerapkannya ke program anda, anda mesti mengetahui tentang pelbagai pilihan secara terperinci. Dengan menggunakan pakej pembelajaran mesin ini, sesiapa sahaja dapat membina model pembelajaran mesin atau sains data yang cekap. Terakhir, R adalah bahasa sumber terbuka, dan bungkusannya terus berkembang.

Sekiranya anda mempunyai cadangan atau pertanyaan, sila tinggalkan komen di bahagian komen kami. Anda juga boleh berkongsi artikel ini dengan rakan dan keluarga anda melalui media sosial.

5 Kad Tangkap Permainan Teratas
Kita semua telah melihat dan menyukai streaming permainan permainan di YouTube. PewDiePie, Jakesepticye, dan Markiplier hanyalah beberapa pemain terat...
Cara Membangunkan Permainan di Linux
Satu dekad yang lalu, tidak banyak pengguna Linux akan meramalkan bahawa sistem operasi kegemaran mereka suatu hari nanti akan menjadi platform permai...
Port Sumber Terbuka Mesin Permainan Komersial
Rekreasi enjin permainan sumber terbuka dan bebas platform boleh digunakan untuk bermain lama dan juga beberapa tajuk permainan yang baru-baru ini. Ar...