R

Tutorial Pengaturcaraan R

Tutorial Pengaturcaraan R
Anda ingin pemula hingga ahli R Programmer dengan pantas? R adalah bahasa pengaturcaraan terbaik untuk bekerja dengan statistik, matematik dan sains data. Tutorial ini akan membantu anda mempelajari R dan membina model pembelajaran mesin pertama anda. Mari kita mulakan.

Menyusun dan Menjalankan R dari Command Line

Dua cara untuk menjalankan program R adalah: skrip R, yang banyak digunakan dan paling disukai dan yang kedua adalah R CMD BATCH, itu bukan perintah yang biasa digunakan. Kami boleh memanggilnya terus dari baris arahan atau penjadual kerja lain.

Anda boleh memanggil perintah-perintah ini dari shell yang terdapat di dalam IDE dan pada masa ini, RStudio IDE dilengkapi dengan alat yang meningkatkan atau mengurus skrip R dan fungsi R CMD BATCH.

sumber () fungsi di dalam R adalah alternatif yang baik untuk menggunakan baris perintah. Fungsi ini juga dapat memanggil skrip, tetapi untuk menggunakan fungsi ini, Anda harus berada di dalam lingkungan R.

Kumpulan Data Buatan Dalam Bahasa R

Untuk menyenaraikan kumpulan data yang sudah terpasang dengan R, gunakan perintah data (), kemudian cari apa yang anda mahukan, dan gunakan nama set data dalam fungsi data (). Seperti data (fungsi nama).

Tunjukkan Set Data dalam R

Tanda tanya (?) dapat digunakan untuk meminta bantuan untuk set data.

Untuk memeriksa semuanya gunakan ringkasan ().

Plot () juga merupakan fungsi yang digunakan untuk memplot grafik.

Mari buat skrip ujian dan jalankan. Buat hlm1.R fail dan simpan direktori utama dengan kandungan berikut:

Contoh Kod:

 # Kod hello world ringkas dalam cetakan R ("Hello World!cetak ("LinuxHint") cetak (5 + 6) 

Menjalankan Hello World

Rangka Data R

Untuk menyimpan data dalam jadual, kami menggunakan struktur dalam R yang disebut a Rangka Data. Ia digunakan untuk menyenaraikan vektor yang sama panjang. Sebagai contoh, pemboleh ubah berikut nm adalah kerangka data yang mengandungi tiga vektor x, y, z:

x = c (2, 3, 5) y = c ("aa", "bb", "cc") z = c (BENAR, SALAH, BENAR) # nm adalah kerangka data nm = data.bingkai (n, s, b) 

Terdapat konsep yang disebut Terbina dalamBingkai Data di R juga. mtcars adalah salah satu kerangka data terbina dalam R, yang akan kami gunakan sebagai contoh, untuk pemahaman kami yang lebih baik. Lihat kod di bawah:

 > mtcars mpg cyl disp hp drat wt… Mazda RX4 21.0 6 160 110 3.90 2.62… bas RX4 Wag 21.0 6 160 110 3.90 2.88… Datsun 710 22.8 4 108 93 3.85 2.32… 

kerangka data mtcars bulitin

Tajuk adalah baris atas jadual yang mengandungi nama lajur. Baris data disumbangkan oleh setiap garis mendatar; setiap baris dimulakan dengan nama baris dan kemudian diikuti dengan data sebenar. Anggota data baris disebut sebagai sel.

Kami akan memasukkan koordinat baris dan lajur dalam kurungan siku tunggal '[]' operator untuk mengambil data dalam sel. Untuk memisahkan koordinat, kami menggunakan koma. Pesanan itu mustahak. Koordinat bermula dengan baris kemudian koma dan kemudian berakhir dengan lajur. Nilai sel 2nd baris dan 1st lajur diberikan sebagai:

 > mtcars [2, 2] [1] 6 

Kita juga boleh menggunakan nama baris dan lajur dan bukannya koordinat:

 > mtcars ["Bas RX4", "mpg"] [1] 6 

fungsi nrow digunakan untuk mencari bilangan baris dalam kerangka data.

 > nrow (mtcars) # bilangan baris data [1] 32 

fungsi ncol digunakan untuk mencari jumlah lajur dalam kerangka data.

 > ncol (mtcars) # bilangan lajur [1] 11 

Gelung Pengaturcaraan R

Dalam beberapa keadaan, kami menggunakan gelung ketika kami ingin mengautomasikan sebahagian kod, atau kami ingin mengulangi urutan arahan.

Untuk gelung di R

Sekiranya kita mahu mencetak maklumat bertahun-tahun ini lebih daripada satu masa.

 cetak (tampal ("Tahun ini", 2000)) "Tahun adalah 2000" cetakan (tampal ("Tahun ini", 2001)) "Tahun adalah 2001" cetakan (tampal ("Tahun ini", 2002) ) "Tahun adalah tahun 2002" cetakan (tampal ("Tahun itu", 2003)) "Cetak tahun ini adalah 2003" (tampal ("Tahun itu", 2004)) "Tahun adalah tahun 2004" cetakan (tampal (" Tahun adalah ", 2005))" Tahun adalah 2005 " 

Daripada mengulangi pernyataan kita berulang kali jika kita menggunakan untuk gelung akan menjadi lebih mudah bagi kita. Seperti ini:

 untuk (tahun dalam c (2000,2001,2002,2003,2004,2005)) cetak (tampal ("Tahun itu", tahun)) "Tahun adalah 2000" "Tahun adalah 2001" "Tahun ini adalah 2002 "" Tahun 2003 "" Tahun 2004 "" Tahun 2005 " 

Semasa Gelung di R

 sementara (ungkapan) pernyataan 

Sekiranya hasil ungkapan itu BENAR, badan gelung dimasukkan. Pernyataan di dalam gelung dilakukan, dan aliran kembali untuk menilai ekspresi sekali lagi. Gelung akan berulang sehingga ungkapan dinilai menjadi SALAH, dalam hal ini gelung keluar.

Contoh loop sementara:

 # i pada mulanya diinisialisasi menjadi 0 i = 0 sementara (i<5)  print (i) i=i+1  Output: 0 1 2 3 4 

Dalam gelung while di atas, ungkapannya adalah i<5yang mengukur ke BENAR kerana 0 kurang dari 5. Oleh itu, badan gelung dilaksanakan, dan i adalah output dan kenaikan. Penting untuk meningkat i di dalam gelung, sehingga entah bagaimana akan memenuhi keadaan pada suatu ketika. Pada gelung seterusnya, nilai i adalah 1, dan gelung berterusan. Ia akan berulang sehingga i sama dengan 5 apabila keadaan 5<5 reached loop will give FALSE and the while loop will exit.

Fungsi R

Untuk membuat a fungsi kami menggunakan fungsi arahan (). Secara khusus, mereka adalah objek R kelas fungsi.

f <- function()  ##some piece of instructions  

Terutama, fungsi dapat diteruskan ke fungsi lain karena argumen dan fungsi dapat bersarang, untuk memungkinkan Anda menentukan fungsi di dalam fungsi lain.

Fungsi secara opsional boleh mempunyai beberapa argumen bernama yang mempunyai nilai lalai. Sekiranya anda tidak mahukan nilai lalai, anda boleh menetapkan nilainya menjadi NULL.

Beberapa fakta mengenai hujah R Fungsi:

#Menentukan Fungsi: f <- function (x, y = 1, z = 2, s= NULL)   

Membuat model regresi logistik dengan set data terbina dalam

The glm () fungsi digunakan dalam R agar sesuai dengan regresi logistik. Fungsi glm () serupa dengan lm () tetapi glm () mempunyai beberapa parameter tambahan. Formatnya seperti ini:

 glm (X ~ Z1 + Z2 + Z3, keluarga = binomial (pautan = "logit"), data = mydata) 

X bergantung pada nilai Z1, Z2, dan Z3. Yang bermaksud Z1, Z2 dan Z3 adalah pemboleh ubah tidak bersandar dan X adalah fungsi yang bergantung kepada keluarga parameter tambahan dan ia mempunyai nilai binomial (link = "logit") yang bermaksud fungsi pautan adalah logit dan kemungkinan taburan model regresi adalah binomial.

Anggaplah kita mempunyai contoh pelajar di mana dia akan mendapat kemasukan berdasarkan dua keputusan peperiksaan. Kumpulan data mengandungi item berikut:

Cara menukar saiz, warna & skema penunjuk dan kursor tetikus pada Windows 10
Penunjuk dan kursor tetikus di Windows 10 adalah aspek yang sangat penting dalam sistem operasi. Ini boleh dikatakan untuk sistem operasi lain juga, j...
Enjin Permainan Sumber Percuma dan Terbuka untuk Membangunkan Permainan Linux
Artikel ini akan merangkumi senarai enjin permainan sumber percuma dan terbuka yang dapat digunakan untuk mengembangkan permainan 2D dan 3D di Linux. ...
Shadow of the Tomb Raider untuk Tutorial Linux
Shadow of the Tomb Raider adalah penambahan kedua belas untuk siri Tomb Raider - francais permainan aksi-pengembaraan yang dibuat oleh Eidos Montreal....