panda

Cara Menggunakan Boxplot di Python

Cara Menggunakan Boxplot di Python
Petak kotak digunakan untuk meringkaskan set data dengan menggunakan kaedah petak kotak dan wisker. Fungsi ini membantu pengguna memahami ringkasan data dengan betul. Petak kotak boleh menjadi sangat berguna ketika kita ingin mengetahui bagaimana data diedarkan dan disebarkan. Tiga jenis kuartil digunakan dalam petak kotak untuk memplot data. Nilai-nilai ini merangkumi nilai statistik median, maksimum, minimum, kuartil atas, dan kuartil bawah. Petak kotak merangkum data ini dalam 25ika, 50ika, dan 75ika persentil. Tutorial ini akan menunjukkan kepada anda cara membuat petak kotak berdasarkan kumpulan data tertentu menggunakan panda dan dasar laut perpustakaan Python.

Prasyarat

Sekiranya anda pengguna Python yang baru, pertama sekali anda harus menyiapkan persekitaran untuk menunjukkan keluaran plot kotak. Anda boleh menggunakan mana-mana jurubahasa Python untuk melaksanakan kod tersebut. Dalam tutorial ini, saya akan menggunakan perisik3 untuk melaksanakan kod. Sekiranya anda belum memasang panda dan dasar laut perpustakaan sebelum ini, maka anda harus menjalankan perintah berikut dari terminal untuk memasang perpustakaan ini:

$ pip3 memasang pandas seaborn

Petak kotak dengan panda

The petak kotak () kaedah panda digunakan untuk menghasilkan angka plot kotak berdasarkan kerangka data. Kaedah ini mengandungi banyak hujah; beberapa hujah ini digunakan dalam contoh di bawah. Bahagian tutorial ini akan merangkumi dua contoh yang akan menunjukkan kepada anda bagaimana membuat kotak petak di panda. Anda boleh menggunakan data yang dihasilkan secara rawak di perpustakaan NumPy, atau data dari fail CSV, untuk menghasilkan plot kotak di panda.

Contoh 1: Petak kotak berdasarkan nilai rawak

Petak kotak dalam contoh berikut dihasilkan menggunakan NumPy dan panda. Perpustakaan NumPy digunakan dalam skrip untuk membuat objek bingkai data dengan menghasilkan susunan dua dimensi nilai rawak yang mengandungi 5 baris dan 5 lajur. Kandungan kerangka data akan dicetak menggunakan kepala () kaedah. Seterusnya, petak kotak () kaedah digunakan untuk menghasilkan petak kotak dengan warna biru, ukuran fon 10, dan sudut putaran 30 darjah untuk menampilkan nilai lajur.

#!/ usr / bin / env python3
# Import perpustakaan panda
import panda sebagai pd
# Import perpustakaan NumPy untuk membuat nombor rawak bagi array
import numpy sebagai np
"
Hasilkan set data berdasarkan array NumPy yang dibuat secara rawak
dan nilai lima lajur
"
kerangka data = pd.DataFrame (np.rawak.randn (5,5), lajur = ['2016', '2017', '2018',
'2019', '2020'])
 
# Cetak nilai-nilai kerangka data
mencetak (kerangka data.kepala ())
# Paparkan plot kotak berdasarkan nilai kerangka data
kerangka data.boxplot (grid = 'false', warna = 'biru', fontsize = 10, rot = 30)

Pengeluaran

Output berikut akan muncul setelah melaksanakan kod.

Contoh 2: Petak kotak berdasarkan data CSV

Petak kotak dalam contoh berikut dihasilkan dari data CSV. Buat fail CSV yang diberi nama bank.csv menggunakan data berikut.

bank.csv

SL, Nama Pelanggan, Jenis_Akaun, Jantina, Baki
1, Maria Hernandez, Menyimpan, Perempuan, 120000
2, Mary Smith, Semasa, Perempuan, 40000
3, David Smith, Semasa, Lelaki, 379000
4, Maria Rodriguez, Menyimpan, Perempuan, 56000
5, Mark Lee, Menyimpan, Lelaki, 93500
6, Jonathan Bing, Semasa, Lelaki, 5900
7, Daniel Williams, Menyimpan, Lelaki, 2300
8, Mike Brown, Semasa, Lelaki, 124888
9, Paul Smith, Semasa, Lelaki, 59450
10, Maria Lopez, Menyimpan, Perempuan, 487600

Dalam skrip berikut, matplotlib perpustakaan digunakan untuk mengatur ukuran gambar plot kotak dan untuk menampilkan output sebaris. Semua rekod mengenai Bank.csv fail dimuat menggunakan baca_csv () kaedah panda. 8 rekod pertama kerangka data kemudian dicetak menggunakan kepala () kaedah. The petak kotak () kaedah digunakan dalam pernyataan berikut untuk melukis gambar kotak kotak menggunakan warna merah berdasarkan 'Jenis Akaun' dengan lajur bernama 'Seimbang.'

#!/ usr / bin / env python3
# Import panda untuk menghasilkan plot kotak
import panda sebagai pd
# Import matplotlib untuk menetapkan ukuran gambar kotak kotak
import matplotlib.pyplot sebagai plt
# Import get_ipython untuk memformat output sebaris
dari IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'sebaris')
# Sediakan ukuran angka
plt.rcParams ['angka.ara '] = (8,4)
# Muatkan set data dari fail CSV
df = pd.read_csv ("bank.csv ")
# Cetak 8 baris pertama data yang dimuat
mencetak (df.kepala (8))
# Paparkan petak kotak berdasarkan parameter yang digunakan
df.boxplot (mengikut = 'Account_Type', grid = 'True', column = ['Balance'], color = 'red')

Pengeluaran

Output berikut akan muncul setelah melaksanakan kod.

Petak kotak dengan dasar laut

Perpustakaan lain Python yang biasa digunakan untuk melukis kotak kotak ialah perpustakaan dasar laut.  Salah satu ciri penting perpustakaan ini ialah ia mempunyai banyak kumpulan data sampel bawaan untuk menguji tugas yang berbeza. Dua contoh seterusnya akan merangkumi penggunaan dua set data sampel yang berbeza untuk menarik plot kotak menggunakan dasar laut perpustakaan.

Contoh 3: Petak kotak berdasarkan parameter x

Contoh berikut menggunakan contoh dataset, bernama 'berlian, ' dari dasar laut perpustakaan untuk menghasilkan plot kotak. Di sini, gaya grid ditakrifkan menggunakan set_style () kaedah. The muat_dataset () kaedah digunakan untuk memuat data 'berlian ' set data. Lima rekod pertama dicetak dari set data dan petak kotak () kaedah kemudian digunakan untuk menggambar plot kotak berdasarkan lajur, bernama 'kedalaman,'dengan warna biru.

# Import perpustakaan laut untuk menghasilkan plot kotak
import seaborn sebagai sns
# Import matplotlib untuk mengatur ukuran ukuran plot kotak
import matplotlib.pyplot sebagai plt
# Import get_ipython untuk memformat output sebaris
dari IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'sebaris')
# Siapkan gaya grid
sns.set_style ("whitegrid")
# Sediakan ukuran angka
plt.rcParams ['angka.figsize '] = (8,4)
# Muatkan set data sampel
intan_dataset = sns.load_dataset ('berlian')
# Paparkan 5 rekod pertama set data
cetak (berlian_dataset.kepala ())
# Lukiskan gambar petak kotak
sns.boxplot (x = berlian_dataset ['kedalaman'], warna = 'biru')

Pengeluaran

Output berikut akan muncul setelah melaksanakan kod.

Contoh 4: Petak kotak berdasarkan parameter x dan y

Contoh berikut menggunakan contoh set data bernama 'penerbangan'untuk menarik plot kotak. Di sini, kedua-dua parameter x dan y dari petak kotak () kaedah digunakan untuk melukis angka. Pernyataan lain serupa dengan contoh sebelumnya.

# Import perpustakaan laut untuk menghasilkan plot kotak
import seaborn sebagai sns
# Import matplotlib untuk menetapkan ukuran gambar kotak kotak
import matplotlib.pyplot sebagai plt
# Import get_ipython untuk memformat output sebaris
dari IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'sebaris')
 
# Siapkan gaya grid
sns.set_style ("darkgrid")
# Sediakan ukuran angka
plt.rcParams ['angka.figsize '] = (12,4)
 
# Muatkan set data sampel
flight_dataset = sns.load_dataset ('penerbangan')
# Paparkan 5 rekod pertama set data
cetak (flight_dataset.kepala ())
 
# Lukiskan gambar petak kotak
sns.boxplot (x = 'bulan', y = 'penumpang', data = flight_dataset, warna = 'biru')

Pengeluaran

Output berikut akan muncul setelah melaksanakan kod.

Kesimpulannya

Semasa bekerja dengan sejumlah besar data, anda mungkin ingin merangkum data dengan menggunakan gambar rajah, seperti plot kotak. Tutorial ini menggunakan beberapa contoh untuk menunjukkan kepada anda cara menghasilkan plot kotak dengan dua perpustakaan Python.

Emulator Konsol Permainan Terbaik untuk Linux
Artikel ini akan menyenaraikan perisian emulasi konsol permainan popular yang tersedia untuk Linux. Emulation adalah lapisan keserasian perisian yang ...
Distro Linux Terbaik untuk Permainan pada tahun 2021
Sistem operasi Linux telah jauh dari tampilan asal, ringkas dan berasaskan pelayan. OS ini telah berkembang pesat dalam beberapa tahun kebelakangan in...
Cara menangkap dan streaming sesi permainan anda di Linux
Pada masa lalu, bermain permainan hanya dianggap sebagai hobi, tetapi seiring dengan berjalannya waktu, industri permainan menyaksikan pertumbuhan yan...