Prasyarat
Sekiranya anda pengguna Python yang baru, pertama sekali anda harus menyiapkan persekitaran untuk menunjukkan keluaran plot kotak. Anda boleh menggunakan mana-mana jurubahasa Python untuk melaksanakan kod tersebut. Dalam tutorial ini, saya akan menggunakan perisik3 untuk melaksanakan kod. Sekiranya anda belum memasang panda dan dasar laut perpustakaan sebelum ini, maka anda harus menjalankan perintah berikut dari terminal untuk memasang perpustakaan ini:
$ pip3 memasang pandas seabornPetak kotak dengan panda
The petak kotak () kaedah panda digunakan untuk menghasilkan angka plot kotak berdasarkan kerangka data. Kaedah ini mengandungi banyak hujah; beberapa hujah ini digunakan dalam contoh di bawah. Bahagian tutorial ini akan merangkumi dua contoh yang akan menunjukkan kepada anda bagaimana membuat kotak petak di panda. Anda boleh menggunakan data yang dihasilkan secara rawak di perpustakaan NumPy, atau data dari fail CSV, untuk menghasilkan plot kotak di panda.
Contoh 1: Petak kotak berdasarkan nilai rawak
Petak kotak dalam contoh berikut dihasilkan menggunakan NumPy dan panda. Perpustakaan NumPy digunakan dalam skrip untuk membuat objek bingkai data dengan menghasilkan susunan dua dimensi nilai rawak yang mengandungi 5 baris dan 5 lajur. Kandungan kerangka data akan dicetak menggunakan kepala () kaedah. Seterusnya, petak kotak () kaedah digunakan untuk menghasilkan petak kotak dengan warna biru, ukuran fon 10, dan sudut putaran 30 darjah untuk menampilkan nilai lajur.
#!/ usr / bin / env python3# Import perpustakaan panda
import panda sebagai pd
# Import perpustakaan NumPy untuk membuat nombor rawak bagi array
import numpy sebagai np
"
Hasilkan set data berdasarkan array NumPy yang dibuat secara rawak
dan nilai lima lajur
"
kerangka data = pd.DataFrame (np.rawak.randn (5,5), lajur = ['2016', '2017', '2018',
'2019', '2020'])
# Cetak nilai-nilai kerangka data
mencetak (kerangka data.kepala ())
# Paparkan plot kotak berdasarkan nilai kerangka data
kerangka data.boxplot (grid = 'false', warna = 'biru', fontsize = 10, rot = 30)
Pengeluaran
Output berikut akan muncul setelah melaksanakan kod.
Contoh 2: Petak kotak berdasarkan data CSV
Petak kotak dalam contoh berikut dihasilkan dari data CSV. Buat fail CSV yang diberi nama bank.csv menggunakan data berikut.
bank.csv
SL, Nama Pelanggan, Jenis_Akaun, Jantina, Baki1, Maria Hernandez, Menyimpan, Perempuan, 120000
2, Mary Smith, Semasa, Perempuan, 40000
3, David Smith, Semasa, Lelaki, 379000
4, Maria Rodriguez, Menyimpan, Perempuan, 56000
5, Mark Lee, Menyimpan, Lelaki, 93500
6, Jonathan Bing, Semasa, Lelaki, 5900
7, Daniel Williams, Menyimpan, Lelaki, 2300
8, Mike Brown, Semasa, Lelaki, 124888
9, Paul Smith, Semasa, Lelaki, 59450
10, Maria Lopez, Menyimpan, Perempuan, 487600
Dalam skrip berikut, matplotlib perpustakaan digunakan untuk mengatur ukuran gambar plot kotak dan untuk menampilkan output sebaris. Semua rekod mengenai Bank.csv fail dimuat menggunakan baca_csv () kaedah panda. 8 rekod pertama kerangka data kemudian dicetak menggunakan kepala () kaedah. The petak kotak () kaedah digunakan dalam pernyataan berikut untuk melukis gambar kotak kotak menggunakan warna merah berdasarkan 'Jenis Akaun' dengan lajur bernama 'Seimbang.'
#!/ usr / bin / env python3# Import panda untuk menghasilkan plot kotak
import panda sebagai pd
# Import matplotlib untuk menetapkan ukuran gambar kotak kotak
import matplotlib.pyplot sebagai plt
# Import get_ipython untuk memformat output sebaris
dari IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'sebaris')
# Sediakan ukuran angka
plt.rcParams ['angka.ara '] = (8,4)
# Muatkan set data dari fail CSV
df = pd.read_csv ("bank.csv ")
# Cetak 8 baris pertama data yang dimuat
mencetak (df.kepala (8))
# Paparkan petak kotak berdasarkan parameter yang digunakan
df.boxplot (mengikut = 'Account_Type', grid = 'True', column = ['Balance'], color = 'red')
Pengeluaran
Output berikut akan muncul setelah melaksanakan kod.
Petak kotak dengan dasar laut
Perpustakaan lain Python yang biasa digunakan untuk melukis kotak kotak ialah perpustakaan dasar laut. Salah satu ciri penting perpustakaan ini ialah ia mempunyai banyak kumpulan data sampel bawaan untuk menguji tugas yang berbeza. Dua contoh seterusnya akan merangkumi penggunaan dua set data sampel yang berbeza untuk menarik plot kotak menggunakan dasar laut perpustakaan.
Contoh 3: Petak kotak berdasarkan parameter x
Contoh berikut menggunakan contoh dataset, bernama 'berlian, ' dari dasar laut perpustakaan untuk menghasilkan plot kotak. Di sini, gaya grid ditakrifkan menggunakan set_style () kaedah. The muat_dataset () kaedah digunakan untuk memuat data 'berlian ' set data. Lima rekod pertama dicetak dari set data dan petak kotak () kaedah kemudian digunakan untuk menggambar plot kotak berdasarkan lajur, bernama 'kedalaman,'dengan warna biru.
# Import perpustakaan laut untuk menghasilkan plot kotakimport seaborn sebagai sns
# Import matplotlib untuk mengatur ukuran ukuran plot kotak
import matplotlib.pyplot sebagai plt
# Import get_ipython untuk memformat output sebaris
dari IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'sebaris')
# Siapkan gaya grid
sns.set_style ("whitegrid")
# Sediakan ukuran angka
plt.rcParams ['angka.figsize '] = (8,4)
# Muatkan set data sampel
intan_dataset = sns.load_dataset ('berlian')
# Paparkan 5 rekod pertama set data
cetak (berlian_dataset.kepala ())
# Lukiskan gambar petak kotak
sns.boxplot (x = berlian_dataset ['kedalaman'], warna = 'biru')
Pengeluaran
Output berikut akan muncul setelah melaksanakan kod.
Contoh 4: Petak kotak berdasarkan parameter x dan y
Contoh berikut menggunakan contoh set data bernama 'penerbangan'untuk menarik plot kotak. Di sini, kedua-dua parameter x dan y dari petak kotak () kaedah digunakan untuk melukis angka. Pernyataan lain serupa dengan contoh sebelumnya.
# Import perpustakaan laut untuk menghasilkan plot kotakimport seaborn sebagai sns
# Import matplotlib untuk menetapkan ukuran gambar kotak kotak
import matplotlib.pyplot sebagai plt
# Import get_ipython untuk memformat output sebaris
dari IPython import get_ipython
get_ipython ().run_line_magic ('matplotlib', 'sebaris')
# Siapkan gaya grid
sns.set_style ("darkgrid")
# Sediakan ukuran angka
plt.rcParams ['angka.figsize '] = (12,4)
# Muatkan set data sampel
flight_dataset = sns.load_dataset ('penerbangan')
# Paparkan 5 rekod pertama set data
cetak (flight_dataset.kepala ())
# Lukiskan gambar petak kotak
sns.boxplot (x = 'bulan', y = 'penumpang', data = flight_dataset, warna = 'biru')
Pengeluaran
Output berikut akan muncul setelah melaksanakan kod.
Kesimpulannya
Semasa bekerja dengan sejumlah besar data, anda mungkin ingin merangkum data dengan menggunakan gambar rajah, seperti plot kotak. Tutorial ini menggunakan beberapa contoh untuk menunjukkan kepada anda cara menghasilkan plot kotak dengan dua perpustakaan Python.