panda

Cara Memplot Data di Pandas Python

Cara Memplot Data di Pandas Python
Visualisasi data memainkan peranan penting dalam analisis data. Pandas adalah perpustakaan analisis data yang kuat di python untuk sains data. Ia menyediakan pelbagai pilihan untuk visualisasi data dengan .kaedah plot (). Walaupun anda seorang pemula, anda dapat memplot data anda dengan mudah menggunakan perpustakaan Pandas. Anda perlu mengimport panda dan matplotlib.pakej pyplot untuk visualisasi data.

Dalam artikel ini, kita akan meneroka pelbagai kaedah plot data dengan menggunakan python Pandas. Kami telah melaksanakan semua contoh pada editor kod sumber pycharm dengan menggunakan matplotlib.pakej pyplot.

Memplot di Pandas Python

Di Pandas, the .plot () mempunyai beberapa parameter yang boleh anda gunakan berdasarkan keperluan anda. Selalunya, dengan menggunakan parameter 'kind', anda dapat menentukan jenis plot yang akan anda buat.

Sintaks untuk Memplot Data menggunakan Pandas Python

Sintaks berikut digunakan untuk merancang DataFrame di Pandas Python:

# import panda dan matplotlib.Pakej pyplot
import panda sebagai pd
import matplotlib.pyplot sebagai plt
# Siapkan Data untuk membuat DataFrame
data_frame =
'Column1': ['field1', 'field2', 'field3', 'field4', ...],
'Column2': ['field1', 'field2', 'field3', 'field4',…]

var_df = pd.DataFrame (data_frame, kolum = ['Column1', 'Column2])
cetak (Pembolehubah)
# memplot graf bar
var_df.plot.bar (x = 'Lajur1', y = 'Lajur2')
plt.tunjuk ()

Anda juga dapat menentukan jenis plot dengan menggunakan parameter jenis seperti berikut:

var_df.petak (x = 'Column1', y = 'Column2', kind = 'bar')

Objek Pandas DataFrames mempunyai kaedah plot berikut untuk membuat plot:

Sekiranya pengguna hanya menggunakan kaedah plot () tanpa menggunakan parameter apa pun maka, ia membuat grafik garis lalai.

Kami sekarang akan menghuraikan beberapa jenis plot utama secara terperinci dengan bantuan beberapa contoh.

Penyebaran Penyebaran di Pandas

Dalam jenis plot ini, kami telah menunjukkan hubungan antara dua pemboleh ubah. Mari kita ambil contoh.

Contohnya

Sebagai contoh, kami mempunyai data korelasi antara dua pemboleh ubah GDP_growth dan Oil_price. Untuk merancang hubungan antara dua pemboleh ubah, kami telah melaksanakan sekeping kod berikut pada editor kod sumber kami:

import matplotlib.pyplot sebagai plt
import panda sebagai pd
gdp_cal = pd.DataFrame (
'Pertumbuhan KDNK': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Harga_ Minyak': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, column = ['Oil_Price', 'GDP_growth']))
cetak (df)
df.plot (x = 'Harga_ Minyak', y = 'Pertumbuhan PDB', jenis = 'penyebaran', warna = 'merah')
plt.tunjuk ()

Petak Carta Garisan di Pandas  

Plot carta garis adalah jenis plot asas di mana paparan maklumat yang diberikan dalam siri titik data yang dihubungkan lebih jauh oleh segmen garis lurus. Dengan menggunakan carta Garisan, anda juga dapat menunjukkan tren maklumat lebih masa.

Contohnya

Dalam contoh yang disebutkan di bawah, kami telah mengambil data mengenai kadar inflasi tahun lalu. Pertama, sediakan data dan kemudian buat DataFrame. Kod sumber berikut menunjukkan graf garis data yang tersedia:

import panda sebagai pd
import matplotlib.pyplot sebagai plt
infl_cal = 'Tahun': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (infl_cal, lajur = ['Tahun', 'Infl_Rate'])
data_frame.plot (x = 'Tahun', y = 'Infl_Rate', kind = 'line')
plt.tunjuk ()

Dalam contoh di atas, anda perlu menetapkan kind = 'line' untuk plot carta garis.

Kaedah 2 # Menggunakan plot.kaedah garis ()

Contoh di atas, anda juga boleh melaksanakan menggunakan kaedah berikut:

import panda sebagai pd
import matplotlib.pyplot sebagai plt
inf_cal = 'Tahun': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, kolum = ['Inflation_Rate'], indeks = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
data_frame.plot.garis ()
plt.tajuk ('Ringkasan Kadar Inflasi 11 Tahun yang lalu')
plt.ylabel ('Inflation_Rate')
plt.xlabel ('Tahun')
plt.tunjuk ()

Graf garis berikut akan dipaparkan setelah menjalankan kod di atas:

Penempatan Carta Bar di Pandas

Perancangan carta palang digunakan untuk mewakili data kategori. Dalam plot jenis ini, bar segi empat dengan ketinggian yang berbeza diplotkan berdasarkan maklumat yang diberikan. Carta palang boleh diplot dalam dua arah mendatar atau menegak yang berbeza.

Contohnya

Kami telah mengambil kadar literasi beberapa negara dalam contoh berikut. DataFrames dibuat di mana 'Country_Names' dan 'literacy_Rate' adalah dua lajur DataFrame. Dengan menggunakan Pandas, anda dapat memetakan maklumat dalam bentuk graf bar seperti berikut:

import panda sebagai pd
import matplotlib.pyplot sebagai plt
lit_cal =
'Country_Names': ['Pakistan', 'USA', 'China', 'India', 'UK', 'Austria', 'Mesir', 'Ukraine', 'Saudia', 'Australia',
'Malaysia'],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (lit_cal, kolum = ['Country_Names', 'litr_Rate'])
mencetak (bingkai_ data)
data_frame.plot.bar (x = 'Nama_Negara', y = 'litr_Rate')
plt.tunjuk ()

Anda juga boleh melaksanakan contoh di atas menggunakan kaedah berikut. Tetapkan jenis = "bar" untuk carta bar yang merancang dalam baris ini:

data_frame.plot (x = 'Country_Names', y = 'litr_Rate', kind = 'bar')
plt.tunjuk ()

Merangka carta palang melintang

Anda juga boleh memplot data pada bar mendatar dengan melaksanakan kod berikut:

import matplotlib.pyplot sebagai plt
import panda sebagai pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (carta data, lajur = ['litr_Rate'], indeks = ['Pakistan', 'AS', 'China', 'India', 'UK', 'Austria', 'Mesir', 'Ukraine', 'Saudia' , 'Australia',
'Malaysia'])
df.plot.barh ()
plt.tajuk ('Kadar Literasi di Pelbagai Negara')
plt.ylabel ('Nama_Negara')
plt.xlabel ('litr_Rate')
plt.tunjuk ()

Di df.plot.barh (), barh digunakan untuk plot mendatar. Setelah menjalankan kod di atas, carta bar berikut dipaparkan di tetingkap:

Penetapan Carta Pai di Pandas

Carta pai mewakili data dalam bentuk grafik bulat di mana data dipaparkan menjadi kepingan berdasarkan kuantiti yang diberikan.

Contohnya

Dalam contoh berikut, kami telah memaparkan maklumat mengenai 'Earth_material' dalam kepingan yang berbeza pada carta pai. Pertama, buat DataFrame, kemudian, dengan menggunakan panda, paparkan semua butiran pada grafik.

import panda sebagai pd
import matplotlib.pyplot sebagai plt
material_per = 'Earth_Part': [71,18,7,4]
kerangka data = pd.DataFrame (material_per, kolum = ['Earth_Part'], indeks = ['Air', 'Mineral', 'Pasir', 'Logam'])
kerangka data.plot.pai (y = 'Earth_Part', figsize = (7, 7), autopct = '% 1.1f %% ', segi tiga = 90)
plt.tunjuk ()

Kod sumber di atas memaparkan graf pai data yang ada:

Kesimpulannya

Dalam artikel ini, anda telah melihat bagaimana merancang DataFrames di Pandas python. Pelbagai jenis plot dilakukan dalam artikel di atas. Untuk merancang lebih banyak jenis seperti kotak, hexbin, hist, kde, density, area, dll., anda boleh menggunakan kod sumber yang sama hanya dengan menukar jenis plot.

Cara menukar saiz, warna & skema penunjuk dan kursor tetikus pada Windows 10
Penunjuk dan kursor tetikus di Windows 10 adalah aspek yang sangat penting dalam sistem operasi. Ini boleh dikatakan untuk sistem operasi lain juga, j...
Enjin Permainan Sumber Percuma dan Terbuka untuk Membangunkan Permainan Linux
Artikel ini akan merangkumi senarai enjin permainan sumber percuma dan terbuka yang dapat digunakan untuk mengembangkan permainan 2D dan 3D di Linux. ...
Shadow of the Tomb Raider untuk Tutorial Linux
Shadow of the Tomb Raider adalah penambahan kedua belas untuk siri Tomb Raider - francais permainan aksi-pengembaraan yang dibuat oleh Eidos Montreal....