Sains Data

Tutorial Python Seaborn

Tutorial Python Seaborn
Dalam pelajaran ini mengenai perpustakaan Python Seaborn, kita akan melihat pelbagai aspek perpustakaan visualisasi data ini yang dapat kita gunakan dengan Python untuk menghasilkan grafik yang indah dan intuitif yang dapat memvisualisasikan data dalam bentuk yang diinginkan perniagaan dari platform. Untuk melengkapkan pelajaran ini, kami akan merangkumi bahagian berikut:

Ini kelihatan seperti banyak yang perlu dilindungi. Mari kita mulakan sekarang.

Apakah perpustakaan Python Seaborn?

Perpustakaan Seaborn adalah pakej Python yang membolehkan kita membuat infografik berdasarkan data statistik. Oleh kerana ia dibuat di atas matplotlib, maka ia semestinya sesuai dengannya. Selain itu, ia menyokong struktur data NumPy dan Pandas supaya plot dapat dilakukan secara langsung dari koleksi tersebut.

Memvisualisasikan data yang kompleks adalah salah satu perkara terpenting yang dijaga oleh Seaborn. Sekiranya kita membandingkan Matplotlib dengan Seaborn, Seaborn dapat mempermudah perkara-perkara yang sukar dicapai dengan Matplotlib. Walau bagaimanapun, penting untuk diperhatikan bahawa Seaborn bukan alternatif untuk Matplotlib tetapi pelengkap daripadanya. Sepanjang pelajaran ini, kami juga akan menggunakan fungsi Matplotlib dalam coretan kod. Anda akan memilih untuk bekerja dengan Seaborn dalam kes penggunaan berikut:

Cuma nota sebelum memulakan adalah bahawa kita menggunakan persekitaran maya untuk pelajaran ini yang kita buat dengan arahan berikut:

python -m virtualenv seaborn
sumber laut / tong sampah / aktifkan

Setelah persekitaran maya aktif, kita dapat memasang perpustakaan Seaborn dalam env maya sehingga contoh yang kita buat seterusnya dapat dilaksanakan:

pip pasang laut

Anda juga boleh menggunakan Anaconda untuk menjalankan contoh-contoh ini yang lebih mudah. Sekiranya anda ingin memasangnya di mesin anda, lihat pelajaran yang menerangkan “Cara Memasang Anaconda Python di Ubuntu 18.04 LTS ”dan kongsi maklum balas anda. Sekarang, mari kita maju ke pelbagai jenis plot yang boleh dibina dengan Python Seaborn.

Menggunakan Poket Dataset

Untuk terus mengikuti pelajaran ini, Kami akan menggunakan set data Pokemon yang boleh dimuat turun dari Kaggle. Untuk mengimport set data ini ke dalam program kami, kami akan menggunakan perpustakaan Pandas. Berikut adalah semua import yang kami lakukan dalam program kami:

import panda sebagai pd
dari matplotlib import pyplot sebagai plt
import seaborn sebagai sns

Sekarang, kita dapat mengimport set data ke dalam program kita dan menunjukkan beberapa contoh data dengan Pandas sebagai:

df = pd.read_csv ('Pokemon.csv ', index_col = 0)
df.kepala ()

Perhatikan bahawa untuk menjalankan coretan kod di atas, set data CSV harus ada dalam direktori yang sama dengan program itu sendiri. Sebaik sahaja kami menjalankan coretan kod di atas, kami akan melihat output berikut (di buku nota Anaconda Jupyter):

Merangka keluk Regresi Linear

Salah satu perkara terbaik mengenai Seaborn adalah fungsi merancang cerdas yang disediakannya yang tidak hanya memvisualisasikan set data yang kami sediakan kepadanya tetapi juga membina model regresi di sekitarnya. Sebagai contoh, adalah mungkin untuk membina plot regresi linear dengan satu baris kod. Inilah cara untuk melakukan ini:

sns.lmplot (x = 'Serangan', y = 'Pertahanan', data = df)

Setelah kami menjalankan coretan kod di atas, kami akan melihat output berikut:

Kami melihat beberapa perkara penting dalam coretan kod di atas:

Jangan takut jika anda fikir kami tidak dapat memiliki plot tanpa garis regresi itu. Kita boleh ! Mari cuba coretan kod baru sekarang, serupa dengan yang terakhir:

sns.lmplot (x = 'Attack', y = 'Defense', data = df, fit_reg = Salah)

Kali ini, kita tidak akan melihat garis regresi di plot kita:

Sekarang ini lebih jelas (jika kita tidak memerlukan garis regresi linier). Tetapi ini belum selesai. Seaborn membolehkan kita membuat perbezaan plot ini dan itulah yang akan kita lakukan.

Membina Petak Kotak

Salah satu ciri terbaik di Seaborn adalah bagaimana ia dengan mudah menerima struktur Pandas Dataframes untuk merancang data. Kita hanya dapat menyampaikan Dataframe ke perpustakaan Seaborn sehingga dapat membina kotak kotak daripadanya:

sns.boxplot (data = df)

Setelah kami menjalankan coretan kod di atas, kami akan melihat output berikut:

Kita dapat membuang jumlah bacaan pertama kerana kelihatan agak janggal ketika kita benar-benar merancang lajur individu di sini:

stats_df = df.penurunan (['Total'], paksi = 1)
# Boxplot baru menggunakan stats_df
sns.boxplot (data = stats_df)

Setelah kami menjalankan coretan kod di atas, kami akan melihat output berikut:

Petak Berkumpulan dengan Seaborn

Kita boleh membina plot Swarm reka bentuk intuitif dengan Seaborn. Kami sekali lagi akan menggunakan kerangka data dari Pandas yang kami muatkan lebih awal tetapi kali ini, kami akan memanggil fungsi pertunjukan Matplotlib untuk menunjukkan plot yang kami buat. Berikut adalah coretan kod:

sns.set_context ("kertas")
sns.swarmplot (x = "Serangan", y = "Pertahanan", data = df)
plt.tunjuk ()

Setelah kami menjalankan coretan kod di atas, kami akan melihat output berikut:

Dengan menggunakan konteks Seaborn, kami membenarkan Seaborn menambahkan rekaan sentuhan dan cecair peribadi untuk plot. Adalah mungkin untuk menyesuaikan plot ini lebih jauh dengan ukuran fon khusus yang digunakan untuk label di plot untuk memudahkan pembacaan. Untuk melakukan ini, kita akan meneruskan lebih banyak parameter ke fungsi set_context yang berfungsi seperti apa yang mereka bunyikan. Sebagai contoh, untuk mengubah saiz fon label, kami akan menggunakan fon.parameter ukuran. Berikut adalah coretan kod untuk melakukan pengubahsuaian:

sns.set_context ("kertas", font_scale = 3, rc = "fon.ukuran ": 8," paksi.labelsize ": 5)
sns.swarmplot (x = "Serangan", y = "Pertahanan", data = df)
plt.tunjuk ()

Setelah kami menjalankan coretan kod di atas, kami akan melihat output berikut:

Ukuran fon untuk label diubah berdasarkan parameter yang kami berikan dan nilai yang berkaitan dengan font.parameter ukuran. Satu perkara yang ahli Seaborn mahukan adalah membuat plot itu sangat intuitif untuk penggunaan praktikal dan ini bermaksud bahawa Seaborn bukan hanya pakej latihan Python tetapi sebenarnya sesuatu yang dapat kita gunakan dalam penggunaan produksi kita.

Menambah Tajuk pada petak

Sangat mudah untuk menambahkan tajuk ke plot kami. Kita hanya perlu mengikuti prosedur mudah menggunakan fungsi Axes-level di mana kita akan memanggilnya set_title () berfungsi seperti yang ditunjukkan dalam coretan kod di sini:

sns.set_context ("kertas", font_scale = 3, rc = "fon.ukuran ": 8," paksi.labelsize ": 5)
my_plot = sns.swarmplot (x = "Serangan", y = "Pertahanan", data = df)
my_plot.set_title ("LH Swarm Plot")
plt.tunjuk ()

Setelah kami menjalankan coretan kod di atas, kami akan melihat output berikut:

Dengan cara ini, kita dapat menambahkan lebih banyak maklumat ke plot kita.

Seaborn vs Matplotlib

Ketika kita melihat contoh-contoh dalam pelajaran ini, kita dapat mengenal pasti bahawa Matplotlib dan Seaborn tidak dapat dibandingkan secara langsung tetapi mereka dapat dilihat saling melengkapi. Salah satu ciri yang mengambil Seaborn 1 langkah ke depan adalah cara Seaborn dapat memvisualisasikan data secara statistik.

Untuk memanfaatkan parameter Seaborn dengan sebaik-baiknya, kami sangat mengesyorkan untuk melihat dokumentasi Seaborn dan mengetahui parameter apa yang akan digunakan untuk menjadikan plot anda sedekat mungkin dengan keperluan perniagaan.

Kesimpulannya

Dalam pelajaran ini, kami melihat pelbagai aspek perpustakaan visualisasi data ini yang dapat kami gunakan dengan Python untuk menghasilkan grafik yang indah dan intuitif yang dapat memvisualisasikan data dalam bentuk yang diinginkan oleh perniagaan dari platform. Seaborm adalah salah satu perpustakaan visualisasi yang paling penting ketika datang ke kejuruteraan data dan menyajikan data dalam kebanyakan bentuk visual, pastinya kemahiran yang perlu kita miliki kerana membolehkan kita membina model regresi linier.

Sila kongsi maklum balas anda mengenai pelajaran di Twitter dengan @sbmaggarwal dan @LinuxHint.

Cara Menggunakan AutoKey untuk Mengautomasikan Permainan Linux
AutoKey adalah utiliti automasi desktop untuk Linux dan X11, yang diprogramkan dalam Python 3, GTK dan Qt. Dengan menggunakan skrip dan fungsi MACRO, ...
Cara Menunjukkan Kaunter FPS dalam Permainan Linux
Permainan Linux mendapat dorongan utama ketika Valve mengumumkan sokongan Linux untuk klien Steam dan permainan mereka pada tahun 2012. Sejak itu, ban...
Cara memuat turun dan Mainkan Sid Meier's Civilization VI di Linux
Pengenalan permainan Civilization 6 adalah konsep moden mengenai konsep klasik yang diperkenalkan dalam siri permainan Age of Empires. Idea itu cukup ...