Data Set dari Seaborn Untuk Belajar Data Science
Daftar Isi | |
---|---|
1. | Seaborn Load Dataset |
2. | Proses Load Dataset Seaborn |
Tidak dapat dipungkiri, data adalah salah satu bagian penting untuk belajar data science. Tanpa data, berbagai proses data science, seperti data cleaning, EDA, dan machine learning tidak dapat dilakukan.
Seringkali, sebagai pemula dalam data science, akan merasa bingung dimana mendapatkan data tersebut. Kalaupun ada data gratis, bisa jadi agak repot dalam proses download dan import data. Untungnya, seaborn menyediakan function load_dataset untuk mengambil data secara gratis dengan proses import yang sangat mudah.
Seaborn Load Data Set
Seaborn terkenal sebagai sebuah modul python yang dapat digunakan untuk membuat berbagai grafik dengan tampilan yang indah. Penggunannya pun tidak kalah mudah dengan matplotlib.
Selain grafik, seaborn ternyata menyediakan function load_data untuk menggunakan data-data gratis yang umum digunakan dalam belajar data science. Salah satunya dataset "iris" yang sering muncul pada buku data science, dan data set "titanic" yang dipakai pada kaggle.
Selain proses importnya yang mudah, hasil dari import data tersebut adalah data frame pandas. Sehingga, hasil load data bisa langsung digunakan untuk berbagai proses, seperti cleaning data, EDA, plot grafik, dan machine learning.
Proses Load Data Set Seaborn
Syntax load data seaborn cukup sederhana, seperti di bawah ini:
1 import seaborn as sns
2 data = sns.load_dataset("nama_dataset")
2 data = sns.load_dataset("nama_dataset")
pertama pastikan dulu seaborn sudah terinstall. Kemudian import seaborn sebagai sns. Kemudian, load "nama_dataset" sesuai dengan data yang ingin di-load, dan disimpan dalam variabel data.
Berikut ini adalah contoh load dataset "iris" dan menampilkan beberapa baris awal datanya.
1 import seaborn as sns
2 data = sns.load_dataset("iris")
3 data.head()
2 data = sns.load_dataset("iris")
3 data.head()
Data set "iris" yang sudah di-load disimpan pada variabel data sebagai pandas data frame. Kemudian ditampilkan 5 baris data pertama menggunakan method .head(), hasilnya seperti ini:
Data Set Seaborn Mudah Untuk Belajar
Dengan sekali proses, langsung muncul data frame pandas lengkap dengan index dan nama kolomnya. Proses nya lebih sederhana dari import data csv menggunakan pandas. Dimana biasanya, harus ditentukan index, dan nama kolomnya.
Dengan kemudahan tersebut, data set dari seaborn cocok digunakan untuk yang baru mulai belajar Data Science.
Posting Komentar untuk "Data Set dari Seaborn Untuk Belajar Data Science"