Lompat ke konten Lompat ke sidebar Lompat ke footer

Tools yang Digunakan dalam Data Science

Daftar Isi
1. Anaconda
2. Jupyter Notebook
3. Pandas
4. Matplotlib
5. Numpy
6. Scikit Learn

Sebagai sebuah proses, data science membutuhkan berbagai macam tools. Mulai dari python sebagai bahasa pemrogramannya, tools untuk membuat data frame, plot data, machine learning, dan lain sebagainya.

data_science_tools

Jika dilihat semua, akan banyak sekali tools yang bisa menjadi pilihan, sesuai dengan kondisi. Karena itu, akan coba dilist beberapa tools yang umum digunakan dan harus ada jika ingin belajar dasar data science menggunakan python.

Karena menggunakan python, semua tools yang ada di list ini bisa didapatkan dengan gratis dan mudah. So, ga usah khawatir ya.

1. Anaconda

by anaconda

Anaconda adalah salah satu bentuk distribusi python yang paling terkenal. Distribusi ini menekankan pada kemudahan instalasi serta penambahan modul-modul tambahan (wikipedia).

Jadi, bagi yang baru belajar python dan data science akan sangat terbantu ketika menggunakan anaconda. Apalagi menurut www.anaconda.com, terdapat lebih dari 7500 modul data science dan machine learning yang siap untuk diinstall dan digunakan.


2. Jupyter Notebook

by jupyter.org

Jupyter notebook adalah sebuah aplikasi berbasis web yang mampu membuat dokumen yang berisi live code, visualisasi, dan text (jupyter.org).

Dengan aplikasi ini, hasil dari script python yang dibuat dapat ditampilkan seperti sebuah dokumen. Contohnya seperti dibawah ini.

Contoh dokumen Jupyter NotebookTambahkan teks

Disitu terlihat, bahwa Jupyter Notebook tidak hanya mampu mengeksekusi script python seperti kebanyakan python IDE. 

Sebelum menambahkan script, bisa ditambahkan text untuk menunjukkan judul script hingga penjelasan dari script tersebut. Kemudian setelah scriptnya di run, hasilnya akan muncul seperti text. Setelah itu bisa ditambahkan lagi di bawahnya sebuah text untuk menganilis hasil dari script yang sudah dirun.

Dengan aplikasi ini, proses analisis data science akan jauh lebih sistematis dibandingkan menggunakan terminal IDE python pada umumnya.


3. Pandas

by pandas.pydata.org
 
Layaknya sebuah matriks, data yang digunakan pada data science pada umunya disimpan dalam sebuah data frame. Salah satu program yang paling populer adalah Pandas.

Pada dasarnya, pandas tidak hanya untuk membuat data frame, tapi dapat digunakan untuk analisis dan manipulasi data (pandas.pydata.org). Fiturnya pun cukup lengkap, mulai dari sorting data, hingga filter data menggunakan Regex.


4. Matplotlib

by matplotlib.org

Matplotlib adalah program yang digunakan untuk plot data. Program ini akan sangat membantu dalam proses analisis data. Berbagai jenis plot pun dapat dilakukan, seperti scatter, line plot, hingga histogram.


5. Numpy

by numpy.org

Data science tidak akan terlepas dari yang namanya matematika. Tapi ga usah khawatir, ada modul numpy yang siap digunakan untuk menangani berbagai proses matematika. Fiturnya lumayan lengkap, mulai dari perhitungan sederhana untuk log, pythagoras, dan pembuatan matriks, hingga solusi untuk masalah aljabar linear.


6. Scikit Learn

by sckit-learn

Salah satu inti dari data science adalah menarik kesimpulan dari data menggunakan machine learning. Proses tersebut dapat dilakukan menggunakan Scikit Learn.

Fiturnya sangat lengkap, bisa digunakan untuk melakukan un-supervised hingga supervised learning. Selain itu, dapat juga digunakan untuk melakukan manipulasi data menggunakan dimensionality reduction, model selection, dan preprocessing.

Itulah tadi beberapa tools yang bisa digunakan untuk belajar dasar-dasar data science. Semuanya lebih dari cukup untuk dipelajar, walaupun pada kenyataannya sangat banyak tools-tools lain yang bisa digunakan.

Posting Komentar untuk "Tools yang Digunakan dalam Data Science"