Lompat ke konten Lompat ke sidebar Lompat ke footer

Macam-macam Nilai Koefisien Korelasi

Daftar Isi
1. Matriks Koefisien Korelasi
2. Rentang Nilai Koefisien Korelasi
3. Korelasi Data Positif
4. Korelasi Data Negatif
5. Korelasi Data 0

Pada artikel korelasi antar data numerik, sedikit banyak telah dibahas apa itu korelasi dan bagaimana cara menghitungnya. Termasuk salah satunya menghitung korelasi data numerik secara kuantitatif menggunakan koefisien korelasi.

nilai-koefisien-korelasi

Kali ini akan dibahas lebih banyak tentang koefisien korelasi, bagaimana koefisien korelasi berhubungan dengan pola data.


Matriks Koefisien Korelasi

Koefisien korelasi dari 2 variabel numerik dapat dihitung menggunakan numpy.corrcoef(). Method tersebut tidak menghasilkan satu nilai, tapi menghasilkan matriks 2 x 2 seperti di bawah ini.

[[1.   0.6757]
 [0.6757   1.]]

Misalkan matriks diatas diberi nama matriks C. Maka, masing-masing elemen nya memiliki nilai berikut ini:

  • C11, atau pojok kiri atas merupakan koefisien korelasi antara variabel pertama dengan variabel pertama. Karena yang dihitung adalah korelasi antara dirinya sendiri maka nilainya 1.
  • C12 & C21, pojok kanan atas dan kiri bawah, nilainya sama dan nilai mutlaknya < 1. Nilai ini adalah korelasi antara variabel 1 dan variabel 2. Nilai inilah yang dipakai.
  • Sisanya, C22, sama seperti C11 merupakan korelasi variabel 2 dengan dirinya sendiri.
Berdasarkan nilai di atas, dapat dilihat bahwa absolut dari nilai koefisien korelasi pada umumnya kurang dari 1. Sedangkan koefisien korelasi tertinggi adalah 1, ketika suatu variabel dikorelasikan dengan dirinya sendiri.

Rentang Nilai Koefisien Korelasi

Koefisien korelasi memiliki nilai antara 0 hingga 1, atau 0 hingga -1. Artinya, baik positif maupun negatif, korelasi akan semakin bagus jika mendekati nilai 1. Korelasi koefisien yang sempurna bernilai -1 atau 1.

Nilai negatif (-) dan positif (+) menunjukkan pola dari korelasi data. Apakah kedua data saling menguatkan, atau malah saling melemahkan. 

Bagaimana dengan nilai 0? Nilai ini menunjukkan bahwa tidak ada korelasi atau hubungan antara variabel 1 dan variabel 2.


Korelasi Data Positif

Korelasi data positif, misal +0.7, artinya data berkorelasi positif. Bisa dibilang juga kalau data saling menguatkan. Artinya, ketika variabel 1 nilai nya bertambah, maka variabel 2 juga bertambah.

Misal, variabel 1 adalah total belanja, variabel 2 adalah uang tip yang diberikan. Secara umum, semakin banyak total belanja maka akan semakin banyak uang tip yang diberikan. Entah karena si pembeli punya lebih banyak uang, atau sebagai imbalan untuk mengangkut banyak barang.

Ketika diplot pada scatter plot, titik-titiknya akan mengalami pola naik seperti di bawah ini.

data-koefisien-korelasi-positif

Karena data nya saling menguatkan, ketika yang satu naik yang lain pun naik, maka grafik yang terbentuk memiliki pola naik.


Korelasi Data Negatif

Berbeda dengan sebelumnya, data yang berkorelasi negatif artinya data saling melemahkan. Ketika variabel 1 nilainya naik, justru variabel yang lain nilainya turun. Karena itu, nilai koefisien korelasinya pun memiliki tanda negatif (-), misal -0.6.

Contoh dari data yang memiliki korelasi negatif adalah waktu olahraga dengan berat bedan. Pada umumnya, semakin banyak orang berolah raga maka semakin rendah berat badannya.

data-koefisien-korelasi-negatif

Karena saling melemahkan, data dengan korelasi negatif akan memiliki pola seperti pada grafik di atas.


Korelasi Data 0

Berbeda dari sebelumnya, data dengan korelasi 0 tidak berkorelasi sama sekali. Artinya, ketika data 1 berubah, tidak ada pola tertentu pada perubahan nilai data 2. 
data-korelasi-0-tidak-berkorelasi

Data dengan korelasi rendah dapat mengurangi kualitas machine learning. Karena itu, beberapa metode machine learning memiliki fitur untuk mengabaikan data dengan korelasi rendah.

Logikanya seperti ini, warna baju seharusnya tidak berpengaruh pada berat badan seseorang. Artinya, kita tidak bisa menebak kira-kira berat badan seseorang dengan melihat warna bajunya.

Ketika ditambahkan pada scatter plot, data hanya tersebar saja, tidak ada pola naik atau pola turun seperti pada korelasi data yang sebelumnya. Kelihatan sekali bedanya, grafik di atas, dengan grafik-grafik sebelumnya.

Sebenarnya, jika dihitung menggunakan np.corrcoef(), nilainya tidak mutlak 0, tapi 0.0 sekian, hampir mendekati nol. Karena sejatinya tidak ada data yang tidak benar-benar tidak berkorelasi.

Posting Komentar untuk "Macam-macam Nilai Koefisien Korelasi"