Kode program yang akan diajarkan di sini bisa diunduh di tautan berikut ini, untuk membukanya upload berkasnya dari Google Colab.
Setelah sebelumnya kita mengenal library Pandas, sekarang kita akan belajar menggunakan library tersebut.
Pandas memiliki fungsi untuk mengubah data dari berbagai jenis menjadi dataframe seperti yang telah dibahas di submodul sebelumnya.
Contohnya, untuk mengubah data CSV menjadi dataframe, kita hanya cukup memanggil fungsi pandas.read_csv() dan memasukkan nama berkas pada parameternya. Berikut adalah contoh mengubah data csv menjadi dataframe Pandas.
Pertama kita bisa buka Google Collab, dengan mengunjungi tautan colab.research.google.com. Anda bisa menekan tombol Notebook Baru pada halaman pertama.
Pada notebook baru, kita akan melakukan Import library pandas dan memberikan alias ‘pd’ untuk library tersebut. Memberikan alias ‘pd’ terhadap library pandas adalah praktek yang umum dilakukan para pengembang ML.
- import pandas as pd
Colab memiliki direktori yang menyimpan berkas-berkas umum yang dapat dipakai untuk berbagai keperluan. Berkas-berkas bawaan tersebut disimpan dalam sebuah direktori bernama ‘sample_data’.
Untungnya, notebook pada Colab kita memiliki berkas csv yang dapat kita pakai untuk mencoba library pandas. Anda juga bisa melihat beberapa berkas bawaan yang disediakan Colab dengan menggunakan library os.
- import os
- os.listdir('sample_data')
Pada latihan ini kita akan mencoba melakukan konversi dari berkas ‘california_housing_train.csv’ yang merupakan bawaan dari Colab. Untuk mengubah berkas csv menjadi dataframe, kita menggunakan fungsi ‘read_csv’ pada library pandas kemudian menyimpannya pada sebuah variabel yaitu df.
- df = pd.read_csv('sample_data/california_housing_train.csv')
- df.head()
Untuk melihat apakah konversi berhasil, Anda bisa memanggil fungsi head() pada dataframe. Lalu jalankan cell tersebut. Fungsi head() akan menampilkan 5 baris teratas dari sebuah dataframe.
Jika keluaran dari cell seperti di bawah, maka selamat, Anda berhasil melakukan konversi.