Skip to main content
Library pengolahan data bertujuan untuk membantu dalam manipulasi, analisis, dan pemrosesan data. Library ini menyediakan berbagai fungsi dan metode yang memudahkan pengguna untuk melakukan operasi pengolahan data dengan lebih efisien dan cepat. Tujuan dari library ini untuk menyederhanakan tugas-tugas kompleks yang berkaitan dengan pengolahan data sehingga Anda tidak perlu mengimplementasikan semuanya dari awal. Berikut adalah beberapa library populer yang digunakan untuk pengolahan data.
  1. Pandas
    Pandas adalah library populer yang digunakan untuk pengelolaan dan analisis data. Library ini menyediakan struktur data dan alat untuk membantu pengguna dalam melakukan manipulasi, pembersihan, transformasi, dan analisis data dengan mudah dan efisien.
    Meskipun pandas sudah terinstal secara otomatis pada beberapa IDE dan versi Python, perlu diingat bahwa pandas bukan merupakan library bawaan Python. Oleh karena itu, Anda harus menginstal library ini terlebih dahulu sebelum dapat menggunakannya. Silakan buka command prompt dan jalankan kode berikut.
    pip install pandas
    
    Atau jika Anda ingin menggunakan conda, silakan jalankan kode berikut untuk menginstalnya.
    conda install pandas
    
    Berikut adalah contoh implementasi pandas. dos:8b867c4f84dd4fed7a24f72ccfbb0bee20230823203848.png Pada contoh di atas, kita membuat DataFrame dari dictionary dan menampilkannya ke layar. DataFrame merupakan struktur data utama dalam pandas yang mirip seperti tabel atau spreadsheet. DataFrame merupakan struktur dua dimensi yang menyimpan data dalam bentuk baris dan kolom.
  2. NumPy
    Library NumPy adalah package fundamental yang sering digunakan untuk scientific computing pada Python. Library ini menyediakan objek array multidimensi, berbagai jenis objek lainnya, seperti masked array dan matrix, dan sebagainya.
    NumPy termasuk library eksternal, meskipun NumPy juga sudah terinstal secara otomatis pada beberapa IDE dan versi Python, perlu diingat bahwa NumPy bukan termasuk library bawaan Python. Oleh karena itu, Anda harus menginstal library ini terlebih dahulu sebelum dapat menggunakannya. Silakan buka command prompt dan jalankan kode berikut.
    pip install numpy
    
    Anda juga bisa menggunakan conda untuk menginstal NumPy, berikut sintaksnya.
    conda install numpy
    
    Berikut adalah contoh penggunaan NumPy.
    import numpy
    
    matriks = numpy.array([[1, 2, 3], [4, 5, 6], [7, 8 ,9]])
    print(matriks)
    
    """
    Output:
    [[1 2 3]
    [4 5 6]
    [7 8 9]]
    """
    
    Pada kode di atas, kita mengimpor library “numpy” terlebih dahulu untuk mengambil fungsi-fungsi atau kode yang berada pada library tersebut. Selanjutnya, mengubah nested list menjadi array dengan menggunakan fungsi “.array()”.
  3. Matplotlib
    Selanjutnya adalah matplotlibyang merupakan library untuk melakukan visualisasi data. Matplotlib termasuk jenis library eksternal sehingga Anda perlu melakukan instalasi matplotlib terlebih dahulu. Silakan jalankan kode berikut.
    python -m pip install -U matplotlib
    
    Anda bisa juga jalankan kode berikut jika ingin menggunakan conda.
    conda install matplotlib
    
    Berikut adalah contoh penerapan matplotlib.
    import matplotlib.pyplot as plt
    
    # Data
    x = [1, 2, 3, 4, 5]
    y = [2, 4, 6, 8, 10]
    
    # Membuat plot garis
    plt.plot(x, y)
    
    # Menambahkan judul dan label sumbu
    plt.title("Contoh Plot Garis")
    plt.xlabel("Sumbu X")
    plt.ylabel("Sumbu Y")
    
    # Menampilkan plot
    plt.show()
    
    Pada kode di atas, kita akan membuat visualisasi berdasarkan data dari variabel x dan y. Hal pertama yang dilakukan adalah mengimpor library dengan menggunakan sintaks “import matplotlib.pyplot as plt”. Selanjutnya, ini adalah contoh sehingga kita perlu membuat variabel sebagai data yang akan digunakan. Di sini kita membuat variabel x dan y sebagai data yang akan divisualisasi. Untuk membuat visualisasinya, kita menggunakan sintaks “plt.plot(x, y)” dengan argumennya adalah variabel x dan y. Lalu, kita menambahkan informasi tambahan seperti title, xlabel, dan ylabel. Terakhir, kita menampilkan visualisasi tersebut dengan sintaks “plt.show()”. Berikut adalah output ketika kode di atas dijalankan. dos:85420d1dcc72d22b4ed77af55bc9c49b20230823204533.png
  4. Seaborn
    Terakhir adalah library seaborn yang termasuk jenis library dengan tujuan untuk visualisasi data sama seperti matplotlib. Bahkan library seaborn dibangun berdasarkan pada library matplotlib.
    Seaborn termasuk library eksternal sehingga Anda perlu menginstalnya terlebih dahulu. Silakan jalankan kode berikut untuk menginstalnya menggunakan pip.
    pip install seaborn
    
    Anda juga bisa menggunakan conda, silakan gunakan kode berikut.
    pip install seaborn
    
    Berikut adalah contoh penerapan seaborn.
    import seaborn as sns
    import matplotlib.pyplot as plt
    
    # Contoh data
    tips = sns.load_dataset('tips')  # Memuat dataset tips dari Seaborn
    
    # Contoh plot histogram
    sns.histplot(tips['total_bill'], kde=True)
    plt.title('Histogram Total Bill')
    plt.xlabel('Total Bill')
    plt.ylabel('Frequency')
    plt.show()
    
    Pada contoh di atas, kita menggunakan seaborn untuk melakukan visualisasi berdasarkan dataset tips. Dataset ini adalah bawaan dari library seaborn yang dapat Anda gunakan. Hal pertama yang dilakukan adalah mengimpor modul seaborn. Selanjutnya, kita load dataset dan menyimpannya pada variabel tips. Untuk membuat plot yang baik, di sini kita menggabungkan seaborn dan juga matplotlib. Library matplotlib digunakan untuk membuat title, xlabel, ylabel, dan menampilkannya ke layar. Untuk membuat plot histogram pada seaborn, Anda dapat menggunakan sintaks “sns.histplot()” dengan sns adalah library seaborn dan histplot merupakan fungsinya. Jangan lupa untuk mengisikan value dalam fungsi tersebut. Pada contoh di atas kita menggunakan kolom total_bill yang ada dalam dataset tips. Berikut adalah tampilannya ketika kode tersebut dijalankan. dos:28874b51eb7201cc337788183a0ce73a20230823204853.png