Skip to main content
Pernahkah mendengar istilah dokumentasi data? Dokumentasi data atau yang sering disebut dengan data provenance adalah sebuah langkah untuk melihat sumber data yang kita peroleh. Kata provenance sendiri berasal dari bahasa perancis provenir yang berarti “berasal” atau “silsilah”. Coba bayangkan Anda berperan sebagai seorang Data Scientist. Anda mendapatkan sebuah dataset (himpunan data) yang siap untuk dianalisis. Anda tidak tahu data ini berasal dari mana, bagaimana validitasnya, apakah ia akan berubah selama proses pengerjaan Anda, dan sebagainya. Gawat kan? Padahal dokumentasi data ini penting untuk mengetahui keabsahan data dan memungkinkan kita menggunakannya kembali di waktu yang lain. W3C Provenance Incubator Group, sebuah organisasi yang bergerak di bidang pengembangan dan standarisasi teknologi web, menjelaskan tentang dokumentasi data sebagai berikut: “Catatan yang menggambarkan semua pihak dan proses dalam pembuatan, perubahan, penanganan, mau pun hal lainnya yang berpengaruh kepada data. Provenance merupakan landasan utama untuk dapat menilai keaslian dan menumbuhkan kepercayaan kepada data, sekaligus untuk mereproduksi data tersebut.” Terdengar rumit? Baiklah. Berikut ini contoh sebuah penggambaran dokumentasi data yang ditunjukkan dalam sebuah metadata. Metadata merupakan bagian penting dari data yang dipublikasi untuk menentukan kualitas, kredibilitas, reprodusibilitas hasil (terukur), serta menentukan apakah data dapat digunakan kembali atau tidak (reusable). 202102220059440cf8979447504e03a3a5b22d16d990c3.png Contoh data provenance di atas didapatkan dari website kaggle. Pada gambar di atas terlihat dokumentasi yang menyertakan sumber data, metodologi pembuatan data, dan juga pemilik dari dataset. Berikut contoh lain dari dokumentasi data yang familiar bagi Anda. 20210222010011dd32f71d85a3901a5e095a7f418d6e14.png Tampilan di atas merupakan version history (sejarah versi dokumen) dari berkas Google Sheets. Semua perubahan data tercatat mulai dari tanggal hingga nama orang yang melakukan perubahan. Version history ini dapat Anda temukan saat klik bagian berikut: 20210222010029500d67a39d3fa1d2b9deff44ac12e118.png Untuk dapat kembali ke penulisan sebelumnya kita dapat melakukan restore version (pengembalian versi) dengan memilih dari riwayat penulisan dan klik tombol Restore this version. 202102220100567df18b8494dd9509b19d010f7c486ce6.png