- mengonfigurasikan instrumen atau simulasi dari mengumpulkan data primer; atau,
- menerapkan metodologi dan proses tertentu guna mengekstraksi, mengubah, dan menganalisis data masukan demi menghasilkan sebuah produk data keluaran.
Mengelola Sumber Data
Provenance dicatat dalam jenis metadata tentang sebuah data. Banyak bidang metadata yang dapat dikumpulkan dalam kategori informasi asalnya. Misalnya tanggal pembuatan, pemilik, perangkat lunak atau tools lain yang digunakan, metode pemrosesan data, dan lain sebagainya. Dengan demikian, pengelolaan dan manajemen data yang baik menjadi dasar dari dokumentasi data yang akurat. Salah satu usaha dan pendekatan yang mungkin Anda familier adalah teknologi blockchain dalam manajemen rantai persediaan. Video berikut bercerita bagaimana teknologi blockchain digunakan untuk mendapatkan informasi mengenai kapan, di mana, dan bagaimana cara penangkapan ikan dapat diketahui dengan memindai barcode yang telah dipasangkan ke ikan atau pengemasannya. Dengan begitu, distributor, toko penjual, dan konsumen bisa dengan mudah mencari asal usul ikan tersebut dan bisa langsung tahu jika ikan didapatkan dari penangkapan secara ilegal. Bayangkan bahwa metadata adalah lokasi ikan ditangkap, nelayan yang menangkapnya, kapan ikan tersebut ditangkap, dan sebagainya. Sementara data adalah ikan itu sendiri. Pendekatan yang bisa dilakukan dalam melakukan dokumentasi data sebagai berikut:- Dicatat dalam bentuk teks, bisa menggunakan skema penulisan umum atau bisa juga dengan skema khusus dalam data provenance.
- Dicatat dan disimpan secara internal menggunakan program perangkat lunak atau dalam sistem eksternal lainnya.
- Dituliskan dalam bentuk yang dapat dibaca oleh mesin atau yang bisa dibaca oleh manusia.
- Berkas README Pernah menemui berkas readme? Berkas readme biasanya berupa dokumen text (.txt) dan sering kita temui dalam paket instalasi perangkat lunak, kode pemrograman, kumpulan data, dan bisa juga ditemui dalam proyek penelitian. Tentunya dalam proyek penelitian sebuah berkas readme harus memuat daftar berkas yang digunakan dalam dataset, rujukan informasi yang relevan, serta berkas lain yang menunjang penelitian seperti artikel, karya ilmiah, atau slide presentasi. Untuk penulisan readme, kamu bisa menggunakan template yang telah distandarkan oleh Cornell University pada tautan berikut: https://data.research.cornell.edu/content/readme
-
Data Dictionaries
Data dictionaries, atau kamus data, berisi informasi kunci tentang data yang Anda kumpulkan. Ia digunakan untuk menjelaskan suatu bagian tertentu dalam dataset. Misalnya menjelaskan arti dari nama sebuah variabel, kegunaan, deskripsi, dan lain sebagainya. Kamus data biasanya digunakan pada data tabular atau sebuah database. Contoh dari data dictionaries dapat dilihat dari kamus data yang disediakan oleh Kementerian Pertanian Amerika Serikat pada tautan berikut: https://data.nal.usda.gov/data-dictionary-examples
- Data Paper Berbeda dengan makalah, jurnal, atau artikel penelitian biasa yang berfokus pada hipotesa dan hasil penelitian, data paper bertujuan utama untuk menjelaskan mengenai data dan bagaimana data tersebut dikumpulkan. Dalam kata lain, data paper disebut sebagai sebuah dokumen berisi metadata.