Berikut ini merupakan postingan artikel kategori Data Management yang membahas tentang penjelasan pengertian, definisi, dan arti dari istilah kata data preprocessing berdasarkan rangkuman dari berbagai jenis macam sumber (referensi) relevan, terkait, serta terpercaya.
Daftar Isi Konten:
Pengertian Data Preprocessing
Apa itu sebetulnya yang dimaksud dengan data preprocessing ini?
Preprocessing data melibatkan mengubah data mentah menjadi set data yang dibentuk dengan baik sehingga analisis penambangan data dapat diterapkan.
Data mentah sering tidak lengkap dan memiliki pemformatan yang tidak konsisten.
Kecukupan atau ketidakmampuan persiapan data memiliki korelasi langsung dengan keberhasilan proyek apa pun yang melibatkan analisis data.
Preprocessing melibatkan validasi data dan imputasi data.
Tujuan validasi data merupakan untuk menilai apakah data yang dimaksud lengkap dan akurat.
Tujuan imputasi data merupakan untuk memperbaiki kesalahan dan memasukkan nilai yang hilang – baik secara manual atau otomatis melalui pemrograman Otomasi Proses Bisnis (BPA).
Preprocessing data digunakan dalam aplikasi berbasis database dan aturan.
Dalam proses Pembelajaran Mesin (ML), preprocessing data sangat penting untuk memastikan kumpulan data besar diformat sedemikian rupa sehingga data yang dikandungnya dapat ditafsirkan dan diuraikan oleh algoritma pembelajaran.
Pembahasan dari Apa itu Pengertian, Makna, serta Contoh dari Istilah Data Preprocessing
Baik, agar kita dapat lebih mendalami arti penjelasan serta maksud dari acronym atau kata tersebut di atas, pastinya kita juga perlu memahami lebih dalam tentang pembahasan mengenai apa itu pengertian, maksud, dan akronim, istilah, jargon, atau terminologi data preprocessing.
Data melewati serangkaian langkah selama preprocessing:
Pembersihan Data: Data dibersihkan melalui proses seperti mengisi nilai yang hilang atau menghapus baris dengan data yang hilang, menghaluskan data yang berisik, atau menyelesaikan ketidakkonsistenan dalam data.
Menghapus data bising sangat penting untuk set data ML, karena mesin tidak dapat menggunakan data yang tidak dapat mereka tafsirkan.
Data dapat dibersihkan dengan membaginya menjadi segmen ukuran yang sama yang dengan demikian dihaluskan (binning), dengan memasukkannya ke fungsi linier atau beberapa regresi (regresi), atau dengan mengelompokkannya ke dalam kelompok data yang sama (pengelompokan).
Inkonsistensi data dapat terjadi karena kesalahan manusia (informasi disimpan di bidang yang salah).
Nilai duplikat harus dihapus melalui deduplikasi untuk menghindari memberikan objek data keuntungan (bias).
Integrasi Data: Data dengan representasi yang berbeda disatukan dan konflik dalam data diselesaikan.
Transformasi Data: Data dinormalisasi dan digeneralisasi.
Normalisasi merupakan proses yang memastikan bahwa tidak ada data yang berlebihan, semuanya disimpan di satu tempat, dan semua dependensi logis.
Pengurangan Data: Ketika volume data sangat besar, basis data dapat menjadi lebih lambat, mahal untuk diakses, dan menantang untuk disimpan dengan benar.
Pengurangan data bertujuan untuk menyajikan representasi data yang berkurang di gudang data.
Ada berbagai metode untuk mengurangi data.
Misalnya, setelah subset atribut yang relevan dipilih untuk signifikansinya, apa pun di bawah level tertentu dibuang.
Mekanisme pengkodean dapat digunakan untuk mengurangi ukuran data juga.
Jika semua data asli dapat dipulihkan setelah kompresi, operasi diberi label sebagai lossless.
Jika beberapa data hilang, maka itu disebut pengurangan lossy.
Agregasi juga dapat digunakan untuk memadatkan transaksi yang tak terhitung jumlahnya menjadi nilai mingguan atau bulanan tunggal, secara signifikan mengurangi jumlah objek data.
Diskritisasi Data: Data juga dapat didiskritisasi untuk menggantikan nilai mentah dengan level interval.
Langkah ini melibatkan pengurangan sejumlah nilai atribut kontinu dengan membagi rentang interval atribut.
Pengambilan sampel data: Terkadang, karena waktu, penyimpanan atau kendala memori, dataset terlalu besar atau terlalu kompleks untuk dikerjakan.
Teknik pengambilan sampel dapat digunakan untuk memilih dan bekerja hanya dengan subset dari dataset, asalkan memiliki sifat yang kira -kira sama dari yang asli.
Seperti yang sudah kita lihat di atas, istilah ini merupakan salah satu dari kumpulan kamus, akronim, istilah, jargon, atau terminologi dalam bidang teknologi yang diawali dengan abjad atau awalan D, serta merupakan terms yang terkait dengan Data Management.
Arti Data Preprocessing dalam Kamus Terjemahan Bahasa Indonesia dan Inggris
Selain membahas tentang pengertian dan pembahasan definisinya, untuk lebih memperdalamnya, di sini kita juga perlu mengetahui apa arti kata data preprocessing dalam kamus terjemahan bahasa Indonesia dan Inggris.
Untuk lebih mudah dalam memahaminya, di artikel ini Kami akan menguraikannya berupa tabel terjemahan bahasa Indonesia dan Inggris sebagai berikut.
Tipe | Bahasa Indonesia | Bahasa Inggris |
Terminologi | preprocessing data | data preprocessing |
Kategori | manajemen data | data management |
Penutup
Baiklah, di atas merupakan pembahasan dan penjelasan tentang apa itu arti dari data preprocessing.
Semoga postingan artikel yang sudah Kami bagikan ini dapat bermanfaat serta dapat menambah wawasan kita semua.
Lihat juga pembahasan mengenai apa itu pengertian, maksud, dan akronim, istilah, jargon, atau terminologi artikel lainnya yang berhubungan dengan bidang Teknologi yang ada di laman blog UrlWebsite Kami.
Sumber (Referensi)
Artikel ini dibuat berdasar dari simpulan arti definisi dari berbagai referensi relevan yang berotoritas seperti Wikipedia, Webopedia Technology Dictionary dan beberapa sumber lainnya seperti Technopedia dan Techterms. Kata Data Preprocessing ini merupakan salah satu dari kumpulan terminologi “Data Management” dalam bidang teknologi yang dimulai dengan abjad atau awalan D. Artikel ini di-update pada bulan Nov tahun 2024.
- https://id.wikipedia.org/wiki/terminologi
- https://id.wikipedia.org/wiki/teknologi
- https://id.wikipedia.org/wiki/teknis
- https://www.webopedia.com/?s=data-preprocessing
- Gambar contoh dari data-preprocessing via Google di sini
- Gambar contoh dari data-preprocessing via Bing di sini