Tingkatkan kualitas data dengan pendekatan manajemen data yang lebih cerdas
Penulis: Robert Eve, Senior Data Management Strategist, Thought Leadership & Digital Content Executive, TIBCO Software.
Jakarta, Komite.id- Data sangat penting bagi keberhasilan bisnis, namun kualitasnya tetap sulit dipahami karena definisi, sintaksis, struktur, sumber, serta penggunaan yang berkembang berkonspirasi untuk membatasi kemumpuniannya. Banyaknya data yang tersedia untuk organisasi serta kompleksitasnya seringkali terasa berlebihan. Namun, kemajuan manajemen data generasi mendatang, yang digunakan bersama dengan pendekatan yang lebih pragmatis, dapat membantu meringankan kekhawatiran ini sambil meningkatkan kualitas data.
Mengintegrasikan silo manajemen data dengan manajemen data generasi mendatang
Memastikan kualitas data tidak dapat dilakukan menggunakan aplikasi mandiri. Sebaliknya, memerlukan kombinasi beberapa aplikasi yang mencakup manajemen metadata, manajemen data master, manajemen data referensi, katalog data, tata kelola data, serta integrasi data. Secara tradisional, sistem ini independen dan membutuhkan metadata serta koordinasi data di berbagai perangkat yang berbeda. Selain itu, penawaran manajemen data generasi pertama dirancang dengan mempertimbangkan pengguna teknis yang tidak memiliki keahlian domain bisnis yang diperlukan untuk memastikan keberhasilan upaya kualitas data.
Oleh sebab itu Perusahaan memerlukan solusi manajemen data generasi mendatang yang mampu mengintegrasikan komponen yang sedianya terpisah-pisah dalam lingkungan di mana para pakar bisnis dan teknologi dapat berkolaborasi di seluruh siklus hidup kualitas data pelanggan.
Gunakan virtualisasi data untuk berhenti membuat begitu banyak salinan data
Menurut International Data Corporation (IDC), data perusahaan berlipat ganda setiap tiga tahun*. Sementara volume ini menambah kompleksitas dalam memastikan kualitas data, 85% dari data ini dapat dianggap sebagai salinan dari data asli. Ini dapat dikaitkan dengan cara kerja integrasi berbasis data warehouse tradisional. Melihat data asli dari sistem transaksional disalin sekali ke tampilan, dan kemudian lagi ke tempat penyimpanan. Data mart berdasarkan tempat penyimpanan membuat lebih banyak salinan. Menambahkan data reservoir ke dalam gabungan, maka proliferasi salinan menjadi semakin buruk.
Dengan begitu banyak salinan yang tersebar di lokasi-lokasi yang berbeda ini, mempertahankan akurasi serta konsistensi data menjadi tantangan besar dengan mengorbankan kualitas data sebagai hasilnya. Jawaban langsungnya adalah agar perusahaan berhenti membuat begitu banyak salinan data. Misalnya, menggunakan virtualisasi data untuk mengakses data hulu langsung dari sumber aslinya berarti suatu organisasi dapat menarik banyak data mart untuk meningkatkan kualitas sambil menekan biaya. Hal ini juga akan menghasilkan semua pengguna hulu berbagi definisi data umum serta mendapatkan pandangan yang konsisten dalam hal kualitas dan sumber data.
Manfaatkan kecerdasan buatan (artificial intelligence/ AI) untuk mengidentifikasi dan menyelesaikan masalah kualitas secara otomatis
Selain mengadopsi solusi manajemen data terintegrasi serta membuat salinan data penampil, perusahaan juga harus mempertimbangkan untuk menggunakan kecerdasan buatan (AI) dalam mengidentifikasi dan menyelesaikan masalah kualitas secara otomatis. IDC telah mengidentifikasi bagaimana lima model AI yang tersedia saat ini serta kemampuan pembelajaran mesin (machine learning) dari vendor manajemen data dapat meningkatkan kualitas data. Ini termasuk diolah oleh manusia; diolah manusia dan didukung mesin; diolah oleh mesin dan didukung oleh manusia; diolah mesin dan diperintah manusia; dan diolah mesin dan diperintah mesin.
Dengan perusahaan riset pasar menemukan bahwa lebih dari 65% organisasi yang disurvei sekarang menggunakan AI untuk secara otomatis menyoroti masalah kualitas data dan 55% dari mereka yang menerapkan koreksi yang direkomendasikan AI, teknologi telah memberikan kemajuan praktis yang diperlukan untuk meningkatkan kualitas data. Mungkin yang lebih jelas adalah bahwa kepercayaan perusahaan terhadap rekomendasi AI dinilai lebih dari 90% dengan sekitar 35% rekomendasi tersebut hampir selalu diterima.
Jadilah pragmatis dan pecahkan masalah kualitas data yang ada
Bagian terakhir dari teka-teki ini mendekati kualitas data dari perspektif masalah yang perusahaan coba pecahkan. Jadi, meskipun mencapai kualitas data yang sempurna adalah pengejaran yang mulia, seringkali memiliki kualitas data yang cukup baik untuk memenuhi kebutuhan bisnis sudah cukup. Misalnya, jika organisasi berusaha meningkatkan pengalaman pelanggan, maka ia ingin mengetahui segala sesuatu tentang bagaimana ia terlibat dengan mereka. Biasanya, ini akan mencakup data pelanggan dari beberapa sistem yang mungkin memungkinkan untuk pengidentifikasi yang berbeda, seperti:
Steve Smith dalam sistem otomasi tenaga penjualan
S Smith dalam sistem manajemen pelayanan
S.E. Smith dalam sistem pemasaran
Steven Smith dalam sistem entri pesanan dan penagihan
Kunci primer yang tidak cocok ini membuat sulit untuk mencocokkan catatan dan membangun pandangan lengkap pelanggan. Kualitas data dari sudut pandang integrasi tidak cukup sesuai untuk masalah yang dihadapi. Hal ini melampaui pengidentifikasi pelanggan. Tantangan integrasi mengenai setiap entitas data master utama di seluruh pemasok, mitra, produk, lokasi, dan lainnya.
Diperlukan sistem manajemen data master yang lebih cerdas yang dapat secara otomatis mendeteksi serta menyelesaikan ketidaksesuaian ini untuk menjadikannya lebih mudah bagi perusahaan untuk memiliki catatan ’emas’ yang menyelesaikan anomali kunci utama ini. Dengan penanganan ini, virtualisasi data dapat menanyakan semua detail dan memberikan pandangan pelanggan yang diperlukan 360 derajat untuk meningkatkan pengalaman mereka.
Selain itu, bisnis mungkin mencari untuk meningkatkan peluang pendapatan cross-sell mereka. Dalam hal ini, seorang ilmuwan data mungkin berusaha membangun mesin rekomendasi penawaran terbaik berikutnya berdasarkan data historis penjualan dengan harapan menemukan kombinasi produk populer. Ketika ilmuwan data mulai memeriksa data penjualan ini dan distribusinya, beberapa di antaranya mungkin berkorelasi dengan baik, tetapi kemungkinan akan ada anomali juga.
Jika bisnis baru memulai model, kemungkinan akan fokus pada data yang mewakili sebagian besar pelanggan serta produk dengan pendapatan tertinggi. Tanpa repot dengan data pencilan, ia dapat membangun dan mengimplementasikan model lebih cepat dan menyadari manfaatnya lebih cepat. Nantinya, ilmuwan data dapat kembali dan menyelidiki serta mencoba untuk memahami anomali.
Atau, perusahaan mungkin memutuskan bahwa penggunaan yang lebih baik dari seorang ilmuwan data akan fokus pada mayoritas pelanggan dan produk dengan pendapatan tertinggi. Ini akan menghasilkan pemurnian berkelanjutan dan meningkatkan model asli sambil membiarkan anomali tidak terselesaikan. Pada akhirnya, ini mengarah ke bisnis, tetap fokus pada peningkatan kualitas datanya untuk menempatkannya dalam posisi dalam mengambil keputusan yang lebih tepat yang akan membantu mendorong keberhasilan organisasi. (red)