Data Warehousing - Pertanyaan Wawancara
Pembaca yang budiman, ini Data Warehousing Interview Questions telah dirancang khusus untuk membuat Anda mengenal sifat pertanyaan yang mungkin Anda temui selama wawancara untuk subjek tersebut Data Warehousing.
A : Data warehouse adalah kumpulan data yang berorientasi pada subjek, terintegrasi, varian waktu, dan nonvolatile yang mendukung proses pengambilan keputusan manajemen.
A : Berorientasi subjek menandakan bahwa gudang data menyimpan informasi seputar subjek tertentu seperti produk, pelanggan, penjualan, dll.
A : Beberapa aplikasi termasuk layanan keuangan, layanan perbankan, barang pelanggan, sektor ritel, manufaktur terkontrol.
A : OLAP adalah singkatan dari Online Analytical Processing dan OLTP adalah singkatan dari Online Transactional Processing.
A : Gudang data berisi informasi historis yang tersedia untuk analisis bisnis sedangkan database operasional berisi informasi terkini yang diperlukan untuk menjalankan bisnis.
A : Gudang data dapat mengimplementasikan skema bintang, skema kepingan salju, dan skema konstelasi fakta.
A : Data Warehousing adalah proses membangun dan menggunakan data warehouse.
A : Data Warehousing melibatkan pembersihan data, integrasi data, dan konsolidasi data.
A : Fungsi yang dilakukan oleh alat dan utilitas Data warehouse adalah Ekstraksi Data, Pembersihan Data, Transformasi Data, Pemuatan dan Penyegaran Data.
A : Ekstraksi data berarti mengumpulkan data dari berbagai sumber yang heterogen.
A: Metadata secara sederhana didefinisikan sebagai data tentang data. Dengan kata lain, kita dapat mengatakan bahwa metadata adalah data yang diringkas yang mengarahkan kita ke data rinci.
A : Metadata respirasi berisi definisi data warehouse, bisnis metadata, operasional metadata, data untuk pemetaan dari lingkungan operasional ke data warehouse, dan algoritma untuk peringkasan.
A: Kubus data membantu kita merepresentasikan data dalam berbagai dimensi. Kubus data ditentukan oleh dimensi dan fakta.
A : Dimensi adalah entitas yang menjadi tempat penyimpanan catatan perusahaan.
A: Data mart berisi subset dari data seluruh organisasi. Subset data ini berharga untuk kelompok tertentu dari suatu organisasi. Dengan kata lain, kita dapat mengatakan bahwa data mart berisi data yang spesifik untuk grup tertentu.
A : Tampilan gudang data operasional dikenal sebagai gudang virtual.
A : Tahapannya adalah strategi TI, Pendidikan, Analisis Kasus Bisnis, Cetak Biru teknis, Versi Build, Pemuatan Riwayat, Permintaan Ad hoc, Evolusi Kebutuhan, Otomatisasi, dan Perluasan Cakupan.
A: Manajer beban melakukan operasi yang diperlukan untuk mengekstrak dan memuat proses. Ukuran dan kompleksitas pengelola beban bervariasi antara solusi spesifik dari gudang data ke gudang data.
A: Manajer beban mengekstrak data dari sistem sumber. Cepat memuat data yang diekstrak ke penyimpanan data sementara. Lakukan transformasi sederhana menjadi struktur yang mirip dengan yang ada di gudang data.
A: Manajer gudang bertanggung jawab atas proses manajemen gudang. Manajer gudang terdiri dari perangkat lunak sistem pihak ketiga, program C, dan skrip shell. Ukuran dan kompleksitas manajer gudang bervariasi antara solusi tertentu.
A : Manajer gudang melakukan pemeriksaan konsistensi dan integritas referensial, membuat indeks, tampilan bisnis, tampilan partisi terhadap data dasar, mengubah dan menggabungkan data sumber ke penyimpanan sementara ke dalam gudang data yang diterbitkan, mencadangkan data di gudang data, dan mengarsipkan data yang telah mencapai akhir masa pakainya.
A : Informasi Ringkasan adalah area di gudang data tempat penyimpanan agregat yang telah ditentukan sebelumnya.
A : Manajer Kueri bertanggung jawab untuk mengarahkan kueri ke tabel yang sesuai.
A : Ada empat tipe OLAP server, yaitu Relational OLAP, Multidimensional OLAP, Hybrid OLAP, dan Specialized SQL Servers.
A : OLAP Multidimensi lebih cepat dari OLAP Relasional.
A : OLAP melakukan fungsi seperti roll-up, drill-down, slice, dadu, dan pivot.
A : Hanya satu dimensi yang dipilih untuk operasi slice.
A : Untuk operasi dadu, dua atau lebih dimensi dipilih untuk kubus tertentu.
A : Hanya ada satu tabel fakta dalam Skema bintang.
A : Normalisasi membagi data menjadi tabel tambahan.
A : Skema kepingan salju menggunakan konsep normalisasi.
A : Normalisasi membantu mengurangi redundansi data.
A : Bahasa Kueri Data Mining (DMQL) digunakan untuk Definisi Skema.
A : DMQL didasarkan pada Structured Query Language (SQL).
A : Partisi dilakukan karena berbagai alasan seperti manajemen yang mudah, untuk membantu pemulihan cadangan, hingga meningkatkan kinerja.
A : Data Marting melibatkan biaya perangkat keras & perangkat lunak, biaya akses jaringan, dan biaya waktu.