Veri Ambarlama - Kavramlar
Veri Ambarlama nedir?
Veri ambarı, bir veri ambarı oluşturma ve kullanma sürecidir. Bir veri ambarı, analitik raporlamayı, yapılandırılmış ve / veya ad hoc sorguları ve karar vermeyi destekleyen birden çok heterojen kaynaktan gelen verileri entegre ederek oluşturulur. Veri ambarlama, veri temizleme, veri entegrasyonu ve veri konsolidasyonlarını içerir.
Veri Ambarı Bilgilerini Kullanma
Bir veri ambarında bulunan verilerin kullanılmasına yardımcı olan karar destek teknolojileri vardır. Bu teknolojiler, yöneticilerin depoyu hızlı ve etkili bir şekilde kullanmalarına yardımcı olur. Depoda bulunan bilgilere dayanarak veri toplayabilir, analiz edebilir ve kararlar alabilirler. Bir depoda toplanan bilgiler aşağıdaki alan adlarından herhangi birinde kullanılabilir -
Tuning Production Strategies - Ürün stratejileri, ürünleri yeniden konumlandırarak ve satışları üç aylık veya yıllık olarak karşılaştırarak ürün portföylerini yöneterek iyi bir şekilde ayarlanabilir.
Customer Analysis - Müşterinin satın alma tercihleri, satın alma süresi, bütçe döngüleri vb. Analiz edilerek müşteri analizi yapılır.
Operations Analysis- Veri ambarı, müşteri ilişkileri yönetimine ve çevresel düzeltmelerin yapılmasına da yardımcı olur. Bilgiler aynı zamanda iş operasyonlarını analiz etmemize olanak tanır.
Heterojen Veritabanlarının Entegre Edilmesi
Heterojen veritabanlarını entegre etmek için iki yaklaşımımız var -
- Sorguya Dayalı Yaklaşım
- Güncellemeye Dayalı Yaklaşım
Sorguya Dayalı Yaklaşım
Bu, heterojen veritabanlarını entegre etmek için geleneksel yaklaşımdır. Bu yaklaşım, birden çok heterojen veritabanının üzerine sarmalayıcılar ve entegratörler oluşturmak için kullanıldı. Bu entegratörler aynı zamanda arabulucular olarak da bilinir.
Sorgu Odaklı Yaklaşım Süreci
İstemci tarafına bir sorgu gönderildiğinde, bir meta veri sözlüğü sorguyu ilgili bireysel heterojen siteler için uygun bir forma çevirir.
Artık bu sorgular eşlenir ve yerel sorgu işlemcisine gönderilir.
Heterojen sitelerden elde edilen sonuçlar küresel bir cevap setine entegre edilmiştir.
Dezavantajları
Sorgu odaklı yaklaşım, karmaşık entegrasyon ve filtreleme süreçleri gerektirir.
Bu yaklaşım çok verimsizdir.
Sık sorgular için çok pahalıdır.
Bu yaklaşım, toplama gerektiren sorgular için de çok pahalıdır.
Güncelleme Odaklı Yaklaşım
Bu, geleneksel yaklaşıma bir alternatiftir. Günümüzün veri ambarı sistemleri, daha önce tartışılan geleneksel yaklaşımdan ziyade güncelleme odaklı yaklaşımı takip etmektedir. Güncelleme odaklı yaklaşımda, birden çok heterojen kaynaktan gelen bilgiler önceden entegre edilir ve bir depoda saklanır. Bu bilgiler doğrudan sorgulama ve analiz için mevcuttur.
Avantajlar
Bu yaklaşım aşağıdaki avantajlara sahiptir -
Bu yaklaşım, yüksek performans sağlar.
Veriler anlamsal veri deposunda önceden kopyalanır, işlenir, entegre edilir, notlandırılır, özetlenir ve yeniden yapılandırılır.
Sorgu işleme, verileri yerel kaynaklarda işlemek için bir arayüz gerektirmez.
Veri Ambarı Araçlarının ve Yardımcı Programlarının İşlevleri
Aşağıdakiler, veri ambarı araçlarının ve yardımcı programlarının işlevleridir -
Data Extraction - Birden çok heterojen kaynaktan veri toplamayı içerir.
Data Cleaning - Verilerdeki hataları bulmayı ve düzeltmeyi içerir.
Data Transformation - Verilerin eski formattan ambar formatına dönüştürülmesini içerir.
Data Loading - Sıralama, özetleme, birleştirme, bütünlük denetimi ve indisler ve bölümler oluşturmayı içerir.
Refreshing - Veri kaynaklarından depoya güncelleme içerir.
Note - Veri temizleme ve veri dönüştürme, veri kalitesinin ve veri madenciliği sonuçlarının iyileştirilmesinde önemli adımlardır.