Veri Ambarlama - Ayarlama
Bir veri ambarı gelişmeye devam ediyor ve kullanıcının gelecekte hangi sorguyu göndereceği tahmin edilemez. Bu nedenle, bir veri ambarı sistemini ayarlamak daha zor hale gelir. Bu bölümde, bir veri ambarının performans, veri yükü, sorgular vb. Gibi farklı yönlerinin nasıl ayarlanacağını tartışacağız.
Veri Ambarı Ayarlamadaki Zorluklar
Bir veri ambarını ayarlamak, aşağıdaki nedenlerden dolayı zor bir prosedürdür -
Veri ambarı dinamiktir; asla sabit kalmaz.
Kullanıcının gelecekte hangi sorguyu göndereceğini tahmin etmek çok zordur.
İş gereksinimleri zamanla değişir.
Kullanıcılar ve profilleri değişmeye devam ediyor.
Kullanıcı bir gruptan diğerine geçebilir.
Depodaki veri yükü de zamanla değişir.
Note - Tam bir veri ambarı bilgisine sahip olmak çok önemlidir.
Performans değerlendirme
İşte performansın objektif ölçümlerinin bir listesi -
- Ortalama sorgu yanıt süresi
- Tarama oranları
- Günlük sorgu başına kullanılan süre
- İşlem başına bellek kullanımı
- G / Ç işlem oranları
Hatırlanması gereken noktalar aşağıdadır.
Hizmet seviyesi sözleşmesinde (SLA) önlemlerin belirtilmesi gerekir.
Zaten gerekli olandan daha iyiyse, yanıt süresini ayarlamaya çalışmanın hiçbir faydası yoktur.
Performans değerlendirmesi yapılırken gerçekçi beklentilere sahip olmak esastır.
Kullanıcıların makul beklentilere sahip olması da önemlidir.
Sistemin karmaşıklığını kullanıcıdan gizlemek için toplamalar ve görünümler kullanılmalıdır.
Kullanıcının sizin ayarlamadığınız bir sorguyu yazması da mümkündür.
Veri Yük Ayarı
Veri yükü, gece boyunca işlemenin kritik bir parçasıdır. Veri yükleme tamamlanana kadar başka hiçbir şey çalışamaz. Bu, sisteme giriş noktasıdır.
Note- Verilerin aktarılmasında veya verilerin ulaşmasında bir gecikme olursa, tüm sistem kötü bir şekilde etkilenir. Bu nedenle, önce veri yükünü ayarlamak çok önemlidir.
Aşağıda tartışılan çeşitli veri yükünü ayarlama yaklaşımları vardır -
En yaygın yaklaşım, verileri kullanarak veri eklemektir. SQL Layer. Bu yaklaşımda, normal kontroller ve kısıtlamaların yapılması gerekir. Veriler tabloya eklendiğinde, kod, verileri eklemek için yeterli alan olup olmadığını kontrol etmek için çalışacaktır. Yeterli alan yoksa, bu tablolara daha fazla alan tahsis edilmesi gerekebilir. Bu kontrollerin gerçekleştirilmesi zaman alır ve CPU için maliyetlidir.
İkinci yaklaşım, tüm bu kontrolleri ve kısıtlamaları atlamak ve verileri doğrudan önceden biçimlendirilmiş bloklara yerleştirmektir. Bu bloklar daha sonra veritabanına yazılır. İlk yaklaşımdan daha hızlıdır, ancak yalnızca tüm veri bloklarıyla çalışabilir. Bu, bir miktar alan israfına yol açabilir.
Üçüncü yaklaşım, verileri zaten tabloyu içeren tabloya yüklerken, dizinleri koruyabilmemizdir.
Dördüncü yaklaşım, verileri zaten veri içeren tablolara yüklemek için, drop the indexes & recreate themveri yükleme tamamlandığında. Üçüncü ve dördüncü yaklaşım arasındaki seçim, halihazırda ne kadar verinin yüklendiğine ve kaç dizinin yeniden oluşturulması gerektiğine bağlıdır.
Bütünlük Kontrolleri
Bütünlük kontrolü, yükün performansını büyük ölçüde etkiler. Hatırlanması gereken noktalar şunlardır -
Bütünlük kontrollerinin sınırlandırılması gerekir çünkü ağır işlem gücü gerektirirler.
Veri yükünün performans düşüşünü önlemek için kaynak sistemde bütünlük kontrolleri uygulanmalıdır.
Sorguları Ayarlama
Veri ambarında iki tür sorgumuz var -
- Sabit sorgular
- Ad hoc sorgular
Sabit Sorgular
Sabit sorgular iyi tanımlanmıştır. Aşağıda sabit sorgulara örnekler verilmiştir -
- düzenli raporlar
- Hazır sorgular
- Ortak toplamalar
Bir veri ambarındaki sabit sorguları ayarlamak ilişkisel veritabanı sistemindekiyle aynıdır. Tek fark, sorgulanacak veri miktarının farklı olabilmesidir. Sabit sorguları test ederken en başarılı yürütme planını saklamak iyidir. Bu yürütme planını saklamak, yürütme planının değişmesine neden olacağı için değişen veri boyutunu ve veri çarpıklığını tespit etmemize olanak tanır.
Note - Olgu tablosunda daha fazlasını yapamayız, ancak boyut tabloları veya toplamalar ile uğraşırken, bu sorguları ayarlamak için normal SQL ayarlaması, depolama mekanizması ve erişim yöntemleri koleksiyonu kullanılabilir.
Ad hoc Sorgular
Ad hoc sorguları anlamak için, veri ambarının ad hoc kullanıcılarını bilmek önemlidir. Her kullanıcı veya kullanıcı grubu için aşağıdakileri bilmeniz gerekir -
- Gruptaki kullanıcı sayısı
- Düzenli zaman aralıklarında geçici sorgular kullanıp kullanmadıkları
- Sık sık geçici sorgu kullanıp kullanmadıkları
- Ara sıra bilinmeyen aralıklarla geçici sorgular kullanıp kullanmadıkları.
- Çalıştırma eğiliminde oldukları maksimum sorgu boyutu
- Çalıştırma eğiliminde oldukları sorgunun ortalama boyutu
- Temel verilere ayrıntılı erişim gerekip gerekmediği
- Günlük geçen oturum açma süresi
- Günlük kullanımın en yoğun zamanı
- Yoğun saat başına çalıştırdıkları sorgu sayısı
Points to Note
Kullanıcı profillerini takip etmek ve düzenli olarak çalıştırılan sorguları belirlemek önemlidir.
Yapılan ayarlamanın performansı etkilememesi de önemlidir.
Sık çalıştırılan benzer ve geçici sorguları belirleyin.
Bu sorgular belirlenirse, veritabanı değişecek ve bu sorgular için yeni dizinler eklenebilir.
Bu sorgular tanımlanırsa, verimli yürütülmelerini sağlayacak sorgular için özel olarak yeni toplamalar oluşturulabilir.