Verinin Artmasına Bağlı Olarak Veri Ambarı Performansı |
Bu makaleden önce VLDB yani çok büyük veri tabanları konusunu VLDB (Very Large DataBase) Nedir? makalesinde anlatmıştım. Konuyla benzerlik teşkil ettiği için bu makaleye de göz gezdirmenizi tavsiye ederim.
Veri ambarları konusuna hakimseniz çok büyük veri ambarları yani VLDW konusunun da ne olduğunu tahmin ediyorsunuzdur. Çok büyük veri ambarları için sadece veri boyutları konusunda limitleme uygulamak çok yanlış olabilir. Ama veri tabanlarından farklı olarak veri ambarlarında veri boyutu bu veri ambarının VLDW kategirisine sokmak için en önemli göstergelerden bir tanesidir.
Çok büyük veri ambarlarının tasarımı veri ambarlarının kategorize etme sürecinde önem kazanır. (Burada Veri ambarları tasarım yöntemleri derken Holap, Molap, Rolap ve b. konularından bahsediyorum.) Örneğin Rolap klasik veritabanlarına benzer bir yapıda tasarlandığından bu veri ambarlarını kategorize etmek için VLDB kriterlerini de göz önünde bulundurmamız gerekir.
Genel olarak için VLDW yani çok büyük veri ambarları için bir limitleme yaparsak 10 terabayt üzerindeki veri ambarlarına büyük veri ambarları diyebiliriz.
Büyük veri ambarları için piyasada en çok kullanılan teknolojiler için Teradata, Vertica, Oracle, Cassandra, Apache HBase örnek verilebilir. Bunlardan Cassandra ve Apache HBase açık kaynak kodlu ücretsiz yazılımlardır.
Bu konular aslında Veri Bilimi veya İş Zekası(Business Intelligence) alanının konularındandır ve en temel konulardan bir tanesidir. Bu anlamda bu konuların iyi anlaşılması, özellikle de veri ambarı konusunun çok iyi anlaşılması bu alanda çalışmak isteyenler için hayati öneme sahiptir.
Son yıllardaki teknolojik gelişmelere bakarak gelecek yönelik tahminler yürütürsek de bu kısıtlamaların çok kısa sürelerde artacağını öngörebiliriz.
Yorumlar
Yorum Gönder