Günümüz teknoloji dünyasında veriler her yerde. Tüm teknoloji firmaları ürettikleri verileri bu veya diğer şekilde dijital ortamlarda tutuyor. Ama bu verileri işleyebilmek ayrı bir dünyanın kapısını aralar. Bu da veri bilimi dünyasıdır.
Bu makalemizde veri biliminin en önemli konularından biri olan veri ambarı yani data warehouse nedir konusu işleyeceğiz. Öncelikle veri ambarının teorik tanımı ile başlayıp konuyu gerçek hayattaki örneklerle devam edeceğim.
Veri Ambarı değişik veri kaynaklarından olan verileri analiz etme ve sonuç çıkarma amaçlı bir araya getirilmesidir.
Buradan konuyu kısaca özetleyecek olursak veri ambarı nedir sorusunun birinci yanıtı birden çok farklı veri kaynaklarını bir araya getiren teknolojidir diyebiliriz. Buradan da ikinci önemli soru ortaya çıkar. Bu verileri neden bir araya getiriyoruz?
Değişik veri kaynakları ile çalışırken siz de göreceksiniz ki veri ambarlarını oluşturma süreçleri gerçekten zahmetli ve ciddi bir efor sarf ederek oluşturulan yapılardır ki bu da ciddi kaynak tüketimi demektir. Yani bu işe başlamadan önce yanıtlanması gereken önemli sorulardan bir tanesi oluşturacağınız veri ambarı ile hangi soruları yanıtlayacağınız, aynı zamanda karşınıza daha sonra hangi soruların çıkabileceği tahminidir. Bu da bir anlamda iş zekası yani Business Intelligence alanıdır. (Konuyu ayrıntılı anlattığım makaleye buradan erişebilirsiniz...)
Veri bilimi alanı istatistik, matematik, programlama, teknoloji, yönetim, mantık, ilişki kurma, sonuç odaklı çalışma ve birçok alanı içinde barındıran komplike bir konudur. Veri ambarları ise bu işin bir anlamda orta süreçlerinde yer alır. Veri ambarı cevaplanması gereken sorular için veri kaynağıdır. Bu süreçlere kısa değinecek olursak önce cevaplanması gereken soruların belirlenmesi, veri kaynaklarının analiz edilmesi ve gerekli verilerin belirlenmesi, verilerin işlenebilecek düzeye getirilmesi, hatalardan arındırılması, ETL süreçleri ve veri ambarına yüklenmesi, en sonda ise bu verilerinden OLAP Query'lerle verilerin sorgulanması...
Görüldüğü gibi Veri Ambarı bu işin sondan hemen önceki sürecidir. Bu makaleyi okuyorsanız da en azından süreçlerle ilgili de bilgi sahibi olmuşsunuzdur. Konunun detaylı anlatıldığı "Veri Ambarı Veri İşleme Süreçleri" makalesine de göz atmanızı tavsiye ederim.
Veri ambarı için yukarıda verilen tanımın ikinci kısmında yer alan "analiz etme ve sonuç çıkarma amaçlı bir araya getirilmesi" konusunu de elimden geldiği kadar açıklamaya çalıştım. Buradan bir veri ambarının en temel özellikleri nedir diye sorulduğunda buna vereceğimiz ikinci yanıt ise veri ambarlarının analiz ve sonuç çıkarma amacıyla veri kaynaklarının bir araya getirilmesi olarak yanıtlayabiliriz...
Son olarak veri ambarları için kullanılan OLAP(Online Analytical Processing) konusuna değinmek istiyorum. OLAP teknolojileri veri ambarlarının saklandığı ortamlara verilen genel isimdir.ROLAP, MOLAP, HOLAP, DOLAP olmak üzere dört türü vardır. Bu konuları da merak ediyorsanız ilgili linklere tıklayabilirsiniz...
Bu kadar anlatımdan sonra size veri ambarlarının kullanıldığı bir gerçek hayat problemini sunacağım. Bu problem size veri ambarının ne olduğunu açıklayabileceğini düşünüyorum.
"Bir havayolu firmasında iş analisti olarak çalışıyorsunuz. Firma yöneticileri size gelecek yıl hangi şehirlere yeni hatlar açılması gerektiğini, hangi hatlarının sıklıklarının artırılması ve ya azaltılması, hangi hatların iptal edilmesi, gelecek sene kaç tane uçak almamız gerektiği, mevcut personel sayımızın gelecek sene için yeterli olup olmayacağı ve b. sorular yönelttiğinde nasıl bir yol izleyeceksiniz?"
...
Son olarak konuyu özetleyecek olursak makalede veri ambarı nedir ve bir anlamda veri ambarlarının kullanıldığı iş zekası alanında yerini vurgulayarak veri ambarı tanımını vermeye çalıştım. Makelenin konuya başlangıç yapanlar için biraz anlaşılması zor olabileceğinin farkındayım ki bu alanla uğraşmak, bu alanda kendinizi geliştirmek istiyorsanız anlatılan konular zamanla yerine oturacaktır. Konuyla alakalı sorularınız olursa bana yazabilirsiniz...
Güzel bir içerik olmuş. Web sitenizde ilgimi çeken alan adınız ile web site isminiz uyuşmaması, Pewat logonun altına 'mühendisler dünyası' yazsanız daha iyi olur. En azından isminiz daha kalıcı olur.
YanıtlaSil