Türkiye’nin dünyada en iyi tanınan yönetim danışmanlık şirketiYaşam kalitesi, yönetim kalitesi ile artar Globally recognized Turkish management consulting firmImproving quality of management improves quality of life

Veri Madenciliği

Teknolojik gelişmeler dünyada gerçekleşen bir çok işlemin elektronik olarak kayıt altına alınmasını, bu kayıtların kolayca saklanabilmesini ve gerektiğinde erişilebilmesini hem kolaylaştırıyor, hem de bu işlemlerin her geçen gün daha ucuza mal edilmesini sağlıyor. Ancak, ilişkisel veri tabanlarında saklanan birçok veriden kararlar için anlamlı çıkarımlar yapabilmek bu verilerin bilinçli uzmanlarca analiz edilmesini gerektiriyor. Üstelik veri miktarı arttıkça bunların analiz edilmesi de özel araçlar ve yöntemlerin kullanımını zorunlu hale getiriyor.

Veriyi hızlı toplayan ve bilgiye dönüştürerek hızlı kullananlar rekabetçi avantaj elde ederler. Veri madenciliği büyük miktarda veri içinden gelecekle ilgili tahmin yapmamızı sağlayacak ilişki ve kuralların aranmasıdır.

Veri madenciliği, özel ve kamu sektörü kuruluşlarında birçok şekilde kullanılabilmektedir. Bunlardan bazıları aşağıdaki gibi sıralanabilir:

• Bir süpermarket müşterilerinin satın alım eğilimlerini irdeleyerek, promosyonlarını belli müşterilere yönlendirmesi, aynı kaynakla daha çok satış gerçekleştirmesine yardımcı olabilir.
• Bankalar kredi kararlarında kredi isteyenlerin özelliklerini ve davranışlarını irdeleyerek batık klredi oranını azaltabilir.
• Havayolları sürekli müşterilerinin davranış biçimlerini irdeleyerek daha etkin fiyatlandırma ile kârlılıklarını artırabilirler.
• Bir telefon şirketi müşteri davranışlarından öğrendikleri ile yeni hizmetler geliştirerek, müşteri bağlılığını ve kârlılığını artırabilir.
• Maliye Bakanlığı Gelir İdaresi, şirketler için risk modelleri kurarak vergi incelemelerini daha etkin yönlendirip, vergi kaçaklarını azalatabilir.
• Hastaların teşhis ve tedavi maliyetleri iredelenerek hastalık riskinin ilk aşamada tespiti, kontrolü ve kaynak planlama açısından faydalı olur.

Ancak, bu faydaları sağlayabilmek için veri madenciliği konusuna yatırım yapmak gerekiyor.

Büyük veri tabanlarının analiz odaklı olarak kullanılmasının önünde çeşitli engeller var: (i) Veri tabanlarındaki gözlemlerin birçoğunda bilgilerin eksik veya yanlış olması, (ii) Bazı verilerin kişisel değerlendirmelere dayandırılması ve bu nedenle gözlemler arasında tutarlı karşılaştırma yapılmasının güç olması, (iii) Veri toplama süreçlerinin bütünü resmetmeyi engelleyecek ve bilinçli olmayan seçicilikler içermesi (selection bias), (iv) Veri tabanı yapısının analiz odaklı olmaması, (v) Analizi mânalı hale getirecek bilgi eksikliklerini tamamlamanın maliyetli (veya imkansız) olması, (vi) Yetkin analistlerin kullanılmaması, (vii) Analiz teknikleri konusunda bilgi sahibi olanlarla, irdelenecek karar hakkında bilgi sahibi olanlar arasındaki iletişimin sağlıklı modelleme yapacak düzeyde olmaması gibi…

Bu nedenle, büyük veri tabanlarından faydalanılarak bilgi üretme sürecinde dikkat edilmesi gereken unsurlar var. Öncelikle analizlerin güvenilir verilere dayandırılmasını, yapılacak herhangi bir analizin başkaları tarafından da tekrarlanabilir olmasını ve verinin cevaplandırabileceği sorulara odaklanılmasını sağlamak gerekiyor. Bu nedenle, veri madenciliği yapacak analistin ilk adımı veri tabanındaki verilerin hangi süreç ile ve nasıl toplandığını çok iyi anlamaktır. Bazı durumlarda çok bilgi var sanılırken, birçok gözlemde aynı bilginin kaydedilmiş olması, aslında bazı boyutlarda veri tabanının sığ olduğunu, bu boyutlardaki analizlerin çok az veriye dayandırılacağını gösterir. Yine verilerin toplanma sürecindeki istemsiz seçicilikler analizde ve daha da önemlisi analiz sonuçlarının nerelerde uygulanabilir olduğunu belirlemek açısından büyük önem taşır.

Ayrıca, analistlerin eğitim süreçlerinde genellikle temizlenmiş, örnek küçük veri tabanlarının kullanılması, onların büyük veri tabanlarını incelerken bazı önemli adımları atlamalarına neden olabilir. Bu nedenle, veri madenciliğinde ikinci adım veri tabanının içerdiği verileri iyi anlamaktır. Bunun için her gözlemde bulunan verilerin dağılımı, ilişkilendirilmesi planlanan boyutların örneklemesi ve veri tabanındaki gözlem birimi ile modellemeye temel oluşturacak gözlem birimi arasındaki farklılıkları giderme kuralları konsunda detaylı iredeleme yapılmalıdır. Bir veri tabanının iyi anlamak için yapılacak ilk yatırım, analizlerin ve sonuçların kullanılabilir olmasında büyük önem taşır.

Üçüncü önemli adım ise analiz sonuçlarının kullanılması planlanan kararları ve çevre şartlarını iyi anlamaktır. Çünkü veri tabanının hangi soruları yanıtlaması istendiğini anlamak doğru modelleme yapabilmenin temelidir. Korelasyon, neden-sonuç ilişkisi değildir. Doğru modelleme yapacak teorik bilgiyi edinmeksizin, sadece teknik olarak korelasyonlara dayandırılan çıkarımlar, analistlerin güvenilirliğini zedeleyebilir veya karar vericileri yanlış kararlara yönlendirebilir.

Dördüncü adım, teorik modeli kurmak ve veri tabanı kullanılarak test edilecek hipotezleri oluşturmaktır. Kurulan modelin, geçerliliğini test etmek, bu nedenle veri tabanının bir kısmını kullandıktan sonra model ile yapılacak öngörülerin veri tabanındaki diğer veriler kullanılarak doğrulanması, karar vericilerin modele duydukları güveni ve modelin gerçek hayatta kullanılma olasılığını artırır.

Özetle, veri madenciliği veriden bilgi üreterek, ortalama kararlar yerine özgün kararlar verilmesini destekleyen, satışları, kârlılığı, yenilikçiliği ve kaynak kullanımında etkinliği artıran önemli bir yönetim aracıdır. Yaşam kalitesini geliştirmek için kararlarımızı veriye dayandırmak konusundaki yetkinliklerimizi geliştirmeliyiz.