bilgiz.org

Veri madenciLİĞİne giRİŞ Veri Madenciliği Nedir?

  • İstatistiksel Kalite Kontrol
  • Kalite Kontrol ve Veri Madenciliği
  • VERİ MADENCİLİĞİ UYGULAMASINA ÖRNEKLER
  • Biyomedikal için veri madenciliği uygulamaları
  • Kampanyalarda veri madenciliği uygulamaları
  • Perakende satış sektöründe veri madenciliği uygulamaları
  • Sağlık hizmet sektöründe veri madenciliği uygulamasına örnekler



  • Sayfa8/8
    Tarih29.12.2017
    Büyüklüğü257.4 Kb.

    Indir 257.4 Kb.
    1   2   3   4   5   6   7   8

    6.3.8 Zaman Serileri

    Zaman değişkeniyle ilişkili bir değişken hakkında, elde edilen gözlem değerlerini zamana göre sıralanmış olarak gösteren serilere “zaman serileri” denir.

    Zaman serilerini konu alan çalışmaların genelinde, serilerin gözlem değerleri eşit aralıklı zaman noktalarında elde edilmiştir.
    Gelecek olayları ya da koşulları tahmin etmeye öngörü denir. Veri tabanı üzerinden elde edilen verilerle zaman serileri oluşturulur. Oluşturulan zaman serileri ile gerekli çözümlemeler yapılır ve öngörü işlemi ile geleceğe yönelik tahminlerde bulunulur. Bu noktada veri madenciliğinden yararlanılması, istenilen verilere daha kolay bir şekilde ulaşılmasını sağlar. Bu, aynı zamanda maliyet ve zamandan da tasarruf sağlanacağı anlamına gelmektedir.
    ÖRNEK 10: Hükümet politikalarının oluşturulabilmesi için işsizlik oranı, vergi oranı, elektrik tüketimi, kişi başına düşen milli gelir gibi ülkenin özelliklerini ortaya çıkarabilecek faktörler ile ilgili öngörülerde bulunulması gerekmektedir. Bu öngörü işlemi sonucunda ülkenin gelecekte hangi alanlarda sorunları artacak gibi gözüküyorsa o alanlarda sorunları çözümleyebilecek ilgili politikalar geç kalınmadan hükümet tarafından yürürlüğe konulmalıdır.
    ÖRNEK 11: Bir süpermarkette, mart ayının son haftasında nisan ayının ilk haftası için A marka şekerden ne kadar sipariş verilmesi gerektiğine dair bir tahminde bulunabilmek adına; son 2 ayda haftalar içerisinde A marka şekerin satış miktarına(kg) ilişkin, veri tabanı üzerinden ulaşılan verilerle bir zaman serisi elde edilmiştir. Buna göre;

    HAFTALAR ŞEKER MİKTARI(kg)

    Şubat 1.hafta 165

    Şubat 2.hafta 170

    Şubat 3.hafta 180

    Şubat 4.hafta 198

    Mart 1.hafta 200

    Mart 2.hafta 202

    Mart 3.hafta 207

    Mart 4.hafta 210+

    Bu zaman serisine göre şu öngörüde bulunulabilir: “Oluşturulan bu zaman serisine göre A marka şekerin satış miktarında son 8 haftada sürekli bir artış gözlenmiştir. Buna göre çok büyük bir olasılıkla nisan ayının ilk haftasında da A marka şekerin satış miktarında artış olacaktır. Bu durumda,nisan ayının ilk haftası için mart ayının son haftasında bugüne kadar satılan 210 kg.dan daha fazla sipariş verilmesi gerekir.


    Zaman serileri genel olarak “kartezyen koordinatlı” bir grafikle gösterilir.x ekseninde zaman değişkeninin şıkları, y ekseninde ise bu şıklar itibariyle y değişkeninin aldığı değerler yani gözlem değerleri yer alır.


    Zaman serileri ortalamadan gösterdiği sapmalara göre “durağan” ve “durağan olmayan” olmak üzere ikiye ayrılmaktadır.


    Ele alınan zaman serisinin ortalaması ve varyansı simetrik bir değişme göstermiyorsa bu tür zaman serilerine “durağan olmayan zaman serileri” denir.

    Gerçek hayatta zaman serilerinin çoğu durağan değildir, dolayısıyla serilerin ortalaması zamanla değişmektedir. Özellikle parasal veriler durağan olmayan zaman serilerinden oluşur. Durağan olmayan zaman serilerinin uygun bir modele oturtulması mümkün değildir. Bunun için de bu tür veriler üzerinde çalışırken serinin durağanlaştırılması gerekmektedir.


    Literatürde zamandan etkilenmeyen, ortalaması, varyansı ve kovaryansı sabit olan serilere “zayıf durağan seriler” adı verilir ve geniş anlamda “durağanlık” olarak bilinir. Güçlü durağanlıkta sonlu ortalama ve varyansa gerek yoktur. Tek denklemli zaman serilerinde zayıf durağanlık ve durağanlık arasında bir fark yoktur. Herhangi bir zt serisinin durağan olması şartları şu şekilde özetlenebilir:
    sabit aritmetik ortalama: E(zt)=

    sabit varyans: Var(zt)=


    gecikme sayısına bağlı kovaryans: cov(zt, zt+k )=

    Durağan zaman serilerinde ard arda gelen iki değer arasındaki fark zamanın kendisinden kaynaklanmamakta, sadece zaman aralığından kaynaklanmaktadır. Bu nedenle serinin ortalaması zamanla değişmemektedir.


    6.3.9 Kalite Kontrol

    Günümüzde serbest piyasa ekonomisi nedeniyle firmalar arasında yaşanan rekabet şartları, üreticileri minimum maliyetle yüksek kalitede ürün üretmeye zorlamaktadır.Ürün kalitesi, alıcının ya da tüketicinin kararını etkilemede giderek daha fazla öneme sahip olmaktadır.


    Kalite kontrol nedir?

    Özellikle 1980’li yıllardan itibaren bilinçlenen tüketicilerin hatalı ürün yada hizmete karşı tutumları, tüketici isteklerinin karşılanmasının ve tüketici tatmininin sağlanmasının kaçınılmaz olduğunu göstermiştir.Bütün bu gelişmeler kalite kontrol kavramını da beraberinde getirmiştir.

    KALİTE KONTROL :Kalite isteklerini sağlamak için kullanılan uygulama teknikleri ve faaliyetleridir.

    İstatistiksel Kalite Kontrol

    Gittikçe artan tüketici ihtiyaçları ve buna bağlı olarak genişleyen üretim hacmi, muayeneye dayalı bir denetim sisteminin uygulanmasını kimi zaman olanaksız kimi zaman da yüksek maliyetli kılmaya başlayınca üretilen ürünlerin kalite düzeylerinin araştırılması ve varsa kalite değişiminin belirlenmesi için “istatistiksel kalite kontrolü teknikleri”nden yararlanılmaya başlanmıştır.

    Bu amaçla ürünlerin tamamını muayene etmek yerine, belirli zaman aralıklarında prosesi yeterince temsil edebilecek nitelikte örneklemler çekilir ve bu örneklemlerden gelen sonuçlara dayanarak proses hakkında tahminde bulunulur. Geçmişteki bilgilere bakılarak geleceğe yönelik tahminlerde bulunulmasında veri madenciliği yöntemleri bir çok alanda olduğu gibi kalite kontrolde de kolaylık sağlar.

    İstatistiksel kalite kontrol tanımı:
    Bir ürünün en ekonomik, en yararlı aynı zamanda bir pazara sahip olacak biçimde üretimini sağlamak üzere, istatistiksel prensip ve yöntemlerin üretimin bütün aşamalarında uygulanmasıdır.

    Kalite Kontrol ve Veri Madenciliği

    Veri tabanı üzerinden elde edilen veriler üzerinde uygulanan kalite kontrol yöntemleriyle, kalite düzeyinin istenilen standartlara uygun olup olmadığı araştırılır. Eğer kalite düzeyi istenilen standartlara uygun değilse, kaliteyi istenilen seviyeye çıkartmak amacıyla çeşitli önlemler alınır.

    Kalite kontrolde veri madenciliğinden yararlanılması, veriye daha çabuk ve kolay ulaşılmasını, dolayısıyla zaman ve maliyetten tasarruf edilmesini sağlar.

    VERİ MADENCİLİĞİ UYGULAMASINA ÖRNEKLER

    Veri madenciliği, günümüzde pek çok sektörde önemli kullanım alanlarına sahiptir. Bugün birçok önemli firmanın, bulunduğu konuma gelmesinde doğru kullanılan veri madenciliği teknikleri ve uygulamaları önemli yer teşkil etmektedir.


    Biyomedikal için veri madenciliği uygulamaları

    DNA dizilimi 4 ana blok(nükleotit)tan oluşur. Bunlar ; Adenin(A), Sitozin(S), Guanin(G) ve Timin(T) dir.


    Bu nükleotitler birbirine sarılı bir ağ oluştururlar. Belirli bir sırada dizilen bu nükleotitlerin oluşturduğu yapıya gen denir.

    İnsanda yaklaşık 100.000 gen vardır.


    Hastalıklara yol açan gen sıralama örneklerini binlerce gen arasından bulmak oldukça zor bir iştir. Veri madenciliğinde geliştirilen sıralama örnek analizi ve benzerlik arama metotları DNA verisi üzerinde analiz yapmayı kolaylaştırmıştır.

    Kampanyalarda veri madenciliği uygulamaları

    Bu uygulamada bir bankada gerçekleştirilen bir pazarlama kampanyası örneği yer almaktadır. Bu kampanyada amaç ödeme davranışı “iyi” olan bireysel kredi kullanıcılarına kredi kartı sunmaktır.


    Kampanya için öncelikle ödeme davranışı “iyi” olanların belirlenmesi gerekir.

    Bu kampanyada “iyi” ödeme davranışlı müşterinin tanımı ilgili departman yöneticilerinin karşılıklı görüş alışverişleri sonunda saptanmıştır.

    Öncelikle;

    Ödemesini zamanında yapmayanlar ise gecikme sürelerine göre sınıflandırılmıştır:




    • Kredi geri ödemesini belli bir zamandan fazla geciktirenler

    • Kredi geri ödemesini belli bir zamandan fazla geciktirmeyenler

    Ödemesini belli bir zamandan fazla geciktirmeyenler bu kez geciktirme sayılarına göre sınıflandırılmıştır:



    Çok karmaşık gibi görünen bu sınıflandırmalar, veri ambarlarında depolanan veriler kullanılarak on binlerce mevcut müşteri için teknolojik destekle, çok kısa bir sürede yapılmıştır ve ödeme davranışı “iyi” olan müşteriler tespit edilerek kredi kartı hedef pazarı belirlenmiştir. Bu pazar;


    1)Kredi ödemesini süresi içinde yapanlar

    2)Kredi ödemesini süresi içinde yapmayanlar arasında ödemesini belli bir zamandan fazla geciktirmeyenler

    3)Kredi ödemesini süresi içinde yapmayanlar arasında ödemesini belli bir zamandan fazla geciktirenler içinden bir kez geciktirenlerden oluşmaktadır.


    Perakende satış sektöründe veri madenciliği uygulamaları

    Amerika’da 2 milyar dolar yatırımı olan 15 eyalette 129 mağazası bulunan bir firma yapılan çalışmalarla şu sonuca varılmıştır: “Mağazaya gelen müşteriler, promosyonlu ürünlerin bulunduğu sol taraftaki raflara yönelmekte ve alışveriş için diğer bölümleri gezmeye ihtiyaç duymamaktadır.”

    Bu sonuç ardından mağazanın dekorunda değişiklik yapılmış ve satışlarda artış gözlenmiştir.

    Sağlık hizmet sektöründe veri madenciliği uygulamasına örnekler

    MapInfo şirketi, haritalama teknolojisini kullanarak hastaların yoğun olarak bulunduğu bölgeleri işaretlemekte ve bu sayede bu bölgelere daha iyi hizmet sunabilmektedir.

    Rochester Kanser Merkezi Bölümü, araştırmalarında KnowledgeSEEKER adlı karar ağacı tekniğini kullanır

    Türkiye’den Örnekler




    AXA OYAK Sigorta İşlemleri ve Ödemeler’den Sorumlu Genel Müdür Yardımcısı Ali Erlat “SAS Veri Ambarı (Data Warehouse) ile tespit edilmiş sahtekârlıklarla ilgili kayıplara ilişkin veri kümeleri arasındaki ilişkileri ortaya çıkararak, müşteri verilerini bölümlere ayırabiliyoruz. AXA OYAK, sigorta ödemelerinin %5’inin hileli işlemlerden kaynaklandığını ortaya çıkardı; bunlar bugün düzeltiliyor ve gelecekte de önlenecek. Sigorta ödemelerimizin %5-7 arasında azaldığını güvenle söyleyebilirim. Aynı zamanda, pazar payımızı da artırdık. Bunlar, SAS’ı kullanarak veri madenciliği ve analiz prosesi işlemlerimizin iki doğrudan sonucudur.” değerlendirmesini yapıyor.

    TURKCELL, SAS'la başlattığı Kredi Derecelendirme Projesi ile müşterilerin farklı ödeme davranışları hakkında yeni bilgilere sahip olmuş ve doğru ödeme modelleri kurmuştur. Böylelikle müşteri memnuniyetini artırmanın yanı sıra, tahsilat sürecindeki maliyet ve riskleri azaltarak büyük bir avantaj sağlamıştır.

    TÜİK, ülkemizde ulusal ve uluslararası boyutta yararlar sağlayacağı inancıyla, en uçtaki kullanıcıdan, karar vericiye kadar geniş bir yelpaze içinde yer alan tüm kurum ve kuruluşların veri ve bilgi ihtiyacını gidermeyi amaçlamaktadır. İşte bu noktada SAS'ın İş Zekâsı Çözümleri'nin önemli parçalarından biri olan Analiz ve Raporlama Çözümleri, söz konusu uçtan uca ihtiyaçlara yanıt vermektedir. Türkiye'nin milyarlarca verisini kişi, kurum ve özel sektörün ihtiyaçlarına göre bilgiye dönüştürmektedir.



    1   2   3   4   5   6   7   8






        Ana sayfa


    Veri madenciLİĞİne giRİŞ Veri Madenciliği Nedir?

    Indir 257.4 Kb.