Veri Analizi

51 views
Skip to first unread message

M.Aksoy

unread,
Oct 17, 2011, 5:29:11 AM10/17/11
to ARÜ Bilgisayar Programcılığı 2. Sınıf 2. Öğretim
Veri Analizi Ödevlerinizi Bu Konu Başlığı Altında Belirtiniz...

Cahide Akyüz

unread,
Oct 17, 2011, 6:00:01 AM10/17/11
to arubil...@googlegroups.com

CAHİDE AKYÜZ ve GAMZE ŞENEL
Cahide AKYÜZ Gamze ŞENEL.docx

Mevlut Aksoy

unread,
Oct 17, 2011, 6:05:57 AM10/17/11
to ARÜ Bilgisayar Programcılığı 2. Sınıf 2. Öğretim
Çetele Diyagramı

Çetele diyagramları istatistik araçlarından birisi olup veriyi toplarken
kullanılır.Diğer istatistik teknikler için ilk aşamayı ve veri tabanını
oluşturur. Bu şekilde veriye ait istatistik özelliklerin anında
görülebilmesini sağlar. Kullanılabileceği alanlar:

- Performansla ilgili tartışmalarda tartışmayı güçlendirmek
- Bir problemin temel nedenini araştırmak
- Uygulanan bir iyileştirme yada çözümün sonuçlarını ölçmek
- Başka bir problemin varlığının tespiti  

Mevlüt AKSOY - Alev GÜMÜŞ 

Ersin Arslan

unread,
Oct 17, 2011, 6:18:34 AM10/17/11
to arubil...@googlegroups.com

ERSİN ARSLAN VE İBRAHİM BULUŞ

Ersin ARSLAN İbrahim BULUŞ.docx
Message has been deleted

Songül Allak

unread,
Oct 17, 2011, 8:19:54 AM10/17/11
to ARÜ Bilgisayar Programcılığı 2. Sınıf 2. Öğretim
Faktör Analizi


Faktör analizi, başlıca amacı aralarında ilişki bulunduğu düşünülen
çok sayıdaki değişken arasındaki ilişkilerin anlaşılmasını ve
yorumlanmasını kolaylaştırmak için daha az sayıdaki temel boyuta
indirgemek veya özetlemek olan bir grup çok değişkenli analiz
tekniğine verilen genel bir isimdir. Diğer bir ifade ile faktör
analizi, aralarında ilişki bulunan çok sayıda değişkenden oluşan bir
veri setine ait temel faktörlerin (ilişkinin yapısının) ortaya
çıkarılarak araştırmacı tarafından veri setinde yer alan kavramlar
arasındaki ilişkilerin daha kolay anlaşılmasına yardımcı olmaktır.

Faktör analizinde araştırmacı öncelikle araştırma bağlamında
kullanılan değişkenler setinin temelini oluşturan ana (temel)
faktörlerin neler olduğu ve bu faktörlerden her birinin değişkenlerden
her birini açıklama derecesini de görme imkanına sahip olmaktadır. Bu
yolla, araştırmacı elinde bulunan çok sayıda değişkenden oluşan
değişkenler setini daha az sayıda yeniden oluşturulmuş değişkenler
(faktörler) cinsinden ifade etme ve anlama imkânına sahip olacaktır.

Etkin bir faktör analizinin toplam veri setini en iyi temsil edebilen
ancak mümkün olduğunca az sayıda faktörden oluşan bir çözüm olması
arzu edilen özelliktir. İyi bir faktör analizi sonucunun hem basit hem
de yorumlama becerisinin iyi olması arzu edilir.

Faktör analiziyle ilgili teknikleri Açıklayıcı Faktör Analizi ve
Onaylayıcı Faktör Analizi olmak üzere iki başlık altında incelemek
mümkündür.

Açıklayıcı faktör analizinde araştırmacı araştırma yaptığı konuyla
ilgili olarak değişkenler arasındaki ilişkiye yönelik olarak herhangi
bir fikrinin veya öngörüsünün olmaması sebebiyle değişkenler
arasındaki muhtemel ilişkiyi ortaya çıkarmaya çalışır.

Onaylayıcı faktör analizinde ise araştırmacı tarafından daha önceden
belirlenen bir ilişkinin doğruluğunu test etmek amaçlanmaktadır.

Faktör analizi çeşitli aşamalardan oluşan bir analiz tekniğidir. Tipik
bir faktör analizinde yer alan aşamalar aşağıdaki şekilde
özetlenebilir.

1. Problem tanımı ve veri toplama: Bu aşama faktör analizi için
gerekli olan hazırlık çalışmalarını kapsayan ilk aşamadır. Bu aşamada
faktör analizinin amacı ve faktör analizinde kullanılacak olan
değişkenlerin teori, mevcut araştırmalar ve araştırmacının bilgi ve
tecrübeleri veya yaptığı ön çalışmalar (kalitatif veya kantitatif
türdeki çalışmalarla) ışığında geliştirilmesi ve uygun ölçüm araçları
ile ölçülmesi ve makul yöntemlerle verilerin toplanması işlemleri
yapılmaktadır.

2. Korelasyon matrisinin oluşturulması: Faktör analizinin ikinci
aşaması analiz sürecinin başladığı aşama olup, bu aşamada korelasyon
matrisi oluşturulur. Korelasyon matrisi faktör analizinde yer alan
değişkenler arasındaki ilişkiyi gösteren bir matristir.

3. Faktör sayısına karar verme: Üçüncü aşama ise, söz konusu veri seti
için faktör analizinin uygun olduğuna karar verdikten sonra,
oluşturulan korelasyon matrisini baz alarak, faktör çözümünü ortaya
koymak amacıyla uygun bir faktör çıkarma (oluşturma) yönteminin
seçilmesi ve başlangıç çözümünün oluşturulmasını kapsamaktadır.

4. Faktör Eksen Döndürme (Factor Rotation) Başlangıç faktör analizi
çözümüne ulaşıldıktan sonra (başlangıç faktör matrisi) ortaya çıkan
faktörlerin yorumlanması ve isimlendirilmesini kolaylaştırmak için
faktörleri temsil eden eksenlerde çeşitli manipülasyonlar veya eksen
kaydırmaları yapma yoluna gidilir.


harun çelik

unread,
Oct 17, 2011, 9:33:59 AM10/17/11
to arubil...@googlegroups.com
VERİ ANALİZ TEKNİKLERİ TALİMATI

1. AMAÇ:
Proseslerin kontrol altına alınması , toplanan verilerin analiz edilmesi ve bu analizler sonucu sürekli gelişimin sağlanması, hata olmadan önüne geçilmesi ve kullanıcı memnuniyetini sağlamak için kullanılan İstatistiksel Proses Kontrol Tekniği esaslarını belirlemektir.

2. KAPSAM:

Bu talimat Kalite Yönetim ve Genel Müdürü kapsar.

3. TANIMLAR:

3.1 İstatistiksel Proses Kontrol Teknikleri : Proseslerde en ekonomik yararlı ve sürekli
gelişim imkanı sağlamak amacıyla istatistiksel prensip ve tekniklerin bütün aşamalarda
uygulanmasıdır.
3.2 Proses : Girdileri çıktılara dönüştüren birbirleri ile ilişkili veya etkileşimli faaliyetler takımı.

4. SORUMLULUK:

4.1. Kalite Yönetim Müdürlüğü


17 Ekim 2011 12:29 tarihinde M.Aksoy <batan...@gmail.com> yazdı:

talipcelik89

unread,
Oct 17, 2011, 9:36:45 AM10/17/11
to arubil...@googlegroups.com
 İŞLEM:

 İPK tekniği uygulama usulü aşağıda verilen esaslar çerçevesinde yapılacaktır.


1 Öncelikle bir araştırma yapılarak İPK uygulanacak sahalar belirlenir.
2 Bu sahalar belirlenirken:
- Verimlilikte düzenli bir azalışın görülmesi,
- Uymazlık raporlarının sıkça tutulması,
- Bazı proses operasyonlarında sürekli problemlerin tespit edilmesi,
- Bir ön çalışmayla elde edilen verilerin analiz sonucu prosesin kontrol altına alınmak istenmesi,
- Bakım onarım faaliyetlerinde tutulan hata raporlarının sıkça görülmesi,
- İmalatı sürekli yapılan işlerde operasyonun kontrol altında tutulmasının istenmesi gibi durumlar göz önüne alınır.
İPK uygulanacak sahalar prosesler belirlendikten sonra hangi İPK tekniğinin uygulanacağına karar verilir.
Her konuya İPK tekniklerinin tamamının uygulanması gerekmeyebilir. Konunun önemine göre Problem çözme tekniklerinden bir veya birkaç tanesi seçilebilir.
4 İPK teknikleri ise:
- Akış Şemaları,
- Beyin Fırtınası,
- Nomınal Grup Tekniği Uygulaması,
- Pareto diyagramları,
- Dağılım Diyagramları,
- Histogramlar,
- Kontrol Diyagramlarından oluşur.




4.1 Akış Şemaları: Bu teknik yapılan yada yapılacak işlemlerin her aşamasının bir takım şekillerle ( Sembollerle ) gösterildiği şemalardır. Faaliyetin gidişatını rahat takip etmek ; ürün ve hizmetin gerçek ve ideal yollarının karşılaştırılması için kullanılır.
4.2 Beyin Fırtınası: Zamansız değerlendirmenin kaçınıldığı planlı bir fikir üretme işlemi, yeni fikirlerin beslendiği ve yeni anlayışların geliştiği açık bir ortamda sürdürülen sınırlandırılmamış bir tartışmadır. Kimin ne söylediği konusunda hiçbir sınırlama olmaksızın tüm yönleri gözden geçirilebilir.
4.3. Nominal Grup Tekniği Uygulaması: Bu teknik delil toplama, sorunların ve güçlü olunan noktaların belirlenmesi, fikir üretme ve gelişmelerin değerlendirilmesi için katılımcı bir yaklaşım mantığına dayalı problem çözme tekniğidir.
4.4 Pareto Diyagramları: Bu teknik en önemli birkaç konu veya sorun üzerinde dikkatle yoğunlaştırıldığından ve önceliklerin benimsenmesine yardımcı olduğundan verimlilik analizi için yararlı bir araçtır. Problemlerin hangi sırayla çözüleceğinin belirlenmesinde yardımcı olup en önemli problemin en sola yazıldığı dikey çubuk grafiğidir. Bu diyagramlar kullanılarak ürün, bakım onarım, revizyon gibi faaliyetlerde kalite kayıplarını oluşturan sebepler belirlenebilir.
4.5 Sebep Sonuç Diyagramları: Belirli bir problem veya sonucun nedenini araştırmak belirlemek ve göstermek amacıyla kullanılır. Sonuç ile sonuca etkisi olan muhtemel bütün sebepleri bir arada göstermek için düzenlenir. Bu teknikte sonuç veya problem diyagramının sağ tarafına bütün muhtemel sebepler , diyagramın sol tarafına işaretlenerek çalışmalar yapılır.
4.6 Dağılım Diyagramları: Değişimleri inceleyen bir diyagram türü olarak bilinen dağılım diyagramı birbirleri ile ilgili iki değişken arasında biri değiştiğinde diğer değişkenin ne olduğunu göstermek için fikir veren bir diyagram türüdür.
4.7. Histogramlar: İki veya daha fazla frekans dağılımını mukayese etmek için çizilir. Yani herhangi bir prosesin içinde yer alan değişimlerin miktarlarını ortaya çıkarır ve ürünün sadece bir karakterini sayısal olarak gösterdiği sıklığı belirler. Ölçülemeyen nitelikler histogramda gösterilmezler.

4.8. Kontrol grafiklerinde prensip üretilen mamullerden alınacak örneklerin normal üretim
şartları altında ne kadar bir değişim gösterdiklerini rehber alarak örneklerin ortaya koydukları kalite
değişimlerinin tesadüfi faktörlere mi yoksa belirli diğer sebeplere mi bağlı olabileceklerini kararlaştırmaktır. Eğer örneklerin ortaya koydukları değişimler,normal üretim şartları altında görülen değişimin artmasını sonuçlandırıyorsa bir aksaklık var demektir.
5. Uygulanacak olan İPK tekniği belirlendikten sonra veri toplama işlemine geçilir.
6. İPK uygulamalarında doğru sonuçlara ulaşmak için veriler sağlıklı bir şekilde
toplanmalı ve mümkün olduğu kadar üretim içinden rasgele alınmalıdır.




7 Veriler üretim ve kontrol grupları tarafından toplanarak uygulanacak olan İPK tekniği
belirlenir.
8 Belirlenen İPK tekniğine göre analizler yapılır. Yapılan analiz sonuçları üretim hattında görülebilecek yerlere periyodik zamanlarda asılır.
9 Yapılan analizler sonucu tespit edilen aksaklıklar problemler ilgili birimlerle yapılacak
çalışmalarla giderilmeye çalışılır.
10 Üretim ve kontrol gruplarına diğer birimlerle sürekli ilişkiler kurularak İPK analizleri
sonuçlarına göre yön verilmesi sağlanır.



17 Ekim 2011 12:29 tarihinde M.Aksoy <batan...@gmail.com> yazdı:
Veri Analizi Ödevlerinizi Bu Konu Başlığı Altında Belirtiniz...

ERHAN ARAS

unread,
Oct 17, 2011, 9:40:50 AM10/17/11
to arubil...@googlegroups.com
Ekte ödevim mevcuttur.

17 Ekim 2011 12:29 tarihinde M.Aksoy <batan...@gmail.com> yazdı:
Veri Analizi Ödevlerinizi Bu Konu Başlığı Altında Belirtiniz...



--
ERHAN ARAS

Güvenirlilik Analizi.docx

Gülnihal Aras

unread,
Oct 17, 2011, 9:45:14 AM10/17/11
to arubil...@googlegroups.com

1

Veri Analizi - Veri Kalitesi ve Bütünlü

gü

Veri analizi sürecinde istatistiksel yöntem ve tekniklerin uygulanması, bilgisayarın hayatımızda

olmadı

gı ya da bu yöntem ve tekniklerin kullanımına yönelik yazılımların üretilmedigi dönemlerde,

özellikle sosyal bilimciler için teorik istatistik bilgisi gerektiren bir a

sama olup bir hayli zaman

almaktaydı.

Günümüzde bilgisayar kullanımının yaygınla

smasıyla, her alanda oldugu gibi bu alanda da paket

programların piyasaya sürülmesi veri analizi sürecini oldukça kolayla

stırmaktadır. Gün geçtikçe

üretici firmaların rekabetçi bir anlayı

sla bu alandaki programları gelistirip daha yeni sürümlerle ve

daha profesyonel yazılımlarla kar

sımıza çıkması, arastırmacıların üzerinden büyük bir yük almakta ve

kısa bir süre içerisinde istenilen istatistiksel analizlerin yapılmasına olanak sa

glamaktadır.

Peki veri nedir? Veri, nesneler ve nesnelerin niteliklerinden olu

san bir kümedir. Örnek olarak kayıt

(record), varlık (entity), örnek (sample, instance), nesne için kullanılabilir. Nitelik (attribute) bir

nesnenin bir özelli

gidir. Örnek olarak boyut (dimension), özellik (feature, characteristic) olarak da

kullanılırç Nitelikler ve niteliklere ait de

gerler bir nesneyi olusturur. Uygulamalarda toplanan veri

yetersiz, tutarsız ya da gürültülü olabilir. Hata sebepleri:

Hatalı veri toplama gereçleri

Veri giris problemleri

Veri girisi sırasında kullanıcıların hatalı yorumları

Veri iletim hataları

Teknolojik sınırlamalar

Veri isimlendirmede veya yapısında uyumsuzluk

Hatalı Veri Örnek

Operasyonel uniteler ya da

departmanlar arası tutarlı olmayan veri

steri Numarası

Tekrar eden kayıtlar steri Bilgileri

Eksik veri steri Ismi ve Adresi

Tutarlı olmayan veri girisleri Ödemeler

Veri format sorunları steri Numaraları (alpha,

numeric)

Geçerli olmayan veri uzunlukları steri Adresi

Tutarlı olmayan veri iliskileri Geçerli olmayan

Ödemeler

Güncel olmayan bilgi Geçerli olmayan

Ödemeler

Deloitte –Veri Bütünlü

gü Hizmetleri –Hizmet Sunumu Yaklasımı

Bu hataların sonusunda da tekrarlanan kayıtlar, çeli

skili veriler ve yetersiz veriler ortaya çıkmaktadır.

Bu hatalardan yoksun verinin temin edilmesi ve ara

stırmanın amacına uygun istatistiksel teknigin

seçimi; verilerin ölçüm biçimi, de

gisken(ler)in türü, karsılastırılacak grup sayısı, gruplardaki denek

sayısı gibi faktörlere ba

glıdır. Bu baglamda, arastırmacının uygulayacagı istatistiksel teknige karar

verebilmesi için a

sagıda verilen bazı temel kavram ve bilgiler hakkında yeterli bilgiye sahip olması

gerekmektedir:

2

statistik

Veri

Seri

Frekans

statistiksel anlamlılık

statistiksel hipotez

Degisken

Ölçek Çesitleri

Veri Analizinde Kullanılacak statistiksel Teknikler

Denetim ve danı

smanlık dünyasında veri analizinin yeri çok farklıdır. Günümüzde verilerin büyük

hacimlere ula

sması ve bunun daha kısa süreler içinde katlanarak artması ve karmasıklasması,

çalı

smalarımızda daha kapsamlı ancak kolay kullanılabilen ve yenilenen teknolojilerle uyumlu

yazılımlara duyulan gereksinimi de artırmaktadır. Daha büyük veri kaynaklarından hemen her

formatta veri okuyabilen, en geli

smis veri analizi tekniklerini barındıran, hızlı ve dogru analizlerle

ayrıntılı ve çok çe

sitli grafikler ve raporlar üretebilen yazılımların istedigimiz sonuçlara kolaylıkla

ula

smamızda çok büyük yardımları olmaktadır.

Veri analizi süreci, bilimsel ara

stırma sürecinin en önemli basamaklarından biridir. Bu süreçte

toplanılan veriler amaca uygun istatistiksel teknikler ile i

slenir veya analiz edilir. Son zamanlarda

s

irketler etkinlik ve verimliliklerini artırabilmek ve karar mekanizmalarını güçlendirebilmek için veri

kalitesi ve bütünlü

güne verdikleri degeri ve zamanı artırmaktadır. Bunun nedeni, veri kalitesi ve

bütünlü

günün firmalara katmakta oldugu degerin farkındalık yaratmasıdır. Veri kalitesi ve

bütünlü

günün saglayacagı degerler/faydalar asagıdaki sekilde özetlenmektedir: Veri Analizi Egitimi,

Veri Kalitesi Kontrolü, Gelir Güvencesi, Veri Analizi ve De

gerlendirmesi, SAS 99/Fraud Analizleri

ve Maliyet Dü

sürme.

Veri Kalitesi ve Bütünlü

gü Servisleri

Deloitte –Veri Kalitesi ve Bütünlü

gü – ç Denetim

Tüm dünyada bilgi yanlı

sgının veya eksikliginin yol açacagı risklerin tespiti, birden fazla sistemin

birle

smesi, bilgi düzeltilmesine ihtiyaç duyulması ve eksik bilginin tamamlanması gibi konularda veri

analizi süreci devreye girmektedir. Peki Türkiye’de hangi

sirketler veri kalitesi ve bütünlügü

çalı

smalarına ihtiyaç duymaktadır?

3

Büyük kapasitelerde arsiv bilgisine sahip olanlar,

Kompleks yapılara sahip olanlar,

Büyük rakamlarda müsteri sayısına sahip olanlar.

Bu

sirketler Veri Kalitesi ve Bütünlügü konusunda kendilerini nasıl gelistirebilir ya da hangi

konularda destek alabilir?

Günümüzde Veri Kalitesi ve Bütünlü

gü hizmetleri aslında 5 ana baslık çerçevesinde toparlanabilir :

Veri Do

grulama (Data Validation), Veri Madenciligi (Data Mining), Veri Temizleme (Data

Cleansing), Veri Optimizasyonu (Data Optimization) ve son olarak Kontrollerin

zlenmesi/Takibi

(Monitoring Controls). Fakat bunların ayrı ayrı kullanılmalarının söz konusu oldu

gu gibi projenin

yapısına ve büyüklü

güne baglı olarak da birlikte kullanılmaları da mümkündür.

Veri Do

grulama (Data Validation)

S

irketler yeniden yapılanma ya da varolan sistemlerinde degisiklik yaratıp daha yeni ve kolay

kullanılabilen sistemler ya da veriler yaratabilmek için inanılmaz çok zaman ve para harcamaktadır.

Fakat bu noktada her yeni sistem uygulamasında ya da veri geçi

sinde verinin bozulma ihtimali

oldu

gunu unutmamak gerekiyor. Kısaca, her yeni sistem degisikligi aslında bir risk dogurmakta ve

veri do

grulama islemine gereksinimi artırmaktadır. Dolayısı ile kurumların da bu yeni sistemlerin

do

grulugunu ve verinin bütünlügünü teyit etmeleri gerekmektedir.

Veri Madencili

gi (Data Mining)

Veri madencili

gi, büyük ölçekli veriler arasından bilgiye ulasma isi ya da bir anlamda büyük veri

gınları içerisinden gelecek ile ilgili tahminde bulunabilmemizi saglayabilecek bagıntıların bilgisayar

programı kullanarak aranmasıdır. Borç veren, devralıcı ya da resmi kurumlar tarafından açı

ga çıkarılan

finansal verinin ba

gımsız tahminleri çok çabuk istenmektedir ve bu da çok büyük olan bir verinin

acilen incelenmesini gerektirmektedir. Veri madencili

gi sorgu isleme (sonuçç çıkarıma yönelik) ya da

uzman sistemler veya küçük istatistiksel programlar de

gildir. Veri madenciligi aslında bilgi kesfi

sürecinin bir parçası

seklinde kabul görmektedir. Bu adımlar:

Veri Temizleme (gürültülü ve tutarsız verileri çıkarmak)

Veri Bütünlestirme (birçok veri kaynagını birlestirebilmek)

Veri Seçme (Yapılacak olan analiz ile ilgili olan verileri belirlemek)

Veri Dönüsümü (Verinin veri madenciligi tekniginden kullanılabilecek hale

dönüsümünü gerçeklestirmek)

Veri Madenciligi (Veri örüntülerini yakalayabilmek için akıllı metotları uygulamak)

Örüntü Degerlendirme (Bazı ölçümlere göre elde edilmis bilgiyi temsil eden ilginç

örüntüleri tanımlamak)

Bilgi Sunumu (Madenciligi yapılmıs olan elde edilmis bilginin kullanıcıya sunumunu

gerçeklestirmek)

Anlamlı ve güvenilir bilginin çabuk ve do

gru bir sekilde edinebilmesi için, veri analizi ve istatistiksel

örnekleme deneyiminin birle

stirilmesi gerekmektedir. Ancak bu sekilde istatistiksel dogrulugu

kanıtlanmı

s veriye ulasılabilir.

Günümüzde

sirketlerin is ve stratejik karar alma süreçlerinde en büyük gereksinimlerden biri de, sahip

oldukları ham veriyi i

sleyerek yeni bilgi, fırsat ve aksiyonlar üretmek; ürettikleri bilgiyi piyasa

ihtiyaçlarına yanıt verecek biçimde kullanmaktır. Veri Madencili

gi; finans, bankacılık, perakende,

sigorta, telekomünikasyon ba

sta olmak üzere pek çok sektörde, sirketlerin veritabanları ya da veri

ambarlarında bulunan verilerden gelece

ge yönelik tahminler, modeller elde etmeye olanak

sa

glamaktadır. Veri Madenciligi yöntemleri ile sirketler, çok büyük veri yıgınlarından önceden

4

bilinmeyen, geçerli ve uygulanabilir de

gerli bilgiyi kısa sürede elde ederek önemli rekabet avantajları

(gelirlerde artı

s, maliyetlerde düsüs ve yetkin bir piyasa farkındalıgı...) saglayabilmektedir. Dünyanın

önde gelen firmaları, veri madencili

gi tekniklerini; müsteri iliskileri yönetiminden, kredi

derecelendirmeye; risk analizinden, satı

s tahminlerine kadar pek çok alanda basarıyla

kullanmaktadırlar. Veri madencili

ginde asagıdaki teknikler uygulanmaktadır:

Yapay sinir agları

Genetik algoritmalar

statistik kökenli yöntemler

Kural eldesi algoritmaları ve karar agaçları

Veri görsellestirme

Yapay Sinir

A

gları

Genetik

Algoritmalar

I

statistik

Kökenli

Yöntemler

Kural Eldesi

ve Karar

A

gaçları

Veri

Görselle

stirme

Yapılandırma

Kolaylı

gı

sük Çok Düsük Yüksek Çok Yüksek Orta

Esneklik

Yüksek Orta Orta sük Düsük

Otonomi

Yüksek Yüksek sük Düsük Çok Yüksek

Hesaplama

Karma

sası

Çok Yüksek Çok Yüksek

Orta sük Çok Yüksek

Açıklayabilirlik

Çok Düsük Yüksek Orta Çok Yüksek Çok Yüksek

Deloitte –Veri Madencili

gi Teknikleri

Veri Temizleme (Data Cleansing)

Veri analizi i

slemini gerçeklestimenin öncesinde veri temizligi yapmak gerekmektedir. Bu adım çok

kritiktir ve veri analizi sürecinin ba

sarılı ya da basarısız olmasında bir anahtar islevi görmektedir.

Öncelikle verilerin gerçek süreçleri ve de

gisiklikleri yansıtacak bir biçimde hazırlanması

gerekmektedir. Tipik olarak, veri temizleme uyumsuz ve tamamlanmamı

s kayıtların ortaya

çıkarılmasını içerir. Uyumsuz kayıtlar, tipik de

gerlerden önemli ölçüde farklı olan degerlerdir.

Tamamlanmamı

s kayıtlar ise, veri giris sistemlerindeki hataların sonuçları olabilir. Hatalı ya da

tamamlanmamı

s veriler bir kere tepit edildiginde, analizden çıkarılmalı ya da düzeltilmelidir.

Gerçek uygulamalarda veri eksik, gürültülü veya tutarsız olabilir. Veri temizleme i

slemleri eksik

nitelik de

gerlerini tamamlama, aykırılıkların bulunması ve gürültülü verinin düzeltilmesi ve

tutarsızlıkların giderilmesini içermektedir. Veri için bazı niteliklerin de

gerleri her zaman

bilinmeyebilir, buna eksik veri adı verilir. Eksik veri di

ger veri kayıtlarıyla tutarsızlıgı nedeniyle

silinmesi, bazı nitelik de

gerleri hatalı olması dolayısıyla silinmesi, yanlıs anlama sonucu

kaydedilmeme ve veri giri

si sırasında bazı nitelikleri önemsiz göre sonucunda ortaya çıkabilir. Eksik

verinin tamamlanabilinmesi için a

sagıdaki adımlar uygulanabilir:

Eksik nitelik degerleri olan veri kayıtlatını kullanma

Eksik nitelik degerlerini manuel olarak doldurma

Eksik nitelik degerleri için global bir degisken kullanma (null, bilinmiyor...)

Eksik nitelik degerlerini o niteligin ortalama degeri ile doldurma

Aynı sınıfa ait kayıtların nitelik degerlerinin ortalaması ile doldurma

Olasılıgı en fazla olan nitelik degeriyle doldurma

Gürültülü veri ise, ölçülen bir de

gerdeki hatadan kaynaklanır. Yanlıs nitelik degerleri hatalı veri

toplama gereçleri, veri giri problemleri, veri iletimi problemleri, teknolojik kısıtlar ve nitelik

5

isimlerinde ki tutarsızlıktan meydana gelebilir. Gürültülü verinin düzeltilebilmesi için a

sagıdaki

adımlar uygulanabilir:

Bölmeleme (veri sıralanır, esit esitlik veya esit derinlik ile bölünür)

Demetleme (aykırılıkları belirler)

Egri uydurma (veriyi fonksiyona uydurarak gürültüyü düzeltir)

Veri Temizleme metodu sonucunda ERP ve ebusiness çalı

smaları için kesin ve uygulanabilir fayda

sa

glanmaktadır. Ayrıca Veri Optimizasyonu ile de ek faydalar elde edilebilir:

Veri Temizleme Faydaları Veri Optimizasyonu Faydaları

SAP'e temiz geçis Gelismis Nakit Akısı

Sistem entegrasyonu ve yazılım

uygulamaları sonucu ortaya çıkan katma

de

ger

Organizasyondaki sonuç odaklı

departmanlara daha çok kaynak ve zaman

ayrılması

E-business'a geçis sürecindeki basarı

Stratejik kararları etkileyen analizlerin

iyile

stirilmesi

Gelismis steri servisi ve memnuniyeti Organizasyon içerisindeki gelismis iliskiler

Potensiyel risk seviyesinde azalma

steri ve tedarikçi tarafında risklerin

azalması

Temiz veri sonucu elde edilen rekabetçi

üstünlük

Deloitte –Veri Bütünlü

gü Hizmetleri –Hizmet Sunumu Yaklasımı

Veri Optimizasyonu (Data Optimization)

Veri i

sleme ve veri islemenin eniyilenmesi (optimizasyonu) yönetsel yapılarda büyük önem kazanır.

Büyük tutarlarda verinin i

slenmesi, zamansal kısıtlar nedeniyle, genellikle, eniyileme gerektirir.

Bu noktada, Veri Temizleme (Data Cleansing) ve Veri Optimizasyonu’nun (Data Optimization)

benzerliklerini ve farklılıklarını çok iyi anlamak gerekmektedir. Veri Temizleme i

slemi kesinlikle veri

optimizasyonundan önce gerçekle

stirilmelidir, çünkü ancak temiz veri ile güvenilir veri analizi

sonucuna ula

sılabilir. Bunun yanında ise, asagıdaki sekilden de anlasılabilecegi gibi Veri Temizleme

ve Veri Optimizasyonu’nun güçlü yanları ele alınarak, ikisini birlikte kullanmak Proje

Sürecini/Döngüsünü daha güçlü bir hale getirmektedir:

Proje Süreci/Döngüsü

Deloitte –Veri Bütünlü

gü Hizmetleri –Hizmet Sunumu Yaklasımı

6

Kontrollerin

zlenmesi/Takibi (Monitoring Controls)

Prosedür ve kontroller otomize oldu

gu sürece, bilginin dogrulugunu teyit etmek amacı ile üst yönetim

ya da ba

gımsız gözden geçirmeye duyulan ihtiyaç artmaktadır. Aksi takdirde üst yönetim veri

do

grulugu ve bütünlügünden emin olamaz. Bu durumda da veri örneklemesi ve analizi yardımı ile

düzenli özet istatistikler önem kazanmaktadır.

Geçmi

se yönelik veri saklayan sistemlerdeki verinin kalitesini ve günümüz kosullarındaki ise

yararlılı

gını ölçmeyi ve artırmayı, anlamlı hale gelmesini saglamayı ve sirketlerin hızlı ve esnek

raporlama gereksinimlerini kar

sılamayı hedefleyen veri kalitesi ve bütünlügü konusu son günlerde tüm

dünyada oldu

gu gibi Türkiye’de de ilgi çekmeye ve önem kazanmaya baslamıstır. Bu fonksiyonun

gerçekle

smesi için özel yazılımlar kullanılmakta, çesitli istatistiksel metotlar ile verilerin analizi

gerçekle

stirilmektedir. Denetim ve danısmanlık dünyasında da veri kalitesi ve bütünlügü kapsamında,

uygulamalardaki veriler firmaların talepleri do

grultusunda düzeltilmekte veya yeniden sisteme

girilmektedir.

Zaman içerisinde bütün sistemlerin özelliklerinde ve dolayısıyla ürettikleri verilerde ortaya çıkan

de

gisiklikler, kurulan modellerin sürekli olarak izlenmesini ve gerekiyorsa yeniden düzenlenmesini

gerektirmektedir. Tahmin edilen ve gözlenen de

giskenler arasındaki farklılıgı gösteren grafikler model

sonuçlarının izlenmesinde kullanılan yararlı bir yöntemdir.

7

Kaynaklar:

Ann Thornton and Sheri Redokovitz from Deloitte & Touche. “Data Quality and Integrity –

Analysis & Estimation“, February 2008

Bilimsel Ara

stırma Süreci ve SSPS ile Veri Analizi, Kasım 2008

Frelinger, Bob. “ISACA to Offer New IT Governance Credential”, Vol.2, July 2007

Timothy Krick and Gregory Elmore from Deloitte & Touche. “Data Quality and Integrity

(DQI) Internal Audit“, March 2008

Vikipedia Özgür Ansiklopedi. “Veri Madencili

gi”, Kasım 2008

Rowsell-Jones, Andrew. “Finding success with standards”, CIO Canada, Dec 2006

Infora Advanced Analytical Solutions – Veri Temizleme, Kasım 2008

Rasmussen, Michael. “Taking Control of IT Risk”, Forrester Research, 2005

Hughes, Greg. “IT Risk Management Report”, Symantec Corporation, Vol. 1, February 2007

Yrd. Doç. Dr.

Sule Gündüz Ögüdücü. “Veri Madenciligi – Veri Önisleme”, Ekim 2008

Ali Alkan. “Finansal Uygulamalarda Veri Madencili

gi”, 8 Haziran 2007

2. Uluslararası Kalite Organizasyonları ve Profesyonelleri Zirvesi. “Kalite

yilestirmede Veri

Madencili

gi Yaklasımları ve Uygulamaları, 12 Kasım 2007

17 Ekim 2011 12:29 tarihinde M.Aksoy <batan...@gmail.com> yazdı:
Veri Analizi Ödevlerinizi Bu Konu Başlığı Altında Belirtiniz...

sultan şener gülnihal aras

İbrahim Buluş

unread,
Oct 17, 2011, 9:49:10 AM10/17/11
to arubil...@googlegroups.com
UYGUN İSTATİSTİKSEL ANALİZ YÖNTEMİNİN BELİRLENMESİ

İsimsel ölçekli verilerde uygulanabilecek yöntemler;
*Sınıflayıcı tablolar yapılır.(frekans tabloları)
* Değişken sayısı yeterli ise çapraz ya da iç içe tablolar yapılır.
* Her sınıfta göresel frekanslar (yüzdeler) bulunur.
* Sınıflarda yığılımın homojenliği test edilir.
* Deneysel olasılıklara göre herhangi bir dağılıma uygunluk testi yapılır.
* Mod seçenek belirlenir.
* Kategorilerinin gözlenme oranları belirlenerek oransal karşılaştırmalar yapılabilir.
* İsimsel ölçeklere uygulanan birliktelik katsayıları hesaplanır.
* Çapraz tablo biçiminde isimsel değişkenler arasında bağımsızlık analizi yapılır.
* İsimsel ölçekli verilere uygulanan parametrik olmayan yöntemlerle hipotezler test edilir.

Sıralı ölçekli verilerde uygulanabilecek yöntemler;
*Sınıflayıcı tablolar yapılır.(frekans tabloları)
* Değişken sayısı yeterli ise çapraz ya da iç içe tablolar yapılır.
* Her sınıfta göresel frekanslar (yüzdeler) bulunur
* Sınıflarda yığılımın homojenliği test edilir.
* Deneysel olasılıklara göre herhangi bir dağılıma uygunluk testi yapılır
* Ardışık katagorilere göre verilerde sıralama puanları bulunur.Medyana göre gözlemlerin rastgeleliği test edilebilir.
* Dizilişlerin rastgeleliği test edilebilir.
* Mod sınıf belirlenebilir.
* Sıralama puanına göre parametrik olmayan korelasyon analizi yapılabilir.
* Sıralı ölçeklere uygulanan birliktelik katsayıları hesaplanabilir.
* Ardışık katagoriler arasında doğrusal bir birliktelik analizi yapılır.
* Sıralı ölçekli verilerde kullanılan parametrik olmayan yöntemlerle hipotezler test edilir

Aralıklı ölçekli verilerde uygulanabilecek yöntemler;

• Frekans ve göresel frekans (yüzdeler) bulunur.
• Ortalama ,standart sapma, st.hata gibi belirtici istatistikler hesaplanır.
• Uygun parametrik testlerle değerlendirmeler yapılır.Dağılım varsayımları ile uygunluk testleri , sınıflarda yığılımın homojenliği test edilir.
• Neden-sonuç ilişkileri için regresyon –korelasyon analizi yapılır.
• İki yada daha fazla değişken birlikte ele alınarak çok değişkenli analiz analizler yapılabilir.
İBRAHİM TOLGA ADEM

17 Ekim 2011 12:29 tarihinde M.Aksoy <batan...@gmail.com> yazdı:
Veri Analizi Ödevlerinizi Bu Konu Başlığı Altında Belirtiniz...

talip çelik

unread,
Oct 23, 2011, 3:34:16 PM10/23/11
to arubil...@googlegroups.com

Ki-kare Analiz Yöntemi

"Ki-kare"  analiz yöntemi daha çok sosyal bilimler alanında kulanılan anliz yöntemidir verilerin sunuluş biçimine göre ikiye ayrılır. "Ki-kare uygunluk testi" ve "Ki-kare bağımsızlık testi" ki-kare analiz yöntemi ilişkilerin saptanmasında,degişkenler arasındaki farkların belirlenmesinde kulanılır. Degişkenler arasındaki ilişki konusunda sınırlı bilgi verir. "Ki-kare" analiz yöntemi frekans dağılımları üzerinden işlem yapan bir analiz yöntemidir. Değişkenlerin bağımsızlığını ölçmede yaygın olarak kulanılır. "Ki-kare" değeri serbestlik derecesine bağlı olduğundan, analizde yer alan gözlem sayısı arttıkça "Ki-kare" değeri de artar. "Ki-kare" analiz yöntemi bir çapraz tabloda yer alan değişkenler arasındaki gözlenen ilişkinin istatistiksel olarak anlamlı olup olmadığını test etmek amacıyla kullanılır

Ki-kare Uygunluk Testi probabilitydensityfunction, cumulativedensityfunction gibi herhangi bir olasılık dağılımına uygunluğunu belirlemek için uygulanan "Ki-kare" testlerine "Ki-kare" uygunluk testi adı verilir. Örnekler;
- Öğretmenlerin öğretim yöntemlerine ilişkin uyguladıkları yöntemler arasında anlamlı bir farklılık var mıdır?
- Üniversite öğrencilerinin barınma yeri konusundaki tercihleri arasında anlamlı bir farklılık var mıdır?
Ki-kare Bağımsızlık Testi Değişkenlerin alt grupları arasında bağımlılık, birlikte değişim olup olmadığını ortaya çıkarmak amacıyla uygulanan "Ki-kare" testi "Ki-kare" bağımsızlık testi olarak adlandırılır.

Örnekler:
- Bir yörede yaşayan halkın siyasi parti tercihi meslek dallarına göre anlamlı bir farklılık gösterir mi?
- Devlet memurlarının "aldığınız ücretten memnun musunuz?" sorusuna "evet", " kısmen" ve "hayır" şeklinde verdikleri cevapların dağılımı medeni duruma göre anlamlı bir farklılık gösterir mi?
Mcnemar Ki-kare Testi İki gruplu bağımlı iki örneklem testidir. Değişmelerdeki anlamlılığı ölçmekte kullanılır.

 

103278006                  Talip çelik

103278009                   Harun çelik

 



17 Ekim 2011 12:29 tarihinde M.Aksoy <batan...@gmail.com> yazdı:
Veri Analizi Ödevlerinizi Bu Konu Başlığı Altında Belirtiniz...

Reply all
Reply to author
Forward
0 new messages