İstatistiki Kandırmacalar
"İstatistik öyle bir alan ki neredeyse değerleri istediğin gibi konuşturabilirsin demek geçiyor içimden...Buradaki kontrol mekanizması nasıl en sağlıklı şekilde işleyebilir?" - sorusuyla geldi sevgili Ayşe ORUÇ
Ben de açıklamayı biraz geniş tutmak gerektiğini düşündüm.
Benjamin DISRAELI'nin (1804-1881) bir sözü var, "There are three kinds of lies: lies, damned lies, and statistics" anlamı
"Üç çeşit yalan vardır: yalanlar, korukunç yalanlar ve istatistik"
Bu sözden sonra istatistiğin çok temiz bir alan olduğunu söylemeyeceğim tabii ki.
Bence istatistik bol bol duyduğumuz ve hakkında konuştuğumuz ama pek anlamadığımız bir konu. İstatistiği pek bilmediğimiz için bir çok noktada kandırılıyor veya kararlarımızda sapmalar yaşıyoruz.
İstatistikte kandırmacalara karşı bazı uyanıklıklar yapılabilir. En kolay kafa karıştırma metodu grafiklerdir. Aşağıdaki tablonun grafiğini yapalım.
Firma | Performans |
A | 348 |
B | 358 |
C | 305 |
Birinci firmayı öne çıkartmak istersek
Tüm firmalar eşit demek istersek.
İlk iki firma birbirine yakın demek istersek.
En adil olan ve olması gereken aslında üçüncü grafik, ama siz eksenlerin hangi sayıdan başladığına bakmazsanız işte orada grafiği hazırlayanın ağına düştünüz.
Nelere dikkat etmek lazım derseniz, ilk olarak grafiğin 0 dan başlamasına dikkat etmek gerekli eğer başlamıyorsa grafikte bu belirtilmeli. İkinci olarak eksenler belirtilmeli, yani eksenlerin neyi iafade ettiğini net belirtmek gerek, (örnek olarak ikinci grafikte ekseni logaritmik olarak belirledim ama grafiğe yazmadığım).
Bir diğer aldatmaca kullanılan şekillerde oluyor. Mesela aşağıdaki şekilde alanlar iki katını vurgulamak için olması gerektiğinden farklı gösterilmiş ve Wall Street Journal da yayınlanmış. Grafik dağılımını göstermek için iç içe iki daire kullanılmış, oran %50 olmalı. Ama geomtri alan hesabına göre çapın 2 katına çıkmaması lazım yani dış uzunluk 100'ken iç daire çapı 72 olmalı. Yani olması gereken ise hemen sağındaki şekil.
Aşağıda aynı betimlemenin (%50 sini göstermek için kullanılan) varyasyonlarını görüyorsunuz. bazıları diğerlerinden daha büyük veya küçük görünüyor değil mi, yanılmak çok kolay.
Çizimler http://evalblog.com/2012/01/23/tragic-graphic-the-wall-street-journal-lies-with-statistics/ den alınma.
Bir diğer kandırmaca ise ortalama kavramında oluyor.
Ortalama hesaplama yöntemlerinde "aritmetik", "geometrik" ve "harmonik" mevcut. Biz genelde ortalamaları aritmetik olarak alıyoruz. Peki ne fark eder? Aslında farkları basitce şudur;
Geometrik ortalama genelde ortalamaya katılan sayılar arasında farkın büyüklüğünü de test eder. Yani uç değerlerin aritmetik ortalamaya göre etkisi büyüktür.
Harmonik ortalama ise ters orantılı ortalamalarda kullanılır. Hız ortalamarı bunun en iyi örneğidir. Yani uç değerlerin aritmetik ortalamaya göre etkisi çok büyüktür.
Örnek yapmak gerekirse
Firma | Başarı | Başarı | Başarı |
A | 275 | 200 | 100 |
B | 300 | 300 | 300 |
C | 325 | 400 | 500 |
Ortalamalar | Ortalamalar | Ortalamalar | |
Aritmetik | 300 | 300 | 300 |
Geometrik | 299 | 288 | 247 |
Harmonik | 299 | 277 | 196 |
Farkettiğiniz gibi aritmetik ortalama her zaman en büyük, harmonik ise en küçük olan.
Ara not: Gelişmiş performans değerlendirme ve karşılaştırma sistemlerinde aritmetik ortalama yerine olası hatayı azaltmak için geometrik ortalamalar kullanılır.
Başka bir kandırmaca ise size sayıları sunan araştırmacının örneklem seçmedeki hatasıdır.
Araştırmacılar bazen bilerek bazen de bilmeden yaparlar. Normalde bir araştırma yapılırken en güvenilir sonuçlar deneyin ya da çalışmanınn tüm etkilenen popülasyona yapılmasıyla bulunur. Eğer buna paranız yoksa (ki %99 olmaz) bir örneklem grup seçersiniz. Genel bakacak olursak bazen şans eseri bazen de bir grup örneklem olarak alınabilir. Örneklem grup seçimlerinde en az hata içeren şans eseri seçimdir. Bir grubu veya bir kriteri bir şekilde seçmek genellikle hataya yol açabilir.
Geçenlerde Türkcell firmasın Diyarbakır 3G hızının Parisin göbeğindeki hızla karşılaştırıyordu. "Turkcell 3G'nin Diyarbakır'daki Hızı, Paris'in 4 Katı",
Araştırma yapılırken benzer iki şeyin karşılaştırılması esastır. 3G altyapısı paylaşılan bir alt yapıdır yani ne kadar çok kişi sizinle aynı bölgede 3G kullanırsa hız o kadar düşer.
Burda örneklem yapılan şehir önemli Paris'in nüfus yoğunluğu km2 başına 20.980 kişi (http://en.wikipedia.org/wiki/Paris) benim hesabıma göre ise Diyarbakır'ın 648 kişi. Teknoloji kullanımını da göz önüne almak gerekerse herhalde Paris'te daha çok 3G kullanan vardır demek yanlış olmaz. Kısacası bu sayılar bize gerçek firma gücünü göstermiyor.
Başka bir hata/kandırmaca ise eksik bilgi ile karşılaştırma yapmaktır.
Burada da araştırmacı bazı argümanları yeterli araştırma yapmadan ve bilinçli bir şekilde ortaya koymasından olur.
İki sene önce okuduğum bir haberde Türkiye'de en çok oğlak burcu var deniyordu.
-Burada ek bir bilgi hesaba katılmadığı için bir sapma var gibi görünüyor. Ne zaman doğduğu bilinmeyenler 1 Ocak olarak kayıt ediliyorlar.
Bisküviyi çaya yatay bandırın kitabında şöyle bir önerme var. Kask yerine peruk takın, peruk taktığınızda daha az kaza yapıyormuşsunuz!
-Gerçek olayı incelediğimizde araştırmacı deneyde kask üzerine peruk takarak bisiklet kullananları takip etmiş. Ama sürücülerin durumu nasıl algıladığı yönünde bir sonuç olmadığı veya hiç peruk takmayanların durumu bilinmediği için çıkarımın hatalı olma olasılığı çok yüksek.
Bir içecek firması Japonya'da bir içeceğin piyasa araştırmasını yapıyor ve ürünün beğenenler neredeyse %100 çıkıyor. Ürün piyasaya sürülüyor ama neredeyse hiç satmıyor.
- Japonyada ikram edilen bir şeye beğenmedik demek ayıp görülürmüş. test edilen ürünleri herkes nezaket icabı beğendim demiş ve sonuç ortada.
Araştırma yaptığınız grubu ve alanı bilmeden araştırma yapmak yanıltıcı sonuçlar doğuruyor.
Başka bir kandırmaca ise size sayıları sunan araştırmacının yanlış testi uygulamış olmasıdır.
Genel bu hata isteyerek yapılmaz. Bu en basiretsiz hatadır desem yalan olmaz herhalde.
Bazı durumlarda bir testin/hesaplamanın birden çok formülü olabilir.
Genelde burada yapılan hata/tercih farklı hesaplama tekniklerinin varlığından haberdar olmamaktır.
Son kandırmaca ise örneklem miktarıdır.
Özellikle bir sonucu tüm topluma yaymak için örneklem sayınızın yüksek olması gerekir.
Örnek olarak bir haberde yeni geliştirilen mucizevi bant sayesinde cilt kanserinden kurtulabilirsiniz deniyordu. yapılan çalışmada bandı kullananların %100'ü ilk belirtilerden kurtulmuş ve altı ay sonra malesef bunların sadece iki tanesinde tekrar kanser belirtileri oluşmuş. Haberi biraz daha incelediğimde denek sayısının 10 olduğunu gördüm. Televizyona çıkıp ... reklamı yapanları hatırladım (Daha fazla yoruma gerek yok herhalde).
Sayının azlığı gibi çokluğu da sizi kandırır, ön ve son test farkının 5 üzerinden 0,1 olduğu bir çalışmayı 24 kişiye yapıyorsanız muhtemelen istatistiksel olarak manidar bir fark çıkmaz ama 20.000 kişiye yapmışsanız. burada istatistiksel olarak manidar bir fark vardır diyebilirsiniz.
Bunlar benim aklıma gelenler belki sizin de aklınıza gelenler vardır.
İki ürün arasında bak bu ne kadar başarılıymış dedirten şey belki de bir kandırmaca
son olarak http://www.amazon.com/How-Lie-Statistics-Darrell-Huff/dp/0393310728
Görüntülenme Sayısı: hesaplanıyor...