Yorumlar

İstatistikte Korelasyon ve Nedensellik

İstatistikte Korelasyon ve Nedensellik



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Öğle yemeğinde bir gün genç bir kadın büyük bir kase dondurma yiyordu ve bir akademisyen üyesi ona kadar yürüdü ve “Dikkat etsen iyi olur, dondurma ile boğulma arasında yüksek bir istatistiksel ilişki var.” Dedi. Ona biraz daha detay verdiği için şaşkın bir bakış attı. “Dondurma satışlarının en fazla olduğu günlerde, insanların çoğunun boğulduğunu görüyoruz.”

Dondurmamı bitirdiğinde iki meslektaş, sadece bir değişkenin diğeriyle istatistiksel olarak ilişkili olması nedeniyle, birinin diğerinin nedeni olduğu anlamına gelmiyordu. Bazen arka planda saklanan bir değişken vardır. Bu durumda, yılın günü veride saklanıyor. Sıcak yaz günlerinde karlı kış günlerinden daha fazla dondurma satılmaktadır. Yaz aylarında daha fazla insan yüzer ve bu nedenle yaz aylarında kıştan daha fazla boğulur.

Gizlenen Değişkenlere Dikkat Edin

Yukarıdaki anekdot, gizlenen değişken olarak bilinen şeyin başlıca örneğidir. Adından da anlaşılacağı gibi, gizlenen bir değişken tespit etmek zor ve zor olabilir. İki sayısal veri setinin güçlü bir şekilde ilişkili olduğunu tespit ettiğimizde, her zaman “Bu ilişkiye neden olan başka bir şey olabilir mi?” Diye sormalıyız.

Aşağıdakiler gözlemlenen değişkenlerin neden olduğu güçlü korelasyon örnekleridir:

  • Bir ülkedeki kişi başına düşen ortalama bilgisayar sayısı ve o ülkenin ortalama yaşam süresi.
  • Bir yangındaki itfaiyecilerin sayısı ve yangından kaynaklanan hasar.
  • Bir ilkokul öğrencisinin ve onun okuma seviyesinin yüksekliği.

Tüm bu durumlarda, değişkenler arasındaki ilişki çok güçlüdür. Bu genellikle 1 veya -1 değerine yakın bir korelasyon katsayısı ile gösterilir. Bu korelasyon katsayısının 1 veya -1'e ne kadar yakın olduğu önemli değildir, bu istatistik bir değişkenin diğer değişkene neden olduğunu gösteremez.

Gizlenen Değişkenlerin Tespiti

Yapıları gereği, gizlenen değişkenleri tespit etmek zordur. Varsa, stratejilerden biri, zaman içinde verilere ne olduğunu incelemektir. Bu, veriler bir araya toplandığında gizlenen dondurma örneği gibi mevsimsel eğilimleri ortaya çıkarabilir. Diğer bir yöntem ise aykırı değerlere bakmak ve onları diğer verilerden farklı kılan şeyleri belirlemeye çalışmaktır. Bazen bu, sahne arkasında neler olduğuna dair bir ipucu sağlar. En iyi eylem yolu proaktif olmaktır; Varsayımları ve tasarım deneylerini dikkatlice sorgular.

Neden fark eder?

Açılış senaryosunda, iyi niyetli ancak istatistiksel olarak bilgisiz bir kongre üyesi olduğunu, boğulmayı önlemek için tüm dondurmaları yasaklamasını önerdi. Böyle bir tasarı, nüfusun geniş kesimlerini rahatsız eder, birkaç şirketi iflas etmeye zorlar ve ülkenin dondurma endüstrisi kapanırken binlerce işi ortadan kaldırır. En iyi niyetlere rağmen, bu tasarı boğulma ölümlerinin sayısını azaltmaz.

Bu örnek çok uzak bir şekilde alınmış görünüyorsa, gerçekte olan aşağıdakileri göz önünde bulundurun. 1900'lerin başlarında, doktorlar bazı bebeklerin gizlice uykularında algılanan solunum problemlerinden öldüğünü fark ettiler. Buna beşik ölümü denir ve şimdi SIDS olarak bilinir. SIDS'ten ölenler üzerinde yapılan otopsilerden çıkan bir şey, göğüste bulunan bir bez olan genişletilmiş bir timüs idi. Doktorlar, SIDS bebeklerinde genişlemiş timus bezlerinin korelasyonundan anormal derecede büyük bir timusun yanlış solunum ve ölüme neden olduğunu varsaydılar.

Önerilen çözüm, timusu yüksek oranda radyasyonla daraltmak veya bezi tamamen çıkarmaktı. Bu prosedürlerin ölüm oranı yüksekti ve daha fazla ölüme yol açtı. Üzücü olan, bu işlemlerin yapılması gerekmediğidir. Daha sonra yapılan araştırmalar, bu doktorların varsayımlarında yanıldığını ve timusun SIDS'ten sorumlu olmadığını göstermiştir.

Bağlılık nedenselliği ifade etmez

Yukarıdakiler, tıbbi kanıtlar, yasalar ve eğitim teklifleri gibi şeyleri haklı göstermek için istatistiksel kanıtların kullanıldığını düşündüğümüzde bizi duraklatmalıdır. Verilerin yorumlanmasında iyi çalışmalar yapılması, özellikle de korelasyon içeren sonuçlar başkalarının hayatlarını etkileyecekse, önemlidir.

Herhangi biri, “Çalışmalar A'nın B'nin bir nedeni olduğunu ve bazı istatistiklerin bunu desteklediğini” gösterdiğinde “cevap vermeye hazır olun,“ korelasyon nedensellik anlamına gelmez. ”Daima verilerin altında gizlenenleri aramaya devam edin.


Videoyu izle: Korelasyon ve Nedensellik İstatistik ve Olasılık (Ağustos 2022).