Veri bilimci Dr. Nick Brown: Türkiye'de verilerin doğru olma ihtimali milyarda bir
Türkiye'de açıklanan resmi koronavirüs verilerini inceleyen veri bilimci Dr. Nick Brown, yaptığı hesaplamalarla verilerin milyarda bir ihtimalle doğru olabileceğini söyledi.
Türkiye'de Sağlık Bakanlığı'nın açıkladığı yeni tip koronavirüs (Covid-19) verileri tartışma yaratmaya devam ediyor.
Verileri inceleyen veri bilimci Dr. Nick Brown, "Elbette bu verilerin doğru sayılar olma ihtimali var. Ancak, bu ihtimal milyarda bir gibi bir şeye tekabül ediyor. Bu da bana neredeyse imkânsız görünüyor. Peki, nasıl böyle bir şey olabilir?" şeklinde konuştu.
Daktilo1984’ten Salpi Özgür’e konuşan Brown, Türkiye'de açıklanan verilen Benford Yasası'na uymadığını söylerken, son rakamı 0'la biten sayının çok az olduğunu, yaptığı hesaplamalarla verilerin milyarda bir ihtimalle doğru olabileceğini söyledi.
Brown, konuya ilişkin şunları kaydetti:
"Elimizde vaka sayıları, ölüm sayıları, yapılan test sayıları gibi pek çok sayının bulunduğu veri grupları varsa, yani elimizde gerçekten çok fazla miktarda sayı varsa, bunlardan yüzde onunun 0'la, yüzde onunun 1'le, yüzde onunun 2'yle bitmesini ve bu şekilde ilerlemesini bekleriz, çünkü on tane rakam vardır ve son hanelerin rakamlara dağılımının bir miktar farklılıklar içererek yakın olmasını bekleriz. Fakat fark ettim ki, sıfırla biten sayılar neredeyse yok denecek kadar az.
Bu verilerin sıfırla bitmemesinin olasılığını hesaplamak için birkaç test yaptım. Elimizde üç veri grubu var. Bu gruplardan ilkinin böyle sonuçlara sahip olma olasılığı binde bir.
İkinci grubun sonuçlarının bu şekilde çıkma olasılığı yüz milyonda bir ve toplamda tüm bu veri gruplarının Sağlık Bakanlığı'nın bizlerle paylaştığı sayılar gibi olması ihtimali ise milyarda birden bile az."