Birçok profesyonel gibi benim işim de veri veya analitik uzmanlığı gerektirmiyor. Ben yazar ve editörüm; işim sayılarla değil sözcüklerle. Buna rağmen, günümüzde neredeyse her bilgi işçisi veri analizinin düzenli bir tüketicisi olmalı. Örneğin neden kariyerin orta dönemlerinde ortaya çıkan bir kriz üzerine yazılan makalelerin, geribildirim almak üzerine yazılanlardan daha çok okunduğunu veya bazı başlıkların diğerlerinden daha çok ilgi gördüğünü anlamam gerekiyor.
Aynı zamanda, yazdığım konular hakkında yapılan araştırmaları okuyabilmeli, bu çalışmalardaki bulguların doğru ve genellenebilir olup olmadığını anlamalı ve bulgular ile bu bulguların kısıtlarını siz okuyucularımıza anlatabilmeliyim.
Bunların hepsini yapmak için veri analitiğine yönelik temel bir kavrayıştan fazlasına ihtiyacım var. Üniversitede aldığım istatistik dersi bu konuda yardımcı olsa da, önemli konseptleri anlamak ve veri analizi konusunda söylemem gerekenleri bilmek için yeterli değildi.
Neyse ki veri analizine ilişkin birkaç kritik konu hakkında bu alandaki en iyi uzmanlardan bazılarıyla sohbet etme şansım oldu: Data Driven: Profiting from Your Most Important Business Asset kitabının yazarı Tom Redman ve Columbia University’de uygulamalı analitik programının kurucusu Kaiser Fung. Aşağıda her yöneticinin anlaması gereken veri analitiği konseptleri hakkındaki arşivimizden hafızanızı canlandıracak dört kavrama yer verdik.
Randomize Kontrollü Deneyler
Her analizde atılacak ilk adımlardan biri veri toplamaktır. Bu genellikle şirketlerin yaptığı bir dizi deney aracılığıyla gerçekleşir: Resmî olmayan, hızlı anketler; pilot çalışmalar; saha deneyleri ve laboratuvar araştırmaları... Bunların daha yapılandırılmış türlerinden biri randomize kontrollü deneylerdir. Birçok kişi bu terimi duyduğunda hemen maliyetli klinik deneyleri aklına getirir. Fakat randomize kontrollü deneyler maliyetli veya zaman alıcı olmak zorunda değildir. Üstelik müşteri hizmetine ilişkin belirli bir müdahalenin müşteriyi elde tutma oranını artırıp artırmadığı veya yeni, daha pahalı bir ekipmanın daha ucuz olana kıyasla daha etkili olup olmadığı gibi şeyler üzerine veri toplamak için kullanılabilir. Bu yazıda Tom Redman, bir testin “kontrollü” olmasının ne anlama geldiğini” ve “randomizasyon” elementi barındırıp barındırmadığından nasıl emin olabileceğimizi anlamamıza yardımcı oluyor. Bu makale aynı zamanda şöyle soruları ele alıyor: Bağımlı ve bağımsız değişkenler neler? Bu deneylerden birini tasarlamak ve yürütmek için atılacak adımlar neler?
A/B Testi
Günümüzde şirketlerin kullandığı yaygın deneylerden biri A/B testidir (bir tür randomize kontrollü deney). En temel seviyede, bu testler bir şeyin iki versiyonunu karşılaştırmak ve hangisinin daha iyi olduğunu anlamak için yapılır. Şirketler bu testi şöyle soruları cevaplamak için yapar: “İnsanların tıklamasını en çok ne sağlayabilir? Ya da ürünümüzü satın almasını? Veya sitemize üye olmasını?” A/B testi, internet sitesi tasarımından online tekliflere, başlıklardan ürün tanımlarına kadar her şeyi değerlendirmek için kullanılabilir. Geçerli sonuçlar elde etmeden, deneyi olması gerekenden erken bitirmek veya metriklerden oluşan bir dashboard’a bakmaya çalışmak gibi yaygın hatalardan kaçınmak ve sonuçları nasıl yorumlayacağınızı bilmek kritiktir. Buradan A/B testleri hakkında daha çok bilgi edinebilirsiniz.
Regresyon Analizi
Veriyi elde ettikten sonra; regresyon analizi, bunu anlamlandırmanızı sağlar. Elbette veriyi analiz etmenin birçok yolu var, fakat lineer regresyon en önemlilerinden biri. Bu, iki veya daha fazla değişken arasında bir ilişki olup olmadığını matematiksel açıdan anlamanın bir yoludur. Örneğin şemsiye satma işindeyseniz, yağmurlu günlerde kaç şemsiye daha fazla sattığınızı öğrenmek isteyebilirsiniz. Regresyon analizi yağmur miktarının satışları nasıl etkilediğini veya etkileyip etkilemediğini belirlemenize yardımcı olabilir. Şu soruları cevaplar: Hangi faktörler en önemli? Hangilerini göz ardı edebiliriz? Bu faktörler birbirleriyle nasıl etkileşime girer? Belki de en önemlisi, bu faktörlerin hepsinden ne kadar eminiz?
Neyse ki regresyon, genelde kendi başınıza yaptığınız bir şey değil. Bunun için istatistik programları var. Fakat yine de bunun arkasındaki matematiği ve kaçınılması gereken hataları anlamak önemli. Bu yazıda regresyonu anlatıyorum ve regresyonun genellikle yanlış anlaşılan, nedensellik ile olan kafa karıştırıcı korelasyonuna karşı okurları uyarıyorum.
İstatistiksel Anlamlılık
Analizi yaptıktan sonra sonuçlarınızın ne anlama geldiğini öğremelisiniz (eğer bir anlamı varsa). Burada devreye istatistiksel anlam giriyor. Bu, genellikle yanlış anlaşılan ve yanlış kullanılan bir konsepttir. Şirketler, kritik iş kararları vermek amacıyla veriye gittikçe daha bağımlı hale geldiği için; istatistiksel anlam, anlaşılması gereken önemli bir kavramdır. Bir deneyden alınan sonucun şans eseri mi yoksa ölçtüğünüz faktörlerden dolayı mı olduğunu belirlemenize yardımcı olur.
Bu benim bazen tam olarak anlamakta zorluk çektiğim bir kavram, fakat neyse ki ortalama bir profesyonel istatistiksel anlamı derinlemesine kavramak zorunda değil. Bu yazıya katkıda bulunan Tom Redman için bunu yanlış kullanmamak daha önemli.
Siz bu konseptleri gözden geçirirken, meslektaşım Walt Frick’in kantitatif analiz üzerine yaptığı bu genel değerlendirmeyi okumak faydalı olabilir. Bu, verinin, doğru metrikleri seçmenin ve doğru soruları sormanın neden önemli olduğunu anlamak açısından güzel bir yazı. Aynı zamanda ne zaman analizlerden yola çıkarak hareket etmeniz ve etmemeniz gerektiği hakkında karar vermenize yardımcı olacak, korelasyon vs. nedensellik üzerine bir tablo da mevcut.
Son olarak, eğer sosyal bilimler araştırmalarını kavramak istediğiniz için analitiğe ilgiliyseniz Australian National University’deki araştırma görevlisi ve öğretim üyesi Eva Vivalt’ın yazdığı bu yazıyı okumanızı öneririm. Eva bu yazısında bir çalışmadan toplanan veriye güvenmek gerekip gerekmediğini belirlemek için birkaç tavsiye veriyor.
Veri analitiği aslında iyi kararlar vermektir. Hangi sektörde olduğunuz, şirketteki pozisyonunuz fark etmez. Hepimiz zekice, bilgili, kanıta dayalı kararlar vermek istiyoruz. Ve böyle kararlar vermemiz gerekiyor.