1.Standart Sapma Nedir?
Aritmetik ortalama formülü ile bir sayı dizisinin ortalamasını bulabilyorduk. Standart sapma ise dizideki elemanların bu ortalama değerden ne kadar saptığını göstermeye yarayan bir formüldür. Hesaplanması için önce dizideki tüm elemanların ortalama değerden farkı bulunur, sonrasında bu farkların kareleri toplanarak toplam eleman sayısına bölünür. Çıkan sayı değişkenliktir. Bu sayının karekökü ise standart sapmayı verir. Kullanılan veri kümesine göre farklı standart sapma hesaplama yöntemleri vardır. İşlevlerin daha net anlaşılabilmesi için bunlara da değinmekte fayda var, tabii istatistiğe girmemiz gerek.
a. Evren veya Ana Kütle Nedir?
Gördüğünüz gibi standart sapma hesaplayabilmek için elimizde bazı rakamlar olması gerekiyor. Eğer ölçmek istediğimiz konu ile ilgili tüm rakamları bulabiliyor ve bu değerleri kullanarak standart sapmayı hesaplıyorsak bu standart sapmaya evren veya ana kütle (population) standart sapması adı verilir.
Örnek olarak bir aracın dinamosu için arıza istatistiklerini hesaplamak isteyelim. Eğer elimizde o aracın tüm dünyada satılmış olan toplamı üzerinden şarj dinamosu ile ilgili tüm arıza değerleri elimizde var ise bu şarj dinamosu arıza evreni olarak adlandırılabilir, İngilizce’de “Population”.
b. Örneklem Nedir?
Çoğunlukla elimizdeki ettiğimiz değerler, ölçmek istediğimiz konu ile ilgili tüm değerleri değil belirli bir örnek kütle üzerinden alınmıştır. Şarj dinamosu örneğini ele alalım, tüm dünyadaki tüm araçların tüm şarj dinomosu arıza bilgilerine erişmek hem çok zordur hem de ortaya devasa boyutta bir veri çıkacaktır ki bu veriyi işleyebilmek program kapasitesini aşabilecektir.
Bu durumda tüm araçlar değil belli bir bölgedeki belli yıllar arasında satılmış araçlar için bu bilgi toplanabilir. Bu durumda elde ettiğimiz veriler, evrenin çok daha küçük bir kısmını içerir ve örneklem olarak adlandırılır. İngilizce örneklem anlamına gelen “Sample” kelimesidir.
Neden böyle bir formüle ihtiyaç var derseniz eğer; bu formül daha büyük bir kümenin alt kümesini dikkate aldığımızdan ana kütleyi daha iyi ifade edebilmek adına bir tür düzeltme yapılması gerekiyor düşünebilirsiniz. İnternette bu konu hakkında daha fazla bilgi bulabilirsiniz.
c. Nerede Kullanılır
Standard sapma ne işe yarıyor diye sorarsanız, bir dizinin ne kadar değişkenlik gösterdiğini bize rakamlarla gösterir. Örnek olarak istatistiki kalite kontrol yönetimlerinde bu sapma ne kadar büyükse, üretime etki eden parametrelere (sıcaklık, toz, hammadde vs) o kadar az hakimsiniz demektir.
Standart sapma formülünün farklı dizilerdeki değerlere göre değişimini daha iyi görmek adına iki farklı örnek dizi kullanacağım. Bu iki farklı dizinin ortalaması aynı, 60. Ancak değişkenlik ve standart sapma değerlerine baktığımız aralarında çok büyük bir fark olduğunu görüyoruz.
Açıklama | Dizi 1 | Dizi 2 |
90 | 60 | |
30 | 50 | |
50 | 60 | |
90 | 70 | |
20 | 60 | |
60 | 50 | |
50 | 55 | |
90 | 70 | |
60 | 65 | |
Ortalama | 60 | 60 |
Değişkenlik | 600 | 50 |
Standart sapma | 24,4949 | 7,071068 |
Şimdi bu değerleri bir grafiğe dökelim isterseniz.
Resimde ortalama değer ve altında kalan alanı farkı bir renge boyadım. Gördüğünüz gibi ilk dizimiz olan mavi renkli çizgiler ortalama değerden göreceli olarak çok daha fazla değişiklik gösteriyor. Her bir noktanın ortalama değere olan farkları çok fazla. İşte bu değerlerin karelerini toplayıp, toplam nokta sayısına bölersek değişkenliği buluruz.
Neden karelerini topluyoruz? Çünkü grafikten de gördüğünüz üzere ortalamanın üstünde ve altında kalan değerler var, farkını aldığımızda negatif ve pozitif değerler elde ederiz, bunları toplarsak eğer bu durumda negatif ve pozitif değerler bir birlerini etkileyeceğinden gerçek durumu tam olarak yansıtamaz. Karelerini aldığımızda bu durumu engellemiş oluyoruz.
2. STDSAPMA İşlevi
Excel 2007 ve daha eski sürümlerle uyumluluk için tutulan ve bu sürünlerde örneklem değerlerin standart sapmasını bulmak için kullanılan formüldür. Eğer yeni bir Excel sürümü kullanıyorsanız ancak hazırladığınız dosyaları bu sürümler ile paylaşma durumunuz var ise kullanabilirsiniz. Aksi takdirde Excel 2010 ve üzeri sürümlerde STDSAPMA.S formülünü kullanmanız Microsoft tarafından tavsiye edilmektedir, çünkü eski formül ileriki sürümlerde iptal edilebilir.
Yazılışı:
=STDSAPMA(sayı1; [sayı2];…)
Şeklindedir. Burada sayı yazan yerlere sabit değerler, 10; 20, girebileceğiniz gibi bir veya birden fazla hücre aralığı, teker teker hücre adresleri ya da {10;20;…} gibi dizi değerleri de girebilirsiniz. Formülün yazılımından da görebileceğiniz gibi ilk sayıdan sonraki sayıların girilmesi isteğe bağlıdır. Ancak eğer tek bir rakam veya tek bir hücre seçilirse işlev #BÖL/0 hatası verecektir.
Bu formül örneklem standart sapması hesapladığı için elde edilen değer ana kütle standart sapmasından görece daha yüksektir, ilk başlıkta anlattığım toplam rakam adetinin bir eksiğine bölme işlemi nedeniyle.
Bu formül hücre içinde yer alan mantıksal değerleri (DOĞRU, YANLIŞ) ve metin olarak girilmiş rakamları hesaplamaya katmaz. Ancak formülün içine el ile yazarsanız bunları dikkate alacaktır. Eğer formül içinde mantıksal değerler kullanırsanız DOĞRU yerine 1, YANLIŞ yerine 0 değeri kullanılır. Eğer seçili aralıktaki hücrelerin herhangi birinde değer yok ise bu hücre hesaplamaya dahil edilmez.
3. STDSAPMAP İşlevi
STDSAPMA formülü gibi bu formülde Excel 2007 ve daha eski sürümlerle uyumluluk için tutulan bir formüldür. STDSAPMA formülünden farklı olarak ana evren dizisi için standart sapmayı hesaplamasıdır. Yazılımı:
=STDSAPMAP(sayı1; [sayı2];…)
Bu formül ana kütle üzerinden standart sapma sonucunu bulduğundan değiikenliği toplam örnek adetine böler. Bu da çıkan sonucun STDSAPMA ile hesaplanan değerden görece olarak daha yüksek çıkmasına neden olur.
Bunun haricinde STDSAPMA formülü için anlattığım özellikler bu işlev için de geçerlidir. Ancak STDSAPMA formülünden farklı olarak eğer tek bir değer veya hücre adresi tanımlarsanız sonuç sıfır olarak çıkacaktır.
4. STDSAPMA.S İşlevi
Örneklem kütle üzerinden standart sapma hesbı için Excel 2010 ve sonraki sürümlerde kullanılmak üzere geliştirilmiştir. Eski STDSAPMA formülünün yerini almıştır. Yazılımı ve işlevselliği aynıdır.
=STDSAPMA.S(sayı1; [sayı2];…)
5. STDSAPMA.P İşlevi
İsminden de anlaşılabilceği gibi bu formül de eski STDSAPMAP formülünün yerine gelmiş olan daha yeni bir formüldür. Yazılımı ve işlevselliği bu formülle aynıdır.
=STDSAPMA.P(sayı1; [sayı2];…)
6. STDSAPMAA
Standart sapma hesaplamada kullanılan bir başka işlev de STDSAPMAA işlevidir. Bu işlev de örneklem kümenin standart sapmasını hesaplamak üzere kullanılır. Bu formülün diğer formüllerden farkı hücre içinde yer alan ve metin formatında yazılmış rakamları hesaplamaya dahil edebilmesidir. Ayrıca DOĞRU ve YANLIŞ ve rakam olmayan metin içeren hücreleri de dikkate alır. Bunu yaparken daha önce anlattığım gibi DOĞRU ifadesini 1, rakam olmayan metin ve YANLIŞ ifadelerini 0 olarak değerlendirir. Daha önceki formüller gibi boş hücreler hesaplamaya dahil edilmez. Yazılışı:
=STDSAPMAA(sayı1; [sayı2];…)
7. STDSAPMASA
STDSAPMAA işlevi ile aynı özelliklere sahiptir. Tek farkı örneklem değil ana kütle standart sapmasını hesaplamakta kullanılır. Diğer özellikleri STDSAPMAA işlevi ile aynıdır. Yazılışı:
=STDSAPMASA(sayı1; [sayı2];…)
8. Uygulama
Bu formüllerin birbirlerinden farklarını göstermek adına aşağıdaki resme bakabilirsiniz.
Burada ilk dizide metin ve mantıksal değerler bir arada yer alıyor. İkinci dizide ise mantıksal ve metin ifadelerinin formül içinde alacağı eşdeğer değerler bulunmakta. Görebileceğiniz gibi aynı formülü her iki dizine de uyguladığımızda STDSAP-STDSAP.P formülleri farklı değerler vermekte. Buradan da anlaşılacağı üzere bu formüller hücre içinde yer alan metin ve mantıksal değerleri dikkate almıyor. STDSAPA ve STDSAPA.P ise bu değerleri dikkate alarak hesaplama yapmakta. İkinci olarak gördüğünüz gibi, eşdeğer değerlerin yer aldığı dizinde ise örneklem ve ana kütle üzerinden standart sapmayı hesaplayan benzer formüller aynı sonucu vermekte.
Konuyu anlatmak için kullandığım ve görseller ile değerlerin olduğu Excel dosyasına da buradan erişebilirsiniz.