Ortalama kavramı başlangıçta deniz nakliyatında ortaya çıkan zarar kavramından geliştirilmiştir. Deniz nakliyatında zarar, ya zarar gören eşya sahibi tarafından özel avarya olarak tümüyle yüklenilir veya nakledilen eşyaların satış kârını ortak olarak paylaşanlar tarafından genel avarya ortaklık payına göre karşılanır. Genel avarya hesabının yapılması için geliştirilip kullanılan matematiksel hesaplar aritmetik ortalamanın ilk kullanılma alanı olmuştur. Bu kavrama Arapça avar, İtalyanca avaria, Türkçede (pek çok denizcilik terimi gibi İtalyancadan alınan) avarya ve İngilizce average adı verilmektedir. İngilizcede aynı sözcük ve bazı günlük pratik hallerde Türkçede kullanılan averaj sözcüğü ortalamaya eşit anlamda kullanılmaktadır.
İstatistikte bilimsel olarak ortalamalar kavramına bir aksiyomatik yaklaşım John Bibby (1974) tarafından verilmiştir.[1]
Ortalama tipleri
Ortalama bir sayısal veri dizisinin merkezsel konumunu temsil etmek için seçilen tek bir sayı halinde bir özettir. Eğer veri dizisinde tüm elemanlar aynı sayı ise ortalama bu tek sayıdır. Ancak bu tip veri dizisi pratikte gayet az olarak bulunduğu, hatta nerede ise hiç bulunmadığı için, bir pratik veri dizisinin merkezsel konumunu farklı şekilde temsil edecek ortalamalar geliştirilmiştir. Önce bu ortalamalardan en çok kullanılanları kısaca ele alınacak ve sonra daha geniş kapsamlı bir tablo sunulacaktır.
En çok kullanılan ortalama tipleri
Günlük hayatta en çok kullanılan ortalama türü aritmetik ortalama olmakla birlikte, bazı durumlarda mod, medyan, geometrik ortalama ve diğer ortalama türleri tercih edilmektedir.
Aritmetik ortalama bir anakütle veya bir örneklem veri değerlerinin toplamlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne bölünerek elde edilen merkezsel konum değeridir. Bu tanınım şu formülle gösterilir:
Burada örneklem aritmetik ortalaması sembolüdür; anakütle aritmetik ortalaması için μ kullanılır.
Bu yöntem istatistikte sıkça kullanılır. Fakat bazı eksik yönleri vardır.
Verilerin ölçülme ölçeğinin aralıklı veya oransal olması gerekir. İsimsel ölçekli veriler için aritmetik ortalama anlamsızdır. Birçok istatistikçi sırasal ölçekli veriler için aritmetik ortalamanın anlamsız olduğunu kabul etmektedirler; ancak pratikte, özellikle bir anketten ortaya çıkarılan, sırasal ölçekli veriler için aritmetik ortalama hesaplanıp önemli alanlarda kullanılmaktadır.
Eğer anakütle veya örneklem veri dağılımı simetrik olmayıp çarpıklık gösteriyorsa, aritmetik ortalama merkezsel değer olmaktan çıkıp çarpıklık kuyruğunun bulunduğu tarafa doğru gitmeye eğilimlidir. Bu halde aritmetik ortalama istatistik bilenlerin istatistik bilmeyenlere karşı kullanabilecekleri bir aldatmaca yolu olarak da kullanılabilir.
Örnek: Bir iş yerinde işçiler maaşlarının düşük olmasından dolayı şikayetçidirler. Fakat yöneticiler tam tersini savunabilirler. Maaş dağılımları şöyle olsun:
1 Genel Müdür: 15.000,00 YTL
2 tane Genel Müdür Yardımcısı: her biri 5.500,00 YTL
5 tane idari işler sorumluları (Halkla ilişkiler, İnsan kaynakları...vb): her biri 1.500,00 YTL
30 tane normal personel = her biri 1.000,00 YTL
Böyle bir durumda maaşların aritmetik ortalaması alınırsa
olarak ortalama aylık maaş hesaplanır. Ama bu ortalama merkezsel konumu göstermez. 38 personelden ancak 3'ü ortalamadan fazla maaş almakta görülmektedir ve maaş dağılımı çok bariz şekilde çarpıktır. Çok küçük sayıda kişi (müdür ve 2 yardımcısı) karşılaştırılmalı olarak çok büyük değerde maaş almakta ama çok büyük sayıda kişi düşük değerde maaş almaktadır. Böylece maaş dağılımı gayet asimetrik olup sağda ince uzun bir kuyruk bulunmaktadır; veri dağılımı pozitif çarpıklık göstermektedir. Bu nedenle maaş aritmetik ortalaması merkezsel konum göstergesi olmaktan çıkmıştır.
Aritmetik Ortalama'nın Çarpıkveri dizilerinde işlevini kaybetmesi durumunun önüne geçebilmek için, 2014 yılında yayınlanan "İstatistikte Altın Oran" Kitabında yeni bir ortalama tanımlanmıştır.[3] Bu yeni ortalama GRiS (Golden Ratioin Statistics) Ortalama olarak adlandırılmıştır. Bu ortalamanın özelliği, veri dizisindeki her bir elemanın, konumuna göre katkı sağlamasıdır.
Veri Dizisi küçükten büyüğe sıralandıktan sonra, her bir elemana bulunduğu konuma göre, yukarıda gösterilen GRiS ortalama katsayı maskesindeki ağırlıklandırma katsayıları atanır. Her bir elemanın Medyan'dan farkı, kendine atanmış ağırlıklandırma katsayısı ile çarpılır, bu çarpımların toplamı, ağırlıklandırma katsayıları toplamına bölünür ve medyandan sapma hesaplanır. Veri dizisinin her iki ucunda bulunan elemanlar, aynı ölçüde baskılandığı için; GRiS ortalama her durumda medyana, aritmetik ortalamadan daha yakın konumlanmaktadır. Bu yöntem sayesinde aritmetik ortalamanın en bariz zayıflığı olan merkezsel değer olmaktan çıkıp çarpıklık kuyruğunun bulunduğu tarafa doğru gitme eğilimi bertaraf edilmiştir.
Geometrik ortalama bir anakütle veya bir örneklem veri değerlerinin çarpımlarının o anakütledeki terim sayısına veya örneklem büyüklüğüne eşit kökü alınmak suretiyle elde edilen bir merkezsel konum değeridir. Bu tanımlama için formül şöyle verilir:
Burada G geometrik ortalama sembolüdür.
Bu tür ortalamanın da dezavantajları bulunmaktadır:
Büyük bir sayıda kök almak el hesabı ile imkânsız olduğu için bu tür ortalama genel olarak elektronik hesap makinelerinin veya bilgisayarların gelişmesinden önce kullanılması çok zor olmaktaydı. Verilerin logaritması alınıp bu logaritma verilerinin toplamı bulunduktan sonra eldeki veri büyüklük sayısına bölünerek geometrik ortalamanın logaritma değeri bulunur, bunun antilogaritmasının alınması gerekirdi. Orta basitlikte hesaplar yapabilen elektronik hesap makinaları veya kompüter kullanılarak geometrik ortalama almak çok kolaylaşmıştır.
Geometrik ortalama bulabilmek için verilerin pozitif değerde olması gerekmektedir yani veri değerlerinin özellikle sıfır veya negatif olmaması gerekmektedir. Eğer tek bir veri değeri sıfır ise, geometrik ortalama almak anlamsız olacaktır.
Mod veri dizisi içinde en çok defa tekrarlanan veri değeridir. Mod isimsel ölçekli veriler için anlamlı olan tek ortalama ölçüsüdür. Ancak veri dizisi içinde tek bir mod olmayabilir yahut birden fazla sayıda mod bulunabilir.
Medyan bir veri dizisinin küçükten büyüğe veya büyükten küçüğe sıralanmasından sonra bu dizinin tam ortasında bulunan değerdir. Eğer veri büyüklüğü tek sayılı ise medyan verilen bir veri değerine eşit olur. Eğer veri büyüklüğü çift sayılı ise medyan orta iki değerin ortalaması olur. Medyan bulmak için basit bir algoritmaya göre sıralanmış veri değerlerinin kalan en küçük ve en büyük değerleri birer birer elimine edilir; veri sayısı tek ise en son kalan tek veri medyandır; eğer veri sayısı çift ise son kalan iki veri çiftinin ortalaması medyan olur.
Burada f tersi alınabilir bir fonksiyondur. Bu formül değişik ortalamalar için şu şekilleri alır:
Geometrik ortalama için f(x)=log x olur.
Harmonik ortalama için f(x)= 1/x olur.
Çok az bilinen üstel ortalama için f(x)=ex olur.
Ancak bu genelleştirme ile tüm ortalamaların ayrı ayrı formüllerini bulmak imkânsızdır.
Diğer bir genelleştirme, ortalamalar listesi elamanlarının permütasyonu halinde simetrik olan bir g(x1, x2, ..., xn) fonksiyonunun değişik şekillerde ifadesi ile yapılır:[4]
Aritmetik ortalama için g(x1, x2, ..., xn) =x1+x2+ ...+ xn.
Geometrik ortalama için g(x1, x2, ..., xn) =x1·x2· ...· xn.
Harmonik ortalama için g(x1, x2, ..., xn) =x1−1+x2−1+ ...+ xn−1.
Değişik ortalama tipleri özeti
İstatistik bilim dalında bir sıra değişik ortalama tipleri geliştirilmiş ve bunlardan araştırıcının isteğine göre birinin veya birkaçının eldeki veriler için merkezsel konum ölçüsü olarak kullanılması imkânı sağlanmıştır.
Bir çeşit kesilmiş ortalama olup belirli bir yüzde olarak kesilen en yüksek ve en düşük değerler bertaraf edileceğine kalan sayılar için en yuksek ve en düşük veri değerleri yerine ikame edilirler.
^Mehmet Güven GÜNVER, Prof. Dr. Mustafa Şükrü ŞENOCAK, Doç Dr. Suphi VEHİD, İstatistikte Altın Oran, Türkmen Kitabevi, 2014, ISBN : 9786054749409
^Bakın Bibby,J. (1974) "Axiomatisations of the average and a further generalisation of monotonic sequences", Glasgow Mathematical Journal, C.15, say. 63–65,
Spiegel, Murray R ve Stephens, Larry J. (Tr.Çev.: Çelebioğlu, Salih) (2013) İstatistik, İstanbul: Nobel Akademik Yayıncılık ISBN 9786051337043