Serbestlik derecesi (istatistik)

Diğer bilimler için serbestlik derecesi üzerindeki bilgiler için, bakın serbestlik derecesi:

Serbestlik derecesi istatistik'te bir istatistiğin kesin hesaplanmasında kullanılan değerlerin sayısının ne kadar değişme serbestisi olduğunu sayısal olarak verir.^[1]

İstatistiksel parametrelerin kestirimleri değişik nicelikte veriye veya bilgiye dayanabilir. Bir parametrenin kestirimi için kullanılması gereken bağımsız bilgi parçalarının sayısına serbestlik derecesi denir. Genellikle, bir kestirim için serbestlik derecesi bu kestirimi elde etmek için kullanılan bağımsız skorlar sayısı eksi bu parametrenin kendisinin kestirimini yapma etaplarında kullanılan parametreler sayısına eşittir.^[2]

Matematiksel terimlerle, serbestlik derecesi bir rastgele vektörun sahasının boyutu olur veya vektörün tümünün belirlenmesi için bilinmesi gereken parçaların sayısıdır.

Serbestlik derecesi terimi çok defa olasılık dağılımlarında, hipotez sınamasında ve doğrusal modeller (yani doğrusal regresyon ve varyans analizi) alanlarında kullanılır. İstatistiğe giriş kitap veya makalelerinde çok kere bu kavram hipotez sınamasında veya olasılık dağılımları parametreleri olarak ilk defa ortaya çıkartılır. Fakat bu kavramin derinden anlaşılabilmesi için kritik olan, kavramın altında bulunan geometrinin kavranmasıdır. Eğer N boyutlu geometri bilinmezse veya modern örnekleme kuramı ikinci elden sadece istatistiğe giriş kitaplarından öğrenilirse, bu kavram pratik anlamı olmayan bir mistik sözcük olmaktan ileri gitmemektedir.

Bu kavram için notasyon ünlü istatistikçi Ronald Fisher tarafından n olarak kullanılmıştır; ama modern istatistik metinlerinde n örneklem büyüklüğü olarak kullanılır. Bu nedenle serbestlik derecesi notasyon olarak (s.d.) veya İngilizceden esinlenerek d.f. ("degree of freedom") olarak ifade edilir.

Artıklar

İstatistiksel modelin veriye uyarlanmasında, hata ve artık vektörleri genelde vektördeki bileşenlerin sayısından daha kısıtlı bir boyuta sahiptir. Artık veya hata vektörünün bu daha küçük boyuta sahip olma durumuna hatanın "serbestlik derecesi" adı verilir.

Basit bir örnekle açıklanması gerektiğinde:

X_{1},\dots ,X_{n}\,

ifadesindeki x'ler, μ beklenen değerine sahip rassal değişkenler olsun ve

{\overline {X}}_{n}={X_{1}+\cdots +X_{n} \over n}

örneklem ortalaması olsun. Öyleyse

X_{i}-{\overline {X}}_{n}\,

büyüklüğü X_i - μ hata tahmininin artıklarını oluşturan bir büyüklüktür.

Hata terimlerinin aksine, artıkların toplamının 0 olması gerekir. Yani n - 1 boyutlu bir uzayda yer alma kısıntı içindedirler. Eğer artıklardan n - 1 tanesi bilinirse, sonuncusu da bulunabilir. Dolayısıyla hata terimi için n - 1 serbestlik derecesi vardır.

Y_{i}=a+bx_{i}+\varepsilon _{i}\ \mathrm {for} \ i=1,\dots ,n

modelindeki a ve b'nin en küçük kareler yöntemiyle tahmininde

(ε_i ve dolayısıyla Y_i rassaldır). ${\widehat {a}}$ ve ${\widehat {b}}$ , a ve b tahmin ettiğimiz değerler olsun. O zaman;

e_{i}=y_{i}-({\widehat {a}}+{\widehat {b}}x_{i})\,

artıkları iki denklemin tanımladığı uzay içinde yer alacak şekilde kısıtlıdırlar:

e_{1}+\cdots +e_{n}=0,\,

x_{1}e_{1}+\cdots +x_{n}e_{n}=0.\,

Dolayısıyla hata terimi için n - 2 serbestlik derecesi vardır.

(Model tanımlanırken büyük y harfi (Y), artıklar tanımlanırken küçük y harfi (y) kullanılmıştır. Birinci ifade teorik rassal değişkenlere bağlıyken ikinci ifade gerçek veriye dayalıdır.)

Olasılık Dağılımlarındaki Parametreler

Hata terimlerinin olasılık dağılımları genelde bu serbestlik dereceleri ile parametrelendirilir. Bu yüzden Ki-kare dağılımından söz edilirken belli bir serbestlik derecesi gerekir, F-dağılımı, t-dağılımı veya bir Wishart dağılımı pay veya paydalarında serbestlik derecesi içerir.

Bu dağılımlarının genel uygulamalarında, serbestlik derecesi yalnızca tam sayı değeri alır. Hâlbuki, konunun temelinde yer alan matematik, çoğu durumda kesirli serbestlik derecesinin alınmasına müsaade eder ki bu da daha karmaşık kullanımlar ortaya çıkarabilir.

Kaynakça

^ "Animated Software" tarafından hazırlanan "Glossary of Statistical Terms (İstatistik terimleri sözlüğü)" sitesinde "Degrees of Freedom (serbestlik derecesi)" tanımı 17 Eylül 2018 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme tarihi=12.08.2008)
^ Lane, David M. Degrees of Freedom, Statistics Solutions'in HyperStat Online sitesindeki "Degrees of Freedom (serbestlik derecesi)" maddesi 28 Haziran 2018 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme tarihi:21.08.2008)

Dış bağlantılar

İngilizce Wikipedia "Degrees_of_freedom_(statistics)" maddesi 20 Nisan 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişim:20.3.2010)
Eisenhauer, J.G. (2008) "Degrees of Freedom". Teaching Statistics, Cilt 30(3), say.75–78 (İngilizce) (Erişim:20.3.2010)

İstatistik

Betimsel istatistik

Sürekli veriler

Merkezî konum	Ortalama (Aritmetik, Geometrik, Harmonik) • Medyan • Mod
Yayılma	Açıklık • Standart sapma • Varyasyon katsayısı • Çeyrekler açıklığı • Kesirlilikler (kantil) (Dörttebirlik,Ondabirlik, Yüzdebirlik)
Dağılım şekli	Varyans • Çarpıklık • Basıklık • Moment (matematik)

İstatistiksel tablolar

Sıklık dağılımı • Çoklu sayılı özetleme tabloları • İlişki tablosu • Çoklu-yönlü sınıflandırma tabloları

İstatistiksel grafikler

Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı

Veri toplama

Örnek tasarımı	Anakütle •Basit rassal örnekleme Örüntülü örnekleme • Tabakalı örnekleme • Küme örneklemesi • Çok aşamalı örnekleme •
Deneysel tasarım	Anakütle • İstatistiksel deneysel tasarım tipleri • Deneysel hata • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları	Örneklem büyüklüğü • Sınama gücü • Etki büyüklüğü • Örnekleme dağılımı •Standart hata

Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler

Çıkarımsal analiz tipleri

Kestirim • Parametrik çıkarımsal analiz •Parametrik olmayan çıkarımsal analiz • Bayesci çıkarımsal analiz • Meta-analiz

Çıkarımsal kestirim

Genel kestirim kavramları	Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim	Kestirim • Güven aralığı • İnanılır aralık

Hipotez testi

İstatistiksel test ana kavramları	Sıfır hipotez • I.Tür ve II.Tür hata • Anlamlılık seviyesi •p-değeri
Basit tek-değişkenli ve iki-değişkenli parametrik hipotez testi	μ için testi • π için test • μ₁-μ₂ için test • π₁-π₂ için test • σ₁/σ₂ için test
Tek-değişkenli ve iki-değişkenli parametrik olmayan test analizi	Medyan testi • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi

Korelasyon
ve
Regresyon analizi

Korelasyon	Pearson çarpım-moment korelasyonu • Sıralama korelasyonu ( Spearman'in rho • Kendall'in tau)
Doğrusal regresyon	Regresyon analizi • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon	Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi	Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni

Çokdeğişkenli istatistik

Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi •Kanonik korelesyon • Uygunluk analizi • Kümeleme analizi

Zaman serileri analizi

Yapısal model tanımlanması	Zaman serisi yapisal model ögeleri • Zaman serisi ögeleri saptanması • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri	Dekompozisyon • Trend uygulama kestirimi • Üssel düzgünleştirme • ARIMA modelleri • Box–Jenkins • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi	Zaman seri kestirim değerlendirmesi

Sağkalım analizi

Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli

Kategori • Outline • Endeks