Serbestlik derecesi (istatistik)

Diğer bilimler için serbestlik derecesi üzerindeki bilgiler için, bakın serbestlik derecesi:

Serbestlik derecesi istatistik'te bir istatistiğin kesin hesaplanmasında kullanılan değerlerin sayısının ne kadar değişme serbestisi olduğunu sayısal olarak verir.[1]

İstatistiksel parametrelerin kestirimleri değişik nicelikte veriye veya bilgiye dayanabilir. Bir parametrenin kestirimi için kullanılması gereken bağımsız bilgi parçalarının sayısına serbestlik derecesi denir. Genellikle, bir kestirim için serbestlik derecesi bu kestirimi elde etmek için kullanılan bağımsız skorlar sayısı eksi bu parametrenin kendisinin kestirimini yapma etaplarında kullanılan parametreler sayısına eşittir.[2]

Matematiksel terimlerle, serbestlik derecesi bir rastgele vektörun sahasının boyutu olur veya vektörün tümünün belirlenmesi için bilinmesi gereken parçaların sayısıdır.

Serbestlik derecesi terimi çok defa olasılık dağılımlarında, hipotez sınamasında ve doğrusal modeller (yani doğrusal regresyon ve varyans analizi) alanlarında kullanılır. İstatistiğe giriş kitap veya makalelerinde çok kere bu kavram hipotez sınamasında veya olasılık dağılımları parametreleri olarak ilk defa ortaya çıkartılır. Fakat bu kavramin derinden anlaşılabilmesi için kritik olan, kavramın altında bulunan geometrinin kavranmasıdır. Eğer N boyutlu geometri bilinmezse veya modern örnekleme kuramı ikinci elden sadece istatistiğe giriş kitaplarından öğrenilirse, bu kavram pratik anlamı olmayan bir mistik sözcük olmaktan ileri gitmemektedir.

Bu kavram için notasyon ünlü istatistikçi Ronald Fisher tarafından n olarak kullanılmıştır; ama modern istatistik metinlerinde n örneklem büyüklüğü olarak kullanılır. Bu nedenle serbestlik derecesi notasyon olarak (s.d.) veya İngilizceden esinlenerek d.f. ("degree of freedom") olarak ifade edilir.

Artıklar

İstatistiksel modelin veriye uyarlanmasında, hata ve artık vektörleri genelde vektördeki bileşenlerin sayısından daha kısıtlı bir boyuta sahiptir. Artık veya hata vektörünün bu daha küçük boyuta sahip olma durumuna hatanın "serbestlik derecesi" adı verilir.

Basit bir örnekle açıklanması gerektiğinde:

X 1 , , X n {\displaystyle X_{1},\dots ,X_{n}\,}

ifadesindeki x'ler, μ beklenen değerine sahip rassal değişkenler olsun ve

X ¯ n = X 1 + + X n n {\displaystyle {\overline {X}}_{n}={X_{1}+\cdots +X_{n} \over n}}

örneklem ortalaması olsun. Öyleyse

X i X ¯ n {\displaystyle X_{i}-{\overline {X}}_{n}\,}

büyüklüğü Xi - μ hata tahmininin artıklarını oluşturan bir büyüklüktür.

Hata terimlerinin aksine, artıkların toplamının 0 olması gerekir. Yani n - 1 boyutlu bir uzayda yer alma kısıntı içindedirler. Eğer artıklardan n - 1 tanesi bilinirse, sonuncusu da bulunabilir. Dolayısıyla hata terimi için n - 1 serbestlik derecesi vardır.

Y i = a + b x i + ε i   f o r   i = 1 , , n {\displaystyle Y_{i}=a+bx_{i}+\varepsilon _{i}\ \mathrm {for} \ i=1,\dots ,n}

modelindeki a ve b'nin en küçük kareler yöntemiyle tahmininde

i ve dolayısıyla Yi rassaldır). a ^ {\displaystyle {\widehat {a}}} ve b ^ {\displaystyle {\widehat {b}}} , a ve b tahmin ettiğimiz değerler olsun. O zaman;

e i = y i ( a ^ + b ^ x i ) {\displaystyle e_{i}=y_{i}-({\widehat {a}}+{\widehat {b}}x_{i})\,}

artıkları iki denklemin tanımladığı uzay içinde yer alacak şekilde kısıtlıdırlar:

e 1 + + e n = 0 , {\displaystyle e_{1}+\cdots +e_{n}=0,\,}
x 1 e 1 + + x n e n = 0. {\displaystyle x_{1}e_{1}+\cdots +x_{n}e_{n}=0.\,}

Dolayısıyla hata terimi için n - 2 serbestlik derecesi vardır.

(Model tanımlanırken büyük y harfi (Y), artıklar tanımlanırken küçük y harfi (y) kullanılmıştır. Birinci ifade teorik rassal değişkenlere bağlıyken ikinci ifade gerçek veriye dayalıdır.)

Olasılık Dağılımlarındaki Parametreler

Hata terimlerinin olasılık dağılımları genelde bu serbestlik dereceleri ile parametrelendirilir. Bu yüzden Ki-kare dağılımından söz edilirken belli bir serbestlik derecesi gerekir, F-dağılımı, t-dağılımı veya bir Wishart dağılımı pay veya paydalarında serbestlik derecesi içerir.

Bu dağılımlarının genel uygulamalarında, serbestlik derecesi yalnızca tam sayı değeri alır. Hâlbuki, konunun temelinde yer alan matematik, çoğu durumda kesirli serbestlik derecesinin alınmasına müsaade eder ki bu da daha karmaşık kullanımlar ortaya çıkarabilir.

Kaynakça

  1. ^ "Animated Software" tarafından hazırlanan "Glossary of Statistical Terms (İstatistik terimleri sözlüğü)" sitesinde "Degrees of Freedom (serbestlik derecesi)" tanımı 17 Eylül 2018 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme tarihi=12.08.2008)
  2. ^ Lane, David M. Degrees of Freedom, Statistics Solutions'in HyperStat Online sitesindeki "Degrees of Freedom (serbestlik derecesi)" maddesi 28 Haziran 2018 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişme tarihi:21.08.2008)

Dış bağlantılar

  • İngilizce Wikipedia "Degrees_of_freedom_(statistics)" maddesi 20 Nisan 2010 tarihinde Wayback Machine sitesinde arşivlendi. (İngilizce) (Erişim:20.3.2010)
  • Eisenhauer, J.G. (2008) "Degrees of Freedom". Teaching Statistics, Cilt 30(3), say.75–78 (İngilizce) (Erişim:20.3.2010)
  • g
  • t
  • d
İstatistik
Betimsel istatistik
Sürekli veriler
Merkezî konum
Yayılma
Dağılım şekli
Varyans • Çarpıklık • Basıklık • Moment (matematik)
İstatistiksel tablolar
Sıklık dağılımı  • Çoklu sayılı özetleme tabloları  • İlişki tablosu  • Çoklu-yönlü sınıflandırma tabloları
İstatistiksel grafikler
Dairesel grafik • Çubuk grafiği • Kutu grafiği • Dal-yaprak grafikleri •Kontrol diyagramı • Histogram • Sıklık çizelgesi • Q-Q grafiği • Serpilme diyagramı
Veri toplama
Örnek tasarımı
Deneysel tasarım
Anakütle • İstatistiksel deneysel tasarım tipleri  • Deneysel hata  • Yineleme • Bloklama • Duyarlılık ve belirleme
Örneklem kavramları
Örneklem büyüklüğü • Sınama gücü  • Etki büyüklüğü • Örnekleme dağılımı •Standart hata
Çıkarımsal istatistik
ve
İstatistiksel kestirim ve testler
Çıkarımsal analiz tipleri
Kestirim  • Parametrik çıkarımsal analiz  •Parametrik olmayan çıkarımsal analiz  • Bayesci çıkarımsal analiz  • Meta-analiz
Çıkarımsal kestirim
Genel kestirim kavramları
Momentler yöntemi • Enbüyük olabilirlik • Enbüyük artçıl  • Bayes-tipi kestirimci • Minimum uzaklık • Maksimum aralık verme
Tekdeğişkenli kestirim
Kestirim  • Güven aralığı  • İnanılır aralık
Hipotez testi
İstatistiksel test ana kavramları
Sıfır hipotez  • I.Tür ve II.Tür hata  • Anlamlılık seviyesi  •p-değeri
Basit tek-değişkenli ve iki-değişkenli
parametrik hipotez testi
μ için testi •

π için test • μ12 için test • π12 için test  •

σ12 için test
Tek-değişkenli ve iki-değişkenli
parametrik olmayan test analizi
Medyan testi  • Ki-kare testi • Pearson ki-kare testi •Phi katsayısı  • Wald testi • Mann-Whitney U testi • Wilcoxon'in işaretli sıralama testi
Korelasyon
ve
Regresyon analizi
Korelasyon
Doğrusal regresyon
Regresyon analizi  • Doğrusal model • Genel doğrusal model • Genelleştirilmiş doğrusal model
Doğrusal olmayan regresyon
Parametrik olmayan • Yarıparametrik • Logistik
Varyans analizi
Tek-yönlü varyans analizi • Kovaryans analizi • Bloklu tek-yönlü varyans analizi • Etki karışımı değişkeni
Çokdeğişkenli istatistik
Çokdeğişkenli regresyon • temel bileşenler · Faktör analizi  •Kanonik korelesyon  • Uygunluk analizi  • Kümeleme analizi
Zaman serileri analizi
Yapısal model tanımlanması
Zaman serisi yapisal model ögeleri  • Zaman serisi ögeleri saptanması  • Zaman grafiği • Korrelogram
Zaman serileri kestirim teknik ve modelleri
Dekompozisyon • Trend uygulama kestirimi  • Üssel düzgünleştirme  • ARIMA modelleri  • Box–Jenkins  • Spektral yoğunluk kestirimi
Kestirim değerlendirmesi
Zaman seri kestirim değerlendirmesi
Sağkalım analizi
Sağkalım fonksiyonu • Kaplan–Meier • Log-sıra testi • Başarısızlık oranı • orantılı tehlikeler modeli
Kategori • Outline • Endeks