1. EducationMathStatistics Tworzenie przedziału ufności dla różnicy dwóch sposobów ze znanymi odchyleniami standardowymi
Statystyki dla manekinów, 2. edycja

Przez Deborah J. Rumsey

Jeśli znasz odchylenia standardowe dla dwóch próbek populacji, możesz znaleźć przedział ufności (CI) dla różnicy między ich średnimi lub średnimi. Celem wielu badań i badań statystycznych jest porównanie dwóch populacji, takich jak mężczyźni kontra kobiety, rodziny o niskich i wysokich dochodach oraz republikanie i demokraci. Gdy porównywana cecha jest liczbowa (na przykład wzrost, waga lub dochód), przedmiotem zainteresowania jest wielkość różnicy w średnich (średnich) dla dwóch populacji.

Na przykład możesz porównać różnicę średniego wieku republikanów z demokratami lub różnicę średnich dochodów mężczyzn i kobiet. Szacujesz różnicę między dwoma średnimi populacji,

image0.png

pobierając próbkę z każdej populacji (powiedzmy, próbka 1 i próbka 2) i stosując różnicę między dwoma średnimi próbkami

image1.png

plus lub minus margines błędu. Wynikiem jest przedział ufności dla różnicy dwóch średnich populacji,

image2.png

Jeśli znane są oba standardowe odchylenia populacji, wówczas wzór na CI dla różnicy między dwoma średnimi populacji (średnimi) wynosi

image3.png

oznaczają średnią i wielkość pierwszej próbki oraz odchylenie standardowe pierwszej populacji,

image4.png

jest podany (znany);

image5.png

a n2 to średnia i wielkość drugiej próbki oraz odchylenie standardowe drugiej populacji,

image6.png

jest podane (znane). Tutaj z * jest odpowiednią wartością ze standardowego rozkładu normalnego dla pożądanego poziomu ufności. (W poniższej tabeli podano wartości z * dla niektórych poziomów ufności.)

Aby obliczyć CI dla różnicy między dwoma średnimi populacji ze znanymi odchyleniami standardowymi, wykonaj następujące czynności:

image7.png

Załóżmy, że chcesz oszacować z 95% pewnością różnicę między średnią (średnią) długością kolb dwóch odmian kukurydzy cukrowej (umożliwiając im wyhodowanie tej samej liczby dni w tych samych warunkach). Nazwij dwie odmiany Corn-e-stats i Stats-o-sweet. Wcześniejsze badania zakładają, że odchylenia standardowe populacji dla statystyk Corn-e-stats i Stats-o-sweet wynoszą odpowiednio 0,35 cala i 0,45 cala.

image15.png

Kuszeniem jest powiedzieć: „Cóż, wiedziałem, że kukurydza Corn-e-stats była dłuższa, ponieważ jej średnia próbka wynosiła 8,5 cala, a Stat-o-sweet średnio tylko 7,5 cala. Dlaczego potrzebuję nawet przedziału ufności? ”Wszystkie te dwie liczby mówią, że jest coś w tych 210 próbkach kukurydzy. Musisz także uwzględnić zmienność przy użyciu marginesu błędu, aby móc powiedzieć coś o całej populacji kukurydzy.

Zauważ, że możesz otrzymać wartość ujemną

image19.png

Na przykład, jeśli zmieniłbyś dwie odmiany kukurydzy, dostałbyś -1 za tę różnicę. Powiedzielibyście, że Stats-o-sweet był średnio o jeden cal krótszy niż Corn-e-stats w próbie (ten sam wniosek stwierdzono inaczej).

Jeśli chcesz uniknąć ujemnych wartości różnicy w próbce, zawsze spraw, aby grupa z większą próbką oznaczała pierwszą grupę - wszystkie różnice będą dodatnie.

Jednak nawet jeśli grupa z większą średnią próbki służy jako pierwsza grupa, czasami nadal otrzymujesz wartości ujemne w przedziale ufności. Załóżmy w powyższym przykładzie, że średnia próbki statystyk Corn-e-statycznych wynosiła 7,6 cala. Zatem różnica w średnich próbek wynosi 0,1, a górny koniec przedziału ufności wynosi 0,1 + 0,1085 = 0,2085, podczas gdy dolny koniec wynosi 0,1 - 0,1085 = –0,0085. Oznacza to, że prawdziwa różnica jest rozsądna wszędzie od statystyk e-Corn o nawet 0,2085 cala dłuższych do Stat-o-sweet o 0,0085 cala dłuższych. Jest zbyt blisko, aby stwierdzić na pewno, która odmiana jest średnio dłuższa.