1. Centralne miary położenia
a) średnia artmetyczna - suma wszystkich wartości zmiennej podzielona przez ich liczebność
-służy do oszacowania średniej populacji; wraz ze wzrostem liczebności próby jej wartość jest coraz bliższa śreniej populacji
-ma zastosowanie do danych w skali interwałowej i ilorazowej
-duży wpływ na jej wartość mają wartości skrajne zmiennej, zwłaszcza przy małej liczebności próby
-obliczanie jej dla rozkładów znacznie odbiegających od normalnego nie ma sensu
b) średnia artmetyczna ważona
-stosuje się ją, gdy obliczamy średnich i gdy nie są one równocenne, np.: różna liczebność prób, różna powierzchnia badawcza z której pobrano próby, różna dokładność pomiarów.
b) Odchylenie standardowe i wariancja
3. Wykresy, Rozkład
a) prawoskośny
b) lewoskośny
c) rozkład dwumodalny
4. Próba statystyczna
a) liniowa?
b) reprezentatywna
c)losowa
S= ((E(x-mod(x))^2)/ (n-1))^1/2
5. Błędy
a) test Q-Dixona
- odrzucanie wyników wątpliwych (błędów grubych)
- dla 3-10 wyników (3<n<10), tylko jedne wynik wątpliwy
1.) Uporządkowanie wyników w szeregu niemalający
x_1 =< x_2 =< x_3 .... =< x_(n-1) =< x_n
2.) Wyznaczenie wartości parametru Q dla wyników skrajnych
Q_1 = (x_2 - x_1)/(x_n - x_1)
Q_2 = (x_n - x_(n-1))/(x_n - x_1)
3.) Odczytanie Q_kr = f (P,n) => Q_n
statystyczne opracowania wyników
Wartość krytyczna Qkr = f(P,n) testu Dixtona
P/n 3 4 5 6 7 8 9
95% 0,94 0,76 0,64 0,56 0,51 0,47 0,44
99% 0,99 0,89 0,78 0,70 0,64 0,59 0,56
Rozstęp MAX-MIN
Q_min = (x_2 - x_1)/R
Q_max = (x_2n - x_(n+1))/R
p=0,05 -> 5% odbiega za punkt jest odbiega
95% przedział ufności
Zad.1 Zawartość Fe_2O_3 w badanym roztworze oznaczano spektrofotometrycznie (po utworzeniu barwnego kompleksu rodankowego) i otrzymano nastepujace wyniki (w mg/dm3):
350; 342; 366; 350; 353; 343; 354; 358; 354; 360.
Sprawdzic, czy wynik 366 obarczony jest błedem grubym, Sprawdzamy czy jakas wartosc jest obarczona błedem grubym (czy nie pasuje do reszty wyników) za pomoca Testu Q-Dixona:
Pierwszym krokiem jest uszeregowanie wyników w ciag niemalejacy:
342; 343; 350; 350; 353; 354; 354; 358; 360; 366
Nastepnie Obliczamy zmienna losowa tego testu, czyli Q:
Gdzie:
x_w to wynik watpliwy (366) .
x_s to wynik sasiadujacy z wynikiem watpliwym. (360)
R to rozstep, czyli rónica wyniku ostatniego i pierwszego. R = 366-342= 24
Q = |366-360|/24 = 0,25
Ostatnim krokiem jest odczytanie z tablicy Q-Dixona parametru krytycznego Qkr i porównanie go z uzyskana wartoscia Q. Odczytywana wartosc jest dla liczby pomiarów n i prawdopodobienstwa P = 1-a
Qkr=0,41
Odp. Skoro Q < Qkr, 0,25<0,41; możemy stwierdzic, iiż wynik watpliwy jest elementem próby.
Zad.2 Wykonano 10 pomiarów cisnienia wewnatrz zbiornika próniowego otrzymujac nastepujace wyniki (w kPa) ;
43, 45, 44, 58, 47, 45, 38, 44, 48 i 46.
Wyznaczyc przedział ufnosci sredniej odrzucajac ewentualnie na mocy odpowiedniego kryterium wynik(i) watpliwe.
Wyniki watpliwe odrzucamy wykorzystujac test Q-Dixona.
Wartosci cisnienia naley uszeregowac w ciag niemalejacy: 38; 43; 44; 44; 45; 45; 46; 47; 48; 58. Wartosc srednia wynosi 45,8; wynikiem watpliwym wydaje sie byc 58. Aby to sprawdzic naley obliczyc parametr Q i porównac go z parametrem krytycznym Qkr.
Q= |58-48|/20 = 0,5
Parametr krytyczny Qkr odczytany z tablicy testu Q-Dixona, dla 95% prawdopodobienstwa i 10 pomiarów, wynosi Q kr =0,41.
Q > Qkr
Z 95% prawdopodobienstwem odrzucamy wynik watpliwy. (za pomoca testu Q-Dixona mona odrzucic tylko jeden watpliwy wynik).
Aby obliczyc przedział ufnosci wartosci sredniej naley policzyc odchylenie standardowe dla wartosci po odrzuceniu wyniku watpliwego. Nastepnie odczytac wartosc parametru t dla nowej serii wartosci cisnienia.
S=2,877, my do obliczen musimy uyc odchylenie standardowe sredniej s_sr = 2,877/ 9^0,5 = 0,959
Parametr Studenta t odczytujemy z tablic dla poziomu istotnosci a=0,05 i liczby stopni swobody równej 9-1=8.
tα = 2,306
Przedział ufnosci dla wartosci sredniej Obliczamy ze wzoru:
x sr sr x t S a μ = ±
μx = 45,8 ± 2,306 × 0,959
μx = 45,8 ± 2,3
Wnioski:
Q(P,n) tym większe, czyli kryterium ostrzejsze, im:
- większy % P, czyli im większa pewność wniosku odrzucającego wynik lub im mniejsze ryzyko (100 - % P) błędnej decyzji (błąd I rodzaju)
- mniejsze n bo ze wzrostem n maleje P znalezienia się kolejnego wyniku x_(n+1) poza przedziałem rozstępu Rn (x_(n+1_ > x_n lub x_(n+1) < x_1 )
- Wartość Q(P,n) maleje wolniej ze wzrostem n, czyli test Q staje się mniej „ostry”, mniej czuły, bo spośród n wyników, korzysta się tylko z 3: x_1 , x_n i x_2 lub x_(n-1)
6. t-Student
t= |x_out - mod(x)|/S
x_out - punkt odbiegający
S - stopnie swobody n-1
7. 3σ
-najczęsciej dla populacji genowej
1σ - 68%
2σ - 95,4%
3σ - 99,8%
a) średnia artmetyczna - suma wszystkich wartości zmiennej podzielona przez ich liczebność
-służy do oszacowania średniej populacji; wraz ze wzrostem liczebności próby jej wartość jest coraz bliższa śreniej populacji
-ma zastosowanie do danych w skali interwałowej i ilorazowej
-duży wpływ na jej wartość mają wartości skrajne zmiennej, zwłaszcza przy małej liczebności próby
-obliczanie jej dla rozkładów znacznie odbiegających od normalnego nie ma sensu
b) średnia artmetyczna ważona
-stosuje się ją, gdy obliczamy średnich i gdy nie są one równocenne, np.: różna liczebność prób, różna powierzchnia badawcza z której pobrano próby, różna dokładność pomiarów.
wi - tzw. waga. Może to być np. liczebność próby, powierzchnia lasu, itp. Przy obliczaniu średniej z pomiarów mierzonych z różną dokładnością wagi są odwrotnością kwadratów błędu.
Zad 1. Należy obliczyć średnią pierśnicę sosen o określonym wieku, rosnących w danym kompleksie leśnym.
Osoba mierząca Średnia (cm) N
A 75,0 5
B 68,3 20
C 69,2 30
D 60,5 100
Zad 1. Należy obliczyć średnią pierśnicę sosen o określonym wieku, rosnących w danym kompleksie leśnym.
Osoba mierząca Średnia (cm) N
A 75,0 5
B 68,3 20
C 69,2 30
D 60,5 100
Zad 2. Należy obliczyć średnią pierśnicę sosen o określonym wieku, rosnących w danym kompleksie leśnym
Dwie osoby otrzymały następujące wyniki w cm
1) 60; 70; 65; 70; 55; 60; 80; 75; 75; 70 – dokładność 5 cm
2) 59; 71; 69; 82; 66; 78; 88; 79; 85; 83 – dokładność 1 cm
Przy obliczaniu średniej z pomiarów mierzonych z różną dokładnością wagi są odwrotnością kwadratów błędu.
Dwie osoby otrzymały następujące wyniki w cm
1) 60; 70; 65; 70; 55; 60; 80; 75; 75; 70 – dokładność 5 cm
2) 59; 71; 69; 82; 66; 78; 88; 79; 85; 83 – dokładność 1 cm
Przy obliczaniu średniej z pomiarów mierzonych z różną dokładnością wagi są odwrotnością kwadratów błędu.
c) Mediana (Me)
– (drugi kwartyl) wartość środkowa, która dzieli uporządkowany zbiór danych na dwie równe części. Oznacza to, że tyle samo pomiarów znajduje się powyżej i poniżej mediany. Gdy liczba pomiarów jest parzysta, to oblicza się średnią z dwóch sąsiadujących, środkowych elementów.
np: 0, 1, 2, 5, 6, 7, 9 Me = 5
np: 0, 1, 2, 5, 6, 7, 9, 11 Me = 5,5
– (drugi kwartyl) wartość środkowa, która dzieli uporządkowany zbiór danych na dwie równe części. Oznacza to, że tyle samo pomiarów znajduje się powyżej i poniżej mediany. Gdy liczba pomiarów jest parzysta, to oblicza się średnią z dwóch sąsiadujących, środkowych elementów.
np: 0, 1, 2, 5, 6, 7, 9 Me = 5
np: 0, 1, 2, 5, 6, 7, 9, 11 Me = 5,5
•
•
•
•
- na jej wartość nie mają wpływu wartości skrajne
- może być stosowana w przypadku rozkładów różnych od normalnego
- może być stosowana do skali interwałowej, ilorazowej i porządkowe
- żeby obliczyć medianę nie musimy dysponować wszystkimi pomiarami - trzeba tylko znać ich pozycję w uporządkowanym szeregu
d) Kwartyle
- może być stosowana w przypadku rozkładów różnych od normalnego
- może być stosowana do skali interwałowej, ilorazowej i porządkowe
- żeby obliczyć medianę nie musimy dysponować wszystkimi pomiarami - trzeba tylko znać ich pozycję w uporządkowanym szeregu
d) Kwartyle
-wartości, które dzielą uporządkowany zbiór danych na cztery równe części
- Pierwszy kwartyl (Q1) - 25% elementów zbioru ma wartości nie większe, a 75% nie mniejsze od tego elementu. drugi kwartyl (Q2) = mediana, Trzeci kwartyl (Q3) - 75% elementów zbioru ma wartości nie większe, a 25% nie mniejsze od tego elementu.
2. Miara rozproszenia
a) Rozstęp międzykwartylarny (międzykwartylowy) (kwartylny) (odchylenie ćwiartkowe) - różnica miedzy trzecim i pierwszym kwartylem.
- Jest to część zbioru danych zawierająca 50% wszystkich wartości wokół średniej arytmetycznej (lub mediany)
- Pierwszy kwartyl (Q1) - 25% elementów zbioru ma wartości nie większe, a 75% nie mniejsze od tego elementu. drugi kwartyl (Q2) = mediana, Trzeci kwartyl (Q3) - 75% elementów zbioru ma wartości nie większe, a 25% nie mniejsze od tego elementu.
2. Miara rozproszenia
a) Rozstęp międzykwartylarny (międzykwartylowy) (kwartylny) (odchylenie ćwiartkowe) - różnica miedzy trzecim i pierwszym kwartylem.
- Jest to część zbioru danych zawierająca 50% wszystkich wartości wokół średniej arytmetycznej (lub mediany)
b) Odchylenie standardowe i wariancja
3. Wykresy, Rozkład
a) prawoskośny
b) lewoskośny
c) rozkład dwumodalny
4. Próba statystyczna
a) liniowa?
b) reprezentatywna
c)losowa
S= ((E(x-mod(x))^2)/ (n-1))^1/2
5. Błędy
a) test Q-Dixona
- odrzucanie wyników wątpliwych (błędów grubych)
- dla 3-10 wyników (3<n<10), tylko jedne wynik wątpliwy
1.) Uporządkowanie wyników w szeregu niemalający
x_1 =< x_2 =< x_3 .... =< x_(n-1) =< x_n
2.) Wyznaczenie wartości parametru Q dla wyników skrajnych
Q_1 = (x_2 - x_1)/(x_n - x_1)
Q_2 = (x_n - x_(n-1))/(x_n - x_1)
3.) Odczytanie Q_kr = f (P,n) => Q_n
statystyczne opracowania wyników
Wartość krytyczna Qkr = f(P,n) testu Dixtona
P/n 3 4 5 6 7 8 9
95% 0,94 0,76 0,64 0,56 0,51 0,47 0,44
99% 0,99 0,89 0,78 0,70 0,64 0,59 0,56
Rozstęp MAX-MIN
Q_min = (x_2 - x_1)/R
Q_max = (x_2n - x_(n+1))/R
p=0,05 -> 5% odbiega za punkt jest odbiega
95% przedział ufności
Zad.1 Zawartość Fe_2O_3 w badanym roztworze oznaczano spektrofotometrycznie (po utworzeniu barwnego kompleksu rodankowego) i otrzymano nastepujace wyniki (w mg/dm3):
350; 342; 366; 350; 353; 343; 354; 358; 354; 360.
Sprawdzic, czy wynik 366 obarczony jest błedem grubym, Sprawdzamy czy jakas wartosc jest obarczona błedem grubym (czy nie pasuje do reszty wyników) za pomoca Testu Q-Dixona:
Pierwszym krokiem jest uszeregowanie wyników w ciag niemalejacy:
342; 343; 350; 350; 353; 354; 354; 358; 360; 366
Nastepnie Obliczamy zmienna losowa tego testu, czyli Q:
Gdzie:
x_w to wynik watpliwy (366) .
x_s to wynik sasiadujacy z wynikiem watpliwym. (360)
R to rozstep, czyli rónica wyniku ostatniego i pierwszego. R = 366-342= 24
Q = |366-360|/24 = 0,25
Ostatnim krokiem jest odczytanie z tablicy Q-Dixona parametru krytycznego Qkr i porównanie go z uzyskana wartoscia Q. Odczytywana wartosc jest dla liczby pomiarów n i prawdopodobienstwa P = 1-a
Qkr=0,41
Odp. Skoro Q < Qkr, 0,25<0,41; możemy stwierdzic, iiż wynik watpliwy jest elementem próby.
Zad.2 Wykonano 10 pomiarów cisnienia wewnatrz zbiornika próniowego otrzymujac nastepujace wyniki (w kPa) ;
43, 45, 44, 58, 47, 45, 38, 44, 48 i 46.
Wyznaczyc przedział ufnosci sredniej odrzucajac ewentualnie na mocy odpowiedniego kryterium wynik(i) watpliwe.
Wyniki watpliwe odrzucamy wykorzystujac test Q-Dixona.
Wartosci cisnienia naley uszeregowac w ciag niemalejacy: 38; 43; 44; 44; 45; 45; 46; 47; 48; 58. Wartosc srednia wynosi 45,8; wynikiem watpliwym wydaje sie byc 58. Aby to sprawdzic naley obliczyc parametr Q i porównac go z parametrem krytycznym Qkr.
Q= |58-48|/20 = 0,5
Parametr krytyczny Qkr odczytany z tablicy testu Q-Dixona, dla 95% prawdopodobienstwa i 10 pomiarów, wynosi Q kr =0,41.
Q > Qkr
Z 95% prawdopodobienstwem odrzucamy wynik watpliwy. (za pomoca testu Q-Dixona mona odrzucic tylko jeden watpliwy wynik).
Aby obliczyc przedział ufnosci wartosci sredniej naley policzyc odchylenie standardowe dla wartosci po odrzuceniu wyniku watpliwego. Nastepnie odczytac wartosc parametru t dla nowej serii wartosci cisnienia.
S=2,877, my do obliczen musimy uyc odchylenie standardowe sredniej s_sr = 2,877/ 9^0,5 = 0,959
Parametr Studenta t odczytujemy z tablic dla poziomu istotnosci a=0,05 i liczby stopni swobody równej 9-1=8.
tα = 2,306
Przedział ufnosci dla wartosci sredniej Obliczamy ze wzoru:
x sr sr x t S a μ = ±
μx = 45,8 ± 2,306 × 0,959
μx = 45,8 ± 2,3
Wnioski:
Q(P,n) tym większe, czyli kryterium ostrzejsze, im:
- większy % P, czyli im większa pewność wniosku odrzucającego wynik lub im mniejsze ryzyko (100 - % P) błędnej decyzji (błąd I rodzaju)
- mniejsze n bo ze wzrostem n maleje P znalezienia się kolejnego wyniku x_(n+1) poza przedziałem rozstępu Rn (x_(n+1_ > x_n lub x_(n+1) < x_1 )
- Wartość Q(P,n) maleje wolniej ze wzrostem n, czyli test Q staje się mniej „ostry”, mniej czuły, bo spośród n wyników, korzysta się tylko z 3: x_1 , x_n i x_2 lub x_(n-1)
6. t-Student
t= |x_out - mod(x)|/S
x_out - punkt odbiegający
S - stopnie swobody n-1
7. 3σ
-najczęsciej dla populacji genowej
1σ - 68%
2σ - 95,4%
3σ - 99,8%
Komentarze
Prześlij komentarz