tak na szybko to moze to
Wykonywanie analizy statystycznej i inżynierskiej za pomocą pakietu Analysis
ToolPak
Pokaż wszystko
Ukryj wszystko
Korzystając z pakietu Analysis ToolPak, można zaoszczędzić czas i zmniejszyć
liczbę czynności wykonywanych podczas opracowywania złożonych analiz
statystycznych lub inżynierskich. Użytkownik dostarcza dane i parametry
analiz, a narzędzie używa odpowiednich statystycznych lub inżynierskich
funkcji makr, aby obliczyć wyniki i wyświetlić je w tabeli wyników. Niektóre
narzędzia generują wykresy w dodatkowych tabelach wyników.
Dodatek Analysis ToolPak zawiera opisane poniżej narzędzia. Aby uzyskać do
nich dostęp, kliknij przycisk Analiza danych w grupie Analiza na karcie
Dane. Jeśli polecenie Analiza danych jest niedostępne, należy załadować
dodatek Analysis ToolPak.
Ładowanie dodatku Analysis ToolPak
Kliknij przycisk Microsoft Office , a następnie kliknij przycisk Opcje
programu Excel.
Kliknij pozycję Dodatki, a następnie w polu Zarządzaj wybierz pozycję
Dodatki programu Excel.
Kliknij przycisk Przejdź.
W polu Dostępne dodatki zaznacz pole wyboru Analysis ToolPak, a następnie
kliknij przycisk OK.
Porada Jeśli pozycja Analysis ToolPak nie jest wyświetlana w polu Dostępne
dodatki, kliknij przycisk Przeglądaj, aby odnaleźć ten dodatek.
Jeśli zostanie wyświetlony monit informujący o tym, że nie zainstalowano
pakietu Analysis ToolPak na komputerze, kliknij przycisk Tak, aby
zainstalować pakiet.
Uwaga Aby dodać funkcje języka Visual Basic for Application (VBA) dla
dodatku Analysis ToolPak, można w podobny sposób załadować także dodatek
Analysis ToolPak — VBA. W polu Dostępne dodatki zaznacz pole wyboru Analysis
ToolPak — VBA.
Aby uzyskać opis narzędzia, kliknij jego nazwę na poniższej liście.
Anova
Narzędzie analityczne Anova umożliwia przeprowadzanie różnych typów analiz
wariancji. Wybór odpowiedniego narzędzia zależy od liczby czynników oraz od
liczby próbek testowanych populacji.
Anova: pojedynczy czynnik
Narzędzie wykonuje prostą analizę wariancji na danych dla co najmniej dwóch
próbek. W ramach analizy jest przeprowadzany test hipotezy zakładającej, że
każda próbka jest pobierana z tego samego podstawowego rozkładu
prawdopodobieństwa w odniesieniu do alternatywnej hipotezy, która stwierdza,
że podstawowe rozkłady prawdopodobieństwa nie są takie same w przypadku
wszystkich próbek. Jeżeli istnieją tylko dwie próbki, można użyć funkcji
arkusza TEST.T. W przypadku więcej niż dwóch próbek nie można użyć funkcji
TEST.T — zamiast niej można wywołać model pojedynczego czynnika narzędzia
Anova.
Anova: dwa czynniki z replikacją
To narzędzie analityczne jest przydatne, gdy dane można sklasyfikować w
dwóch różnych wymiarach. Na przykład w eksperymencie pomiaru wysokości
roślin można nawozić rośliny nawozami różnych marek (np. A, B, C) i uprawiać
je w różnych temperaturach (np. w niskiej i wysokiej). Dla każdej z 6
możliwych par {nawóz, temperatura} przeprowadzamy jednakową liczbę
obserwacji wysokości rośliny. Dzięki temu narzędziu Anova można sprawdzać,
które z poniższych hipotez są prawdziwe:
Wysokości roślin dla nawozów różnych marek są pobierane z tej samej
populacji źródłowej. Podczas tej analizy temperatury są ignorowane.
Wysokości roślin dla różnych poziomów temperatur są pobierane z tej samej
populacji źródłowej. Podczas tej analizy są ignorowane marki nawozów.
Przy określaniu wpływu różnic między markami nawozów w punkcie 1 i różnic
temperatur w punkcie 2 sześć próbek reprezentujących wszystkie pary wartości
{nawóz, temperatura} pochodzi z tej samej populacji. Hipoteza alternatywna
zakłada, że wpływ określonych par {nawóz, temperatura} jest większy niż
różnice związane tylko z nawozem lub tylko z temperaturą.
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
Anova: dwa czynniki bez replikacji
To narzędzie analityczne jest przydatne, gdy dane są sklasyfikowane w dwóch
różnych wymiarach, tak jak podczas analizy dwóch czynników z replikacją.
Jednak w przypadku tego narzędzia zakłada się, że każda para jest
obserwowana tylko raz (na przykład każda para {nawóz, temperatura} w
poprzednim przykładzie).
Korelacja
Funkcje arkusza WSP.KORELACJI i PEARSON obliczają współczynnik korelacji
między dwiema zmiennymi pomiarowymi podczas obserwacji pomiarów każdej
zmiennej dla każdego z N obiektów (każda brakująca obserwacja dowolnego
obiektu powoduje zignorowanie tego obiektu podczas analizy). Narzędzie do
analizy korelacji jest szczególnie użyteczne, gdy istnieją więcej niż dwie
zmienne pomiarowe dla każdego z N obiektów. Tworzona jest tabela wyników,
matryca korelacji, w której znajduje się wartość WSP.KORELACJI (lub PEARSON)
zastosowana do każdej możliwej pary zmiennych pomiarowych.
Współczynnik korelacji, podobnie jak kowariancja, jest miarą stopnia, w
jakim dwie zmienne pomiarowe mogą różnić się od siebie. W przeciwieństwie do
kowariancji współczynnik korelacji jest tak skalowany, aby jego wartość była
niezależna od jednostek, w których są wyrażone dwie zmienne pomiarowe
(jeżeli na przykład dwie zmienne pomiarowe to waga i wysokość, wartość
współczynnika korelacji nie zmieni się, jeżeli waga w funtach zostanie
przeliczona na kilogramy). Wszystkie współczynniki korelacji muszą mieć
wartość od -1 do +1 włącznie.
Narzędzie do analizy korelacji pozwala sprawdzić każdą parę zmiennych
pomiarowych i stwierdzić, czy dwie zmienne pomiarowe mają tendencję do
jednoczesnego zmieniania się — czy duże wartości jednej zmiennej raczej
odpowiadają dużym wartościom drugiej zmiennej (korelacja dodatnia), czy małe
wartości jednej zmiennej raczej odpowiadają dużym wartościom drugiej
zmiennej (korelacja ujemna), czy też wartości obu zmiennych są od siebie
niezależne (korelacja bliska zeru).
Kowariancja
Narzędzi Korelacja i Kowariancja można używać w tym samym kontekście, gdy
obserwuje się N różnych zmiennych pomiarowych w grupie osób. Dzięki
narzędziom Korelacja i Kowariancja można utworzyć tabelę wyników — macierz,
w której znajdzie się odpowiednio współczynnik korelacji lub kowariancja
między każdą parą zmiennych pomiarowych. Różnica polega na tym, że
współczynniki korelacji są tak wyskalowane, że muszą należeć do przedziału
od -1 do +1 włącznie, a odpowiednie kowariancje nie są skalowane.
Współczynnik korelacji, podobnie jak kowariancja, jest miarą stopnia, w
jakim dwie zmienne pomiarowe mogą różnić się od siebie.
Narzędzie Kowariancja oblicza wartość funkcji arkusza KOWARIANCJA dla każdej
pary zmiennych pomiarowych. Bezpośrednie użycie funkcji KOWARIANCJA, a nie
narzędzia Kowariancja, jest wskazane wówczas, gdy istnieją tylko dwie
zmienne pomiarowe, czyli N=2. Wpis na przekątnej tabeli wyników narzędzia
Kowariancja na pozycji wiersz i, kolumna i jest kowariancją i-tej zmiennej
pomiarowej ze sobą. Jest to tylko wariancja populacji dla tej zmiennej
obliczona przy użyciu funkcji arkusza WARIANCJA.POPUL.
Narzędzie kowariancji pozwala sprawdzić każdą parę zmiennych pomiarowych i
stwierdzić, czy dwie zmienne pomiarowe mają tendencję do jednoczesnego
zmieniania się — czy duże wartości jednej zmiennej raczej odpowiadają dużym
wartościom drugiej zmiennej (kowariancja dodatnia), czy małe wartości jednej
zmiennej raczej odpowiadają dużym wartościom drugiej zmiennej (kowariancja
ujemna), czy też wartości obu zmiennych są od siebie niezależne (kowariancja
bliska zeru).
Statystyki opisowe
Narzędzie analityczne Statystyki opisowe tworzy raport oparty na
standardowych parametrach statystycznych dla danych z zakresu wejściowego,
dostarczając informacji o głównej tendencji i zmienności danych.
Wygładzanie wykładnicze
Narzędzie analityczne Wygładzanie wykładnicze służy do przewidywania
wartości na podstawie prognozy dla poprzedniego okresu, skorygowanej o błąd,
jaki w niej wystąpił. Narzędzie korzysta ze stałej wygładzania a, której
wielkość określa stopień reakcji prognoz na błędy istniejące w poprzedniej
prognozie.
Uwaga Rozsądne wartości stałej wygładzania wynoszą od 0,2 do 0,3. Te
wartości wskazują, że bieżąca prognoza powinna być korygowana o 20 do 30
procent w przypadku błędu w prognozie poprzedniej. Większe stałe owocują
szybszą odpowiedzią, ale mogą skutkować błędami w prognozie. Mniejsze stałe
mogą skutkować większą zwłoką w prognozowaniu wartości.
Test F: dwie próbki dla wariancji
Narzędzie analityczne Test F: dwie próbki dla wariancji wykonuje test F na
dwóch próbkach, porównując wariancje dla dwóch populacji.
Narzędzia Test F można na przykład użyć w odniesieniu do próbek czasu w
pojedynku pływackim dla każdej z dwóch drużyn. Dzięki temu narzędziu można
uzyskać wynik testu hipotezy zerowej, która zakłada, że dwie próbki pochodzą
z rozkładów o równych wariancjach przeciwko hipotezie alternatywnej, która
zakłada, że wariancje nie są równe w rozkładach podstawowych.
Narzędzie oblicza wartość f statystyki F (lub współczynnika F). Wartość f
zbliżona do 1 stanowi dowód na to, że wariancje rozkładu podstawowego są
równe. Jeżeli w tabeli wyników f < 1, „P(F <= f) jednostronna” daje
prawdopodobieństwo obserwowania wartości statystyki F mniejszej niż f, gdy
wariancje rozkładu są równe i „Wartość krytyczna jednostronna F” jest
wartością krytyczną mniejszą od 1 dla wybranego poziomu istotności Alfa.
Jeżeli f > 1, „P(F <= f) jednostronna” daje prawdopodobieństwo obserwowania
wartości statystyki F większej od f, gdy wariancje rozkładu są równe i
„Wartość krytyczna jednostronna F” daje wartość krytyczną większą od 1 dla
wartości Alfa.
Analiza Fouriera
Narzędzie analiza Fouriera służy do rozwiązywania problemów w układach
liniowych oraz analizy danych okresowych i używa do transformacji danych
metody szybkiej transformaty Fouriera (FFT, Fast Fourier Transform). To
narzędzie obsługuje również transformacje odwrotne, w których odwrotność
danych przetransformowanych zwraca dane oryginalne.
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
Histogram
Narzędzie analityczne Histogram służy do obliczania indywidualnych i
skumulowanych częstotliwości dla danych znajdujących się w zakresach komórek
oraz dla przedziałów danych. Narzędzie generuje dane dotyczące liczby
wystąpień danej wartości w zbiorze danych.
Można na przykład wyznaczyć rozkład uzyskanych ocen w grupie liczącej 20
studentów. Tabela histogramu zawiera granice przedziałów oraz liczbę ocen
między najniższą a bieżącą granicą. Najczęściej występująca ocena jest
nazywana wartością modalną danych.
Średnia ruchoma
Narzędzie analityczne Średnia ruchoma przewiduje wartości w okresie prognozy
na podstawie średniej wartości zmiennej dla określonej liczby poprzednich
okresów. Średnia ruchoma dostarcza informacje o trendach, które nie byłyby
widoczne przy obliczeniu średniej prostej dla wszystkich danych
historycznych. Narzędzie to jest przydatne w przewidywaniu wielkości
sprzedaży, poziomu zapasów magazynowych lub innych trendów. Każda wartość
prognozy wynika z następującej formuły:
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
gdzie:
N jest liczbą poprzednich okresów uwzględnionych w obliczaniu średniej
ruchomej
Aj jest wartością rzeczywistą w chwili j
Fj jest wartością prognozowaną w chwili j
Generowanie liczb losowych
Narzędzie analityczne Generowanie liczb losowych wypełnia zakres
niezależnymi liczbami losowymi uzyskanymi z jednego z kilku dostępnych
rozkładów. Umożliwia ono opisywanie elementów populacji przy użyciu rozkładu
prawdopodobieństwa. Można na przykład użyć rozkładu normalnego, aby opisać
populację wzrostu poszczególnych osób lub rozkładu Bernoulli'ego dla dwóch
możliwych wyników, aby opisać populację wyników rzutu monetą.
Ranga i percentyl
Narzędzie analityczne Ranga i percentyl tworzy tabelę zawierającą rangę
porządkową i procentową każdej wartości ze zbioru danych. Można w ten sposób
analizować względną wagę wartości w zbiorze danych. To narzędzie korzysta z
funkcji arkusza POZYCJA i PROCENT.POZYCJA. Funkcja POZYCJA nie obsługuje
wartości związanych. Jeżeli chcesz, aby wartości związane były obsługiwane,
użyj funkcji arkusza POZYCJA wraz ze współczynnikiem korekcji zasugerowanym
w pliku Pomocy funkcji POZYCJA.
Regresja
Narzędzie Analiza regresji wykonuje analizę regresji liniowej, dopasowując
linię do zbioru wyników eksperymentalnych za pomocą metody „najmniejszych
kwadratów”. Umożliwia ono analizowanie wpływu, jaki na pojedynczą zmienną
zależną wywierają zmienne niezależne. Można na przykład przeanalizować wpływ
czynników, takich jak wiek, wzrost i waga, na wyniki lekkoatlety. Opierając
się na zbiorze danych dotyczących osiąganych wyników, każdemu z trzech
czynników można przypisać udział w wyniku osiągniętym przez sportowca, a
następnie na tej podstawie przewidywać rezultaty innego atlety.
Narzędzie Regresja korzysta z funkcji arkusza REGLINP.
Próbkowanie
Narzędzie analizy Próbkowanie tworzy próbkę z populacji, traktując populację
jako zakres wejściowy. Jeśli populacja jest zbyt liczna, aby poddać ją
przetwarzaniu lub przedstawić na wykresie, można posłużyć się próbką
reprezentatywną. Można również utworzyć próbkę zawierającą tylko wartości z
określonej części cyklu, jeśli istnieje prawdopodobieństwo, że dane
wejściowe mają charakter okresowy. Jeśli na przykład zakres wejściowy
zawiera wielkości sprzedaży kwartalnej, to próbkowanie z okresem równym
cztery powoduje umieszczenie w zakresie wyjściowym wartości dla tego samego
kwartału.
Test t
Narzędzia analityczne Test t wykonujące dwie próby sprawdzają równość
średnich populacji dla każdej próbki. W trzech narzędziach przyjęto różne
założenia: wariancje populacji są równe, wariancje populacji nie są równe i
dwie próbki stanowią obserwacje tych samych obiektów przed eksperymentem i
po nim.
W przypadku wszystkich trzech poniższych narzędzi wartość statystyki t,
czyli wartość t, jest obliczana i wyświetlana jako „t Stat” w tabelach
wyników. W zależności od danych, ta wartość (t) może być ujemna lub
nieujemna. Przy założeniu, że średnie z rozkładu podstawowego są równe,
jeżeli t < 0, to wartość „P(T <= t) jednostronna” daje prawdopodobieństwo,
że obserwowana wartość statystyki t będzie bardziej ujemna od t. Jeżeli t
>=0, to wartość „P(T <= t) jednostronna” daje prawdopodobieństwo, że
obserwowana wartość statystyki t będzie bardziej dodatnia od t. „Wartość
krytyczna jednostronna t” stanowi wartość odcięcia, a prawdopodobieństwo
zaobserwowania wartości statystyki t większej lub równej „Wartości
krytycznej jednostronnej t” wynosi Alfa.
Wartość „P(T <= t) dwustronna” daje prawdopodobieństwo, że obserwowana
wartość statystyki t będzie większa w wartości bezwzględnej od t. „Wartość
krytyczna dwustronna P” daje wartość odcięcia, przy której
prawdopodobieństwo uzyskania wartości obserwowanej statystyki t większej w
wartości bezwzględnej od „Wartości krytycznej dwustronnej P” wynosi Alfa.
Test t: sparowany, dwie próby dla średnich
Test sparowany można stosować, jeżeli istnieje naturalne sparowanie
obserwacji w próbach, na przykład w przypadku dwukrotnego badania próbki z
grupy — przed eksperymentem i po nim. To narzędzie analityczne i zawarta w
nim formuła przeprowadza sparowany test t Studenta dla dwóch próbek,
pozwalający stwierdzić, czy obserwacje dokonane przed eksperymentem i
obserwacje dokonane po eksperymencie mogą pochodzić z rozkładów z równą
średnią z populacji. W tej formie testu t nie zakłada się, że wariancje obu
populacji są równe.
Uwaga To narzędzie wyznacza między innymi wariancję sumaryczną, będącą
zakumulowaną miarą rozkładu danych wokół średniej, obliczoną na podstawie
następującej formuły:
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
Test t: dwie próby, przy założeniu równych wariancji
To narzędzie analityczne przeprowadza test t Studenta dla dwóch prób. W tej
odmianie testu t zakłada się, że oba zbiory danych pochodzą z rozkładów z
takimi samymi wariancjami. Test jest nazywany testem t-homoscedastycznym.
Test t umożliwia określenie, czy dwie próbki mogą pochodzić z rozkładów o
równych średnich z populacji.
Test t: dwie próby, przy założeniu nierównych wariancji
To narzędzie analityczne przeprowadza test t Studenta dla dwóch prób. W tej
odmianie testu t zakłada się, że oba zbiory danych pochodzą z rozkładów o
nierównych wariancjach. Test ten jest nazywany testem t-heteroscedastycznym.
Tak jak w powyższym przypadku równych wariancji, test t umożliwia
określenie, czy dwie próbki mogą pochodzić z rozkładów o równych średnich z
populacji. Jeżeli istnieje jedna grupa obiektów i dwie próbki odpowiadają
pomiarom dla każdego obiektu przed eksperymentem i po nim, należy użyć testu
sparowanego opisanego w przykładzie poniżej.
Wartość statystyczna t jest wyznaczana na podstawie następującej formuły:
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
Poniższa formuła służy do obliczania stopni swobody df. Ponieważ wynik
obliczeń nie jest zazwyczaj liczbą całkowitą, wartość df jest zaokrąglana do
najbliższej liczby całkowitej w celu uzyskania wartości krytycznej z tabeli
t. Funkcja arkusza programu Excel TEST.T korzysta z obliczonej wartości df
bez zaokrąglania, ponieważ można obliczyć wartość dla funkcji TEST.T ze
stopniem swobody, który nie jest liczbą całkowitą. Ze względu na różne
sposoby określania stopni swobody wyniki działania funkcji TEST.T i
narzędzia Test t będą różne w przypadku nierównych wariancji.
--------------------------------------------------------------------------------
--------------------------------------------------------------------------------
Test z
Narzędzie analityczne Test z: dwie próby dla średnich przeprowadza test z na
dwóch próbach dla średnich o znanych wariancjach. To narzędzie służy do
sprawdzania hipotezy zerowej, która zakłada, że między dwiema średnimi z
populacji nie ma żadnej różnicy wobec jednostronnych lub dwustronnych
hipotez alternatywnych. Jeżeli wariancje nie są znane, należy użyć funkcji
arkusza TEST.Z.
Podczas korzystania z narzędzia Test z należy odpowiednio interpretować
wyniki. Wartość „P(Z <= z) jednostronna” jest naprawdę wartością P(Z >=
MODUŁ.LICZBY(z)), czyli prawdopodobieństwem, że wartość z jest dalsza od 0 w
tym samym kierunku co obserwowana wartość z, gdy średnie z populacji nie
różnią się od siebie. Wartość „P(Z <= z) dwustronna” jest naprawdę wartością
P(Z >= MODUŁ.LICZBY(z) lub Z <= -MODUŁ.LICZBY(z)), czyli
prawdopodobieństwem, że wartość z jest dalsza od 0 w innym kierunku niż
obserwowana wartość z, gdy średnie z populacji nie różnią się od siebie.
Wynik dwustronny jest tylko wynikiem jednostronnym pomnożonym przez 2.
Narzędzia Test z można także używać w przypadku hipotezy zerowej, która
zakłada, że istnieje określona wartość niezerowa dla różnicy między dwiema
średnimi z populacji. Można na przykład użyć tego testu w celu zbadania
różnic w działaniu dwóch modeli samochodów.
Uwagi
Funkcji analizy danych można jednocześnie używać tylko w jednym arkuszu
kalkulacyjnym. Podczas przeprowadzania analizy danych dla pogrupowanych
arkuszy wyniki będą wyświetlone w pierwszym arkuszu, a w pozostałych
arkuszach pojawią się puste, sformatowane tabele. Aby przeprowadzić analizę
danych w pozostałych arkuszach, należy powtórzyć obliczenia za pomocą
narzędzia analizy dla każdego arkusza.
Lista książek zawierających szczegółowe informacje o metodach statystycznych
lub algorytmach użytych podczas tworzenia narzędzi i funkcji statystycznych
programu Microsoft Excel jest dostępna w temacie Bibliografia dotycząca
metod statystycznych i algorytmów.
--
Daniel Stawicki
Specjalista ds. Pomocy Technicznej
Pomoc Techniczna Microsoft
// Uprzejmie proszę o nie wysyłanie zapytań bezpośrednio na mój adres email.
Zapytania takie pozostaną bez odpowiedzi, gdyż adres ten nie jest
monitorowany. //