Zawartość
Analiza głównych komponentów redukuje zestaw zmiennych skorelowanych z mniejszym zestawem nieskorelowanych zmiennych, upraszczając złożony zestaw danych do późniejszej analizy. Ta złożona procedura statystyczna może być wykonywana przez wiele programów analizy danych lub programy dodatkowe, które rozszerzają możliwości tego samego, dodając nowe funkcje.
Programy arkuszy kalkulacyjnych, takie jak Excel, mogą przeprowadzać analizę głównych komponentów za pomocą rozszerzenia (Image by Flickr.com, dzięki uprzejmości Casey Serin)
Uproszczenie zestawu danych
Analiza głównych komponentów jest techniką eksploracji i redukcji danych. Analityk może wykorzystać tę technikę do wyodrębnienia istotnych informacji z dużego i mylącego zestawu danych. Technika ta jest powszechnie stosowana, gdy liczba obserwowanych zmiennych jest bardzo duża, a korelacje między nimi utrudniają bezpośrednią analizę danych. Na przykład w niektórych przypadkach korelacja między zmiennymi może powodować fałszywe wrażenie nadmiarowości danych, utrudniając analizę techniczną lub utrudniając ocenę danych. Analiza głównych komponentów upraszcza zmienne wyrażające je w funkcji mniejszej liczby elementów, głównych komponentów, które reprezentują większość zmian w pomiarach danych.
Użyj w programie
Złożoność analizy głównych komponentów wymaga użycia konkretnego programu. Istnieje wiele różnych programów statystycznych, a większość z nich jest w stanie wykonać tę technikę. Najpopularniejsze programy to SAS, Stata i SPSS. Uniwersytety, ośrodki badawcze, organizacje konsultingowe i inni specjaliści ds. Badań korzystają z tych konkretnych programów. Wszystkie trzy mogą wykonywać analizę głównych komponentów zestawu danych wstawionego do arkusza, w którym wiersze reprezentują poszczególne obserwacje, a kolumny reprezentują oddzielne zmienne.
Funkcje
Większość głównych programów do analizy komponentów, w tym SAS, Stata i SPSS, przedstawi wyniki w postaci tabel zawierających wartości własne lub wyjaśnione miary wariancji. Wiele programów zapewnia również wizualne wyświetlanie wyników w postaci wykresu piargi.
Rozważania
Analiza głównych składowych jest często mylona z analizą czynnikową, inną techniką redukcji danych, która wyjaśnia skorelowane obserwacje pod względem czynników podstawowych. Oba są w rzeczywistości oddzielnymi procedurami, chociaż analiza głównych komponentów jest krokiem analizy czynnikowej. Jednak wiele pakietów łączy dwie procedury.
Inną ważną kwestią jest to, że specjalistyczne programy, takie jak SAS, SPSS i Stata, są drogie. Dlatego programy te mogą nie być przydatne dla osób, które nie planują często przeprowadzać analiz statystycznych.
Excel
Ludzie, którzy muszą przeprowadzić pewną analizę statystyczną, ale wolą nie kupować specjalistycznego programu, mogą kwestionować, czy powszechnie używane programy arkuszy kalkulacyjnych, takie jak Excel, są w stanie przeprowadzić analizę głównych komponentów. Odpowiedź brzmi: tak i nie. Chociaż program Excel ma pewne narzędzia do analizy danych, które mogą być dostępne z instalacji pakietu analizy statystycznej, program nie ma być programem do analizy statystycznej. Analiza głównych składowych i analiza czynnikowa nie należą do funkcji narzędzia do analizy danych.
Zapobieganie / rozwiązanie
Istnieje program, który użytkownicy mogą pobrać i zainstalować, aby ulepszyć funkcje programu Excel jako narzędzia do analizy danych. Addinsoft, firma specjalizująca się w programach analitycznych, stworzyła XLSTAT. Ten program pozwala Excelowi na przeprowadzenie analizy głównych komponentów i innych procedur statystycznych. Posiada również przyjazne dla użytkownika procedury, pozwalające użytkownikowi wybrać dane do analizy, po prostu klikając i przeciągając komórkę przez wymagane pola. Użytkownicy mogą kupować i pobierać XLSTAT ze strony Addinsoft. Istnieje również darmowa wersja, którą użytkownicy mogą wypróbować, zanim zdecydują się ją kupić.