Zawartość
Mediana jest punktem środkowym zestawu uporządkowanych danych. Na przykład zbiór (2,4,7,9,10) ma medianę 7. Zamówione dane są agregowane w kategorie, z dokładnymi szczegółami każdego punktu utraty danych. Dlatego dokładna mediana nie może być znana tylko z danych klastrowych. Jeśli jednak znasz liczbę danych w każdym przedziale, możesz określić, który jest „średnim zakresem”, czyli co zawiera punkt, który jest medianą. Możemy dodatkowo udoskonalić oszacowanie punktu środkowego za pomocą formuły, w oparciu o założenie, że punkty danych punktu środkowego są równomiernie rozmieszczone.
Instrukcje
Nauka obliczania mediany grupy danych jest prostym zadaniem (Hemera Technologies / AbleStock.com / Getty Images)-
Grupuj wartości w odstępach, jeśli jeszcze nie są. Określ, który przedział powinien zawierać punkt środkowy.
W celach dydaktycznych rozważ zestaw danych (1,2,4,5,6,7,7,7,9). Mediana jest tutaj 6. Możesz pogrupować zestaw na szerokości równe na przykład 4. Ich rozkład częstotliwości może wówczas wynosić na przykład: 1-4: 3 5-8: 5 9-12: 1 W danych nie połączonych mediana jest wyraźnie w kategorii 5-8. Możesz nawet powiedzieć to bez oglądania oryginalnego zestawu danych.
-
Oblicz różnicę w liczbie punktów danych powyżej średnicy i połowę całkowitej liczby punktów danych.
Zgodnie z tym, co zostało wspomniane, wynosi to 9/2 - 3 = 1,5. To obliczenie szacuje, jak daleko od środkowego zakresu należy znaleźć medianę.
-
Podziel przez liczbę punktów w środkowym zakresie.
Kontynuując przykład, 1,5 / 5 = 0,3. Daje to stosunek tego, jak daleko jest środkowy zakres mediany.
-
Pomnóż wartość otrzymaną powyżej przez szerokość środkowego zakresu.
Kontynuując przykład, 0,3 x 4 = 1,2. To przekształca stosunek w zakresie na rzeczywisty przyrost danych.
-
Dodaj powyższy wynik do wartości między średnim i dolnym zakresem.
Ponieważ przecięcie między średnią a dolnym zakresem wynosi 4,5, otrzymujemy równanie 4.5 + 1.2 = 5.7, które może mieć zaokrąglony wynik do 6, prawidłową odpowiedź.
Jak
- W rzeczywistości powyższe obliczenia są takie same jak we wzorze „L + (n / 2 - c) / fxw”, gdzie L jest liczbą między środkiem a następnym dolnym przedziałem, n oznacza całkowitą liczbę punktów danych, c to całkowita liczba punktów poniżej środka, f to liczba punktów danych w środkowym zakresie, a w to szerokość.