Jak obliczyć medianę danych klastrowanych

Autor: Peter Berry
Data Utworzenia: 15 Sierpień 2021
Data Aktualizacji: 21 Listopad 2024
Anonim
Jak obliczyć medianę?
Wideo: Jak obliczyć medianę?

Zawartość

Mediana jest punktem środkowym zestawu uporządkowanych danych. Na przykład zbiór (2,4,7,9,10) ma medianę 7. Zamówione dane są agregowane w kategorie, z dokładnymi szczegółami każdego punktu utraty danych. Dlatego dokładna mediana nie może być znana tylko z danych klastrowych. Jeśli jednak znasz liczbę danych w każdym przedziale, możesz określić, który jest „średnim zakresem”, czyli co zawiera punkt, który jest medianą. Możemy dodatkowo udoskonalić oszacowanie punktu środkowego za pomocą formuły, w oparciu o założenie, że punkty danych punktu środkowego są równomiernie rozmieszczone.


Instrukcje

Nauka obliczania mediany grupy danych jest prostym zadaniem (Hemera Technologies / AbleStock.com / Getty Images)
  1. Grupuj wartości w odstępach, jeśli jeszcze nie są. Określ, który przedział powinien zawierać punkt środkowy.

    W celach dydaktycznych rozważ zestaw danych (1,2,4,5,6,7,7,7,9). Mediana jest tutaj 6. Możesz pogrupować zestaw na szerokości równe na przykład 4. Ich rozkład częstotliwości może wówczas wynosić na przykład: 1-4: 3 5-8: 5 9-12: 1 W danych nie połączonych mediana jest wyraźnie w kategorii 5-8. Możesz nawet powiedzieć to bez oglądania oryginalnego zestawu danych.

  2. Oblicz różnicę w liczbie punktów danych powyżej średnicy i połowę całkowitej liczby punktów danych.

    Zgodnie z tym, co zostało wspomniane, wynosi to 9/2 - 3 = 1,5. To obliczenie szacuje, jak daleko od środkowego zakresu należy znaleźć medianę.


  3. Podziel przez liczbę punktów w środkowym zakresie.

    Kontynuując przykład, 1,5 / 5 = 0,3. Daje to stosunek tego, jak daleko jest środkowy zakres mediany.

  4. Pomnóż wartość otrzymaną powyżej przez szerokość środkowego zakresu.

    Kontynuując przykład, 0,3 x 4 = 1,2. To przekształca stosunek w zakresie na rzeczywisty przyrost danych.

  5. Dodaj powyższy wynik do wartości między średnim i dolnym zakresem.

    Ponieważ przecięcie między średnią a dolnym zakresem wynosi 4,5, otrzymujemy równanie 4.5 + 1.2 = 5.7, które może mieć zaokrąglony wynik do 6, prawidłową odpowiedź.

Jak

  • W rzeczywistości powyższe obliczenia są takie same jak we wzorze „L + (n / 2 - c) / fxw”, gdzie L jest liczbą między środkiem a następnym dolnym przedziałem, n oznacza całkowitą liczbę punktów danych, c to całkowita liczba punktów poniżej środka, f to liczba punktów danych w środkowym zakresie, a w to szerokość.