Bioestadística
 

.


 
 
Parámetros de posición central.

Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas características de esta serie de datos, resumiendo características importantes de ella, como será su posible eje de simetria, las claves de su forma, etc...

Las medidas de posición son de dos tipos:

Medidas de posición central: informan sobre los valores medios de la serie de datos.

Medidas de posición no centrales: informan de como se distribuye el resto de los valores de la serie.

Medidas de posición central

Las principales medidas de posición central son las siguientes:

1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las más utilizadas:
a) Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:
Xm =
(X1 * n 1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * n n-1) + (Xn * nn)
---------------------------------------------------------------------------------------
n

b) Media geométrica: se eleva cada valor al número de veces que se ha repetido. Se multiplican todo estos resultados y al producto fiinal se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).
 

Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media geométrica.

La media geométrica se suele utilizar en series de datos como tipos de interés anuales, inflación, etc., donde el valor de cada año tiene un efecto multiplicativo sobre el de los años anteriores. En todo caso, la media aritmética es la medida de posición central más utilizada.

Lo más positivo de la media es que en su cálculo se utilizan todos los valores de la serie, por lo que no se pierde ninguna información.

Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmética como geométrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de la serie. Estos valores anómalos podrían condicionar en gran medida el valor de la media, perdiendo ésta representatividad.

2.- Mediana: es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).

No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).

3.- Moda: es el valor que más se repite en la muestra.

Ejemplo: vamos a utilizar la tabla de distribución de frecuencias con los datos de la estatura de los alumnos que vimos en el epigrafe anterior.
 

Variable
Frecuencias absolutas
Frecuencias relativas
(Valor)
Simple
Acumulada
Simple
Acumulada
x x x x x
1,20
1
1
3,3%
3,3%
1,21
4
5
13,3%
16,6%
1,22
4
9
13,3%
30,0%
1,23
2
11
6,6%
36,6%
1,24
1
12
3,3%
40,0%
1,25
2
14
6,6%
46,6%
1,26
3
17
10,0%
56,6%
1,27
3
20
10,0%
66,6%
1,28
4
24
13,3%
80,0%
1,29
3
27
10,0%
90,0%
1,30
3
30
10,0%
100,0%

Vamos a utilizar los valores de la tabla adjunta para calcular los valores de las distintas posiciones centrales:

1.- Media aritmética:
Xm =
(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3)
--------------------------------------------------------------------------------------------------
30

Luego:
Xm = 1,253

Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm.

2.- Media geométrica:
X = [ (1,20^ 1) * (1,21^4) * (1,22^ 4) * .....* (1,29^3)* (1,30^3) ] ^ (1/30)

Luego:
Xm = 1,253

En este ejemplo la media aritmética y la media geométrica coinciden, pero no tiene siempre por qué ser así; de hecho lo habitual será que no lo hagan.

3.- Mediana:

La mediana de esta muestra es 1,26 cm, ya que por debajo está el 50% de los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas acumuladas.

En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se situaría exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la división entre el 50% inferior y el 50% superior.

4.- Moda:

Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto la serie estudiada cuenta con 3 modas.

Medidas de posición no centrales

Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:

Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.

Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.

Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.

Ejemplo: Vamos a calcular los cuartiles de la serie de datos referidos a la estatura de un grupo de alumnos y alumnas ya visto. Los deciles y centiles se calculan de igual manera, aunque para observarlo mejor harían falta distribuciones con mayor número de datos.


Variable
Frecuencias absolutas
Frecuencias relativas
(Valor)
Simple
Acumulada
Simple
Acumulada
x x x x x
1,20
1
1
3,3%
3,3%
1,21
4
5
13,3%
16,6%
1,22
4
9
13,3%
30,0%
1,23
2
11
6,6%
36,6%
1,24
1
12
3,3%
40,0%
1,25
2
14
6,6%
46,6%
1,26
3
17
10,0%
56,6%
1,27
3
20
10,0%
66,6%
1,28
4
24
13,3%
80,0%
1,29
3
27
10,0%
90,0%
1,30
3
30
10,0%
100,0%
1º cuartil: es el valor 1,22 cm, ya que por debajo suya se situa el 25% de los datos (tal como se puede ver en la columna de la frecuencia relativa acumulada). Tambien se denomina a este valor percentil 25.

2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se situa otro 25% de la frecuencia. Este valor coincide con la mediana de la serie y con el denominado percentil 50.

3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º cuartil se sitúa otro 25% de los datos. Además, por encima suya queda el restante 25% del total de los datos analizados. Este último cuartil coincide con el percentil 75.

Atención: cuando un cuartil recae en un valor que se ha repetido más de una vez (como ocurre en este ejemplo en el tercer cuartil) la medida de posición no central sería realmente una de las repeticiones.
 

Programa para calcular la media y la mediana de una serie.

    En este ejemplo podrá ver como se dimensionan matrices para recibir un numero determinado de datos, como se piden estos de forma secuencial, como se coloca la propia tabla de datos por orden de menor a mayor, y finalmente como se calculan los parámetros centrales de forma previa a mostrarlos en la pantalla del ordenador.


 
'Borra la pantalla y muestra el título centrado.
CLS
titulo$ = "Cálculo de la media y la mediana de una serie de datos"
LOCATE 2, 1
PRINT SPACE$((80 - LEN(titulo$)) / 2); titulo$

'Solocita en número de elementos de la serie.
LOCATE 5, 13
INPUT "Indique el número máximo de elementos de la serie : ", nmax
DIM d(nmax + 1)

'Solicita los datos de la serie de forma secuencial.
FOR i = 1 TO nmax
    LOCATE 7, 30
    PRINT SPACE$(40)
    LOCATE 7, 30
    PRINT "Dato nº "; i;
    INPUT " = ", d(i)
NEXT

'Ordena la serie de menor a mayor.
FOR i = 1 TO nmax - 1
    FOR j = i + 1 TO nmax
        IF d(i) > d(j) THEN
           m = d(i)
           d(i) = d(j)
           d(j) = m
        END IF
    NEXT
NEXT

'Muestra la serie ordenada. Anular una vez comprobado que funciona.
PRINT
PRINT "Serie ordenada : ";
FOR i = 1 TO nmax
    PRINT d(i); " ";
NEXT
PRINT

'Obtiene las sumas de datos necesaria para los cálculos posteriores.
sum = 0
FOR i = 1 TO nmax
    sum = sum + d(i)
NEXT

'Calcula la media aritmética.
media = sum / nmax

'Calcula la mediana como valor central de la serie ordenada  si
'   la serie posee un número impar de datos, y como la media de
'   los 2 centrales si es par.
m = (nmax + 1) / 2
IF m = INT(m) THEN
   mediana = d(m)
ELSE
   m = INT(m)
   mediana = (d(m) + d(m + 1)) / 2
END IF

'Muestra los resultados finales en la pantalla, en posiciones preestablecidas.
LOCATE 12, 20
PRINT "Media aritmética .. = "; media
LOCATE 14, 20
PRINT "Mediana ... (p 50%) = "; mediana
 


 
Temario.

Buscadores.
 
    Enlace hacia algunos de los "Robots genéricos de búsqueda" mas usados en Internet, desde los que podrá realizar búsquedas selectivas de temas relacionados con la "estadística" en general y la "Bioestadística" en particular:



Ultima modificación: 15-V-2003.