Bioestadística
 

.


 
 
Frecuencias.

    La distribución de frecuencia es la representación estructurada, en forma de tabla, de toda la información que se ha recogido sobre la variable que se estudia en la muestra o población originales.

Variable
Frecuencias absolutas
Frecuencias relativas
(Valor)
Simple
Acumulada
Simple
Acumulada
x x x x x
X1
n1
n1
f1 = n1 / n
f1
X2
n2
n1 + n2
f2 = n2 / n
f1 + f2
...
...
...
...
...
Xn-1
nn-1
n1 + n2 +..+ nn-1
fn-1 = nn-1 / n
f1 + f2 +..+ fn-1
Xn
nn
S n
fn = nn / n
S f
Siendo los distintos valores que puede tomar la variable. 
Siendo n  el número de veces que se repite cada valor. 
Siendo  f  el porcentaje que la repetición de cada valor supone sobre el total. 

Veamos un ejemplo :

    Medimos la altura de los niños de una clase con instrumental de precisión y en condiciones adecuadas, escogiendo a todos sus componentes, 30 sujetos, y obtenemos los siguientes resultados (m):
 


Alumno
Estatura
Alumno
Estatura
Alumno
Estatura
x
x
x
x
x
x
Alumno 1
1,25
Alumno 11
1,23
Alumno 21
1,21
Alumno 2
1,28
Alumno 12
1,26
Alumno 22
1,29
Alumno 3
1,27
Alumno 13
1,30
Alumno 23
1,26
Alumno 4
1,21
Alumno 14
1,21
Alumno 24
1,22
Alumno 5
1,22
Alumno 15
1,28
Alumno 25
1,28
Alumno 6
1,29
Alumno 16
1,30
Alumno 26
1,27
Alumno 7
1,30
Alumno 17
1,22
Alumno 27
1,26
Alumno 8
1,24
Alumno 18
1,25
Alumno 28
1,23
Alumno 9
1,27
Alumno 19
1,20
Alumno 29
1,22
Alumno 10
1,29
Alumno 20
1,28
Alumno 30
1,21

    Puesto que todas las talla están comprendidas entre 1,20 y 1,30 m podemos agruparlas por centímetros formando 11 grupos, indicando cuantos niños presentan cada uno de los valores. Si presentamos esta información estructurada (agrupada) obtendríamos la siguiente tabla de frecuencia:
 


Variable
Frecuencias absolutas
Frecuencias relativas
(Valor)
Simple
Acumulada
Simple
Acumulada
x x x x x
1,20
1
1
3,3%
3,3%
1,21
4
5
13,3%
16,6%
1,22
4
9
13,3%
30,0%
1,23
2
11
6,6%
36,6%
1,24
1
12
3,3%
40,0%
1,25
2
14
6,6%
46,6%
1,26
3
17
10,0%
56,6%
1,27
3
20
10,0%
66,6%
1,28
4
24
13,3%
80,0%
1,29
3
27
10,0%
90,0%
1,30
3
30
10,0%
100,0%

    Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos mayores, ya que de otra manera obtendríamos una tabla de frecuencia muy extensa que aportaría muy poco valor a efectos de síntesis.

    Supongamos que ahora medimos la estatura de los habitantes de una vivienda (tambien 30 personas) y obtenemos los siguientes resultados (m):
 


Habitante
Estatura
Habitante
Estatura
Habitante
Estatura
x
x
x
x
x
x
Habitante 1
1,15
Habitante 11
1,53
Habitante 21
1,21
Habitante 2
1,48
Habitante 12
1,16
Habitante 22
1,59
Habitante 3
1,57
Habitante 13
1,60
Habitante 23
1,86
Habitante 4
1,71
Habitante 14
1,81
Habitante 24
1,52
Habitante 5
1,92
Habitante 15
1,98
Habitante 25
1,48
Habitante 6
1,39
Habitante 16
1,20
Habitante 26
1,37
Habitante 7
1,40
Habitante 17
1,42
Habitante 27
1,16
Habitante 8
1,64
Habitante 18
1,45
Habitante 28
1,73
Habitante 9
1,77
Habitante 19
1,20
Habitante 29
1,62
Habitante 10
1,49
Habitante 20
1,98
Habitante 30
1,01

    Los datos son menos homogéneos (mas dispersos) que en el caso de los niños de un grupo escolar (todos de la misma edad) y si presentáramos esta información en una tabla de frecuencia  una tabla obtendríamos 30 líneas (una para cada valor), cada uno de ellos con una frecuencia absoluta de 1 y con una frecuencia relativa del 3,3%. Esta tabla nos aportaría toda la  información inicial, pero sería muy difícil de manejar si en vez de 30 personas fueran 300, 3000 o más: en definitiva, de escaso valor práctico.

    En lugar de ello, podríamos agrupar los datos por intervalos, con lo que la información queda más resumida (se pierde, por tanto, algo de información), pero es más manejable e informativa:
 


Estatura
Frecuencias absolutas
Frecuencias relativas
Cm
Simple
Acumulada
Simple
Acumulada
x
x
x
x
x
1,01 - 1,10
1
1
3,3%
3,3%
1,11 - 1,20
3
4
10,0%
13,3%
1,21 - 1,30
3
7
10,0%
23,3%
1,31 - 1,40
2
9
6,6%
30,0%
1,41 - 1,50
6
15
20,0%
50,0%
1,51 - 1,60
4
19
13,3%
63,3%
1,61 - 1,70
3
22
10,0%
73,3%
1,71 - 1,80
3
25
10,0%
83,3%
1,81 - 1,90
2
27
6,6%
90,0%
1,91 - 2,00
3
30
10,0%
100,0%

    El número de tramos en los que se agrupa la información es una decisión que debe tomar el especialista: la regla es que mientras más tramos se utilicen menos información se pierde, pero eso lleva consigo que la tabla sea menos representativa e informativa de la situación que estamos analizando.


Temario.

Buscadores.
 
    Enlace hacia algunos de los "Robots genéricos de búsqueda" mas usados en Internet, desde los que podrá realizar búsquedas selectivas de temas relacionados con la "estadística" en general y la "Bioestadística" en particular:


Ultima modificación: 15-V-2003.