|
Representación
gráfica de datos
Resumen
En
la vida diaria, necesitamos procesar información que
nos llega en forma de algunos o de muchos datos. Una forma efectiva
de usar de manera provechosa esa información es traduciendo
los datos recibidos en un modelo que, en forma gráfica,
resuma adecuadamente las relaciones que pueden estar ocultas en
ellos. Esta representación puede ser más o menos abstracta.
Desarrollo
del contenido
Para
representar gráficamente un conjunto de datos tenemos tantas
opciones que resulta necesario establecer algunos criterios orientadores.
Los principales son: a) Tipo de variable(s) involucrada(s), y
(b) Propósito del gráfico.
En
el primero de estos criterios podemos distinguir entre variables
discretas y variables continuas; la diferencia radica en que
para una variable discreta el conjunto de POSIBLES valores es numerable,
mientras para una variable continua ese es no numerable.
En
el criterio "propósito del gráfico" podemos distinguir
entre "mostrar la distribución de frecuencias de una variable"
y " mostrar la asociación entre dos variables".
Combinando
estos dos criterios tenemos cuatro situaciones o escenarios básicos:
- Mostrar
la distribución de frecuencias de UNA variable DISCRETA:
- Mostrar
la distribución de frecuencias de UNA variable CONTINUA:
- Mostrar
la asociación entre DOS variables DISCRETAS:
- Mostrar
la asociación entre DOS variables CONTINUAS:
Descripción
de los gráficos
Barras
separadas: En este tipo de gráfico, las barras son
de igual ancho (no importa), cada una corresponde a un valor de
la variable estudiada y su ALTURA representa (es proporcional!)
al número de veces que ese valor se ha observado en el estudio
(FRECUENCIA de ese valor).
Este
ejemplo muestra la distribución porcentual de los lectores
de un diario gratuito según: (a) nivel socioeconómico,
(b) sexo y (c) grupo de edad. Se destaca la presencia del nivel
socio-económico C3 y del grupo de edad 45 años o más,
mientras no se aprecia diferencia importante en términos
de sexo.
Perfil
Socio-Demográfico Lectores de La Hora: Nivel Socioeconómico,
Sexo, Edad (La Hora 27 de julio de 2000)



Gráfico
sectorial: En este gráfico, cada sector corresponde
a un valor de la variable estudiada, representando su AREA, el número
de veces que se ha observado ese valor en el estudio.
El
ejemplo muestra la distribución de alumnos chilenos según
nivel de educación, destacándose que 2/3 de la población
estudiantil corresponde a educación básica (regular
y especial)

Pictograma:
En este tipo de gráfico, el número de veces que ocurre
un valor de la variable estudiada es representado, APROXIMADAMENTE,
por uno o varios dibujos "simplificados" o "simpáticos".
El
ejemplo muestra la distribución de obras nuevas (1993) según
región de Chile. Claramente predomina la Región Metropolitana,
seguida por la V y la VIII regiones.

Histograma:
En este tipo de gráfico, los valores de la variable CUANTITATIVA
en estudio, son agrupados en intervalos (frecuentemente iguales);
el número de veces que se observan casos en uno de esos intervalos
es representado por el AREA de un rectángulo que tiene como
base ese intervalo.
El
ejemplo muestra la distribución de los puntajes obtenidos
en un test de personalidad por 158 estudiantes de psicología.
Se destacan los puntajes cercanos a 55 y a 61 como los más
frecuentes en este grupo.
Polígono
de frecuencias: Este tipo de gráfico se puede obtener
construyendo, en borrador, un histograma (de intervalos iguales,
uniendo los puntos medios de sus "techos" y borrando ese gráfico
inicial).

Barras
agrupadas: Este tipo de gráfico muestra si la forma
en que se distribuyen los valores de una variable DISCRETA depende
del valor de una segunda variable DISCRETA.
Este
gráfico muestra que el comportamiento del lector frente
al diario gratuito no varía con (no está asociado
a) el nivel socioeconómico.

Barras
subdivididas: Muestra, en forma porcentual, cómo
la distribución de valores de una variable DISCRETA está
controlada por el valor de una segunda variable DISCRETA. (ec7)
Este
gráfico y el siguiente muestran una asociación entre
sexo y droga lícita usada. Vemos que mientras entre los consumidores
de tranquilizantes son mayoría las mujeres(consumidoras),
en cuanto a tabaco hay "equilibrio" y en cuanto a alcohol hay mayoría
de hombres. (CONACE, 2000).
Gráficos
sectoriales: A través de dos o más gráficos
sectoriales se muestra como la distribución de frecuencia
de una variable DISCRETA depende del valor de una segunda variable
DISCRETA.

Diagrama
de dispersión: En este tipo de gráfico se
registra qué valores presentan dos variables CUANTITATIVAS
en cada individuo, representando esa información caso acaso.
La forma en que se concentran los puntos nos describe el tipo de
relación que existe entre esas variables. A diferencia de
los gráficos anteriores, las marcas en los ejes no se pueden
desordenar o perturbar.
El
ejemplo muestra la asociación entre una nota parcial (PEP3)
y la nota final (NF) de los 21 alumnos de un curso universitario.
Serie
cronológica: En este tipo de gráfico se registra
qué valores presentan dos variables CUANTITATIVAS caso acaso,
siendo (típicamente) una de ellas TIEMPO. Sirve para representar
la evolución de una característica cuantitativa observada
en una unidad de observación a través de instantes
sucesivos.
El
ejemplo muestra las variaciones del índice de actividad económica
entre septiembre 1999 y Junio 2000, destacándose la tendencia
ascendente con máximo en el mes de Mayo 2000. Hay asociación
con el tiempo.
Gráfico
de una función: En esta animación queremos
mostrar cómo una "nube" de puntos (x,y) puede ir derivando
en una línea (recta o no) que, posiblemente, representa gráficamente
a una relación funcional y=f(x) o, más en general,
a una relación g(x,y)=a.
Comentarios
metodológicos:
- Es
esencial que, además de elegir adecuadamente el tipo de
gráfico que se construirá (usando los criterios
de: tipo de variable(s) involucradas y propósito
del gráfico), formulemos frente al gráfico obtenido
un breve comentario que resuma lo más importante que estamos
VIENDO en él.
- Lamentablemente,
con frecuencia se utiliza una representación gráfica
de datos intencionadamente distorsionada para engañar al
público lector. Marcar como equidistantes en el eje de
abscisas fechas muy disímiles puede enmascarar totalmente
la forma en que un fenómeno se desarrolló en el
lapso estudiado; usar una escala de potencias de 10 en el eje
de ordenadas, sin llamar la atención del lector sobre esa
situación especial, puede mostrar como lineal un cambio
que es exponencial; usar colores muy llamativos para presentar
algunos valores puede engañar sutilmente al ojo lector.
El alumno debe aprender a descubrir y hacer notar ante sus compañeros
tales trampas, eso es parte de la alfabetización cuantitativa
a la que tiene derecho como ciudadano.
|