Los diagramas de dispersión es una representación de variables en el plano cartesiano mediante datos cuantitativos.
¿Qué es un diagrama de dispersión y para qué es útil?
Un diagrama de dispersión es un tipo de representación gráfica en la cual se puede conocer la correlación que existe entre dos variables haciendo uso del plano cartesiano, para ello se asignan los valores o datos de las variables a los ejes (X, Y) y cada intersección entre ambas variables se representa un punto en la gráfica del plano.
Estos puntos en conjunto se visualizan como una nube de puntos, que representan el diagrama de dispersión.
¿Para qué es útil un diagrama de dispersión? Este diagrama de dispersión es de gran utilidad para poder determinar y representar la correlación que existe ente los datos de dos variables de estudio, tales como relaciones entre causa y efecto o relaciones entre causas.
Este tipo de diagrama es muy implementado en la estadística aplicada, como en la economía y también en el marketing, ya que ayuda a las empresas a comprender datos importantes del mercado, aunque su campo de aplicación puede ser muy variado.
Pasos para elaborar un diagrama de dispersión
Aunque elaborar un diagrama de dispersión es un proceso sencillo, debemos tener en cuenta los siguientes pasos:
- Definir la situación cuyos factores determinantes se desean representar en el diagrama.
- Recopilar los datos de dichos factores, los datos deben ser representativos de la situación, en el cual ambas variables deben de tener la misma cantidad de datos muéstrales.
- Identificar las variables, en el eje (Y) la variable dependiente, esta representa el factor cuyo comportamiento es influenciado por la otra variable, siendo esa otra la variable independiente que se representa en el eje (X).
- Representar en la gráfica los valores de cada variable y marcar con un punto la intersección de los datos del eje (Y) con los del eje (X).
- Análisis de los datos de dispersión representados en la gráfica para determinar la correlación existe.
La correlación lineal en el análisis de los diagramas de dispersión
Las correlaciones lineales en los diagramas de dispersión permiten interpretar la intensidad con la que ambas variables se relaciona entre sí, en este sentido una correlación puede ser:
- correlación positiva: representa que ambas variables tienen un comportamiento creciente, si una aumenta la otra también.
- Correlación negativa: en esta representación a medida que una variable aumenta, la otra disminuye.
Correlación nula: no hay correlación entre ambas variables.
No obstante, una correlación es ideal o perfecta a medida que las correlaciones entre ambas variables tienen un comportamiento igualmente proporcional, con un coeficiente de correlación igual a uno.
Si queremos determinar con exactitud el coeficiente de correlación, en Excel podemos agregar las fórmulas predeterminas “=COEF.DE.CORREL(…,..)” solo debes insertar la fórmula arrastras los datos de la primera variable, le ponemos una coma, arrastramos los datos de la segunda variable y listo.
1. Ejemplo de diagrama de dispersión
En este ejemplo, una empresa desea conocer la relación existente entre la cantidad de horas trabajadas con el número de productos defectuosos, para ello la empresa realizó un estudio durante 20 semanas, dicho seguimiento arrojo los siguientes datos:
Una vez identificado los datos necesarios procedemos a la representación gráfica, para ello es necesario identificar cuál de los factores representa la variable dependiente y cuál la independiente.
Podemos identificar que las horas laboradas son la variable independiente representada en el eje (X) y los productos defectuosos la dependiente que se refleja siempre en el eje (y).
Vemos los datos representados en la gráfica:
Tal como se visualiza en la gráfica, las relaciones entre los datos recolectados se reflejan con puntos azules dispersos, cada punto representa la relación de horas laboradas y los productos defectuosos presentados por semana.
Al agregarle a la gráfica una línea de tendencial podemos definir que en esta gráfica hay una correlación positiva, pues a medida que las horas de trabajo aumentan el porcentaje de productos defectuosos también aumenta.
Esa línea de tendencia representa un coeficiente de correlación de 0.91.
2. Ejemplo de diagrama de dispersión
En este caso se busca conocer si existe una relación entre el peso y la altura de 18 personas escogidas al azar en una determinada localidad, cabe destacar que mientras más datos recolectados, más representativa es la muestra de las condiciones de la población total; veamos los datos:
Observemos la representación en el diagrama de dispersión:
Como se observa en el diagrama, existe una correlación positiva intermedia, pues la altura, aunque si incide en el peso, su incidencia no es muy alta, cuyo coeficiente de correlación es de 0.59.
Para la elaboración del diagrama podemos usar como herramienta Microsoft Office Excel, solo nos dirigimos a la barra de herramientas de Excel e insertamos la gráfica de dispersión y le agregamos los datos necesarios.