El cálculo de la suma de los productos y la ubicación de los datos puntuales en nuestro gráfico de dispersión están intrínsecamente relacionados.
Observe que en nuestros datos, la suma de los productos es positiva. Cuando la suma de los productos (el numerador de nuestra ecuación del coeficiente de correlación) es positiva, el coeficiente de correlación r resulta positivo, ya que el denominador (una raíz cuadrada) siempre es positivo. Sabemos que una correlación positiva significa que los incrementos de una variable están relacionados con incrementos en la otra (como en nuestro ejemplo de ventas de helado y temperatura) y, en un gráfico de dispersión, los datos puntuales se orientan en un ángulo hacia arriba de izquierda a derecha. Pero ¿cómo refleja esto la suma de los productos?
- La única manera de obtener un valor positivo en la suma de los productos es que los productos que estemos sumando tiendan a ser positivos.
- La única manera de obtener un valor positivo para cada uno de los productos es que ambos valores sean o bien negativos o positivos.
- La única manera de obtener un par de valores negativos es que ambos valores estén por debajo de sus medias (en el cuadrante inferior izquierdo del gráfico de dispersión) y la única manera de obtener un par de valores positivos es que ambos valores estén por encima de sus medias (en el cuadrante superior derecho del gráfico de dispersión).
Por lo tanto, la suma de los productos nos indica si los datos tienden a aparecer en el cuadrante inferior izquierdo y superior derecho del gráfico de dispersión (correlación positiva) o si, por el contrario, los datos tienden a aparecer en el cuadrante superior izquierdo e inferior derecho del gráfico (correlación negativa).