Estudiar lo intangible

por Laura Castro-Schilo, desarrolladora sénior en estadística de investigación en JMP

El poder de las decisiones basadas en datos es evidente a medida que más empresas incorporan sofisticados análisis estadísticos para orientar su toma de decisiones. La utilidad y beneficio que resultan de estas decisiones depende directamente de la calidad de las herramientas estadísticas con las que se cuenten. ¿Cómo de adecuadas y de sofisticadas son las suyas? Le invito a añadir una potente técnica estadística a su colección: el modelado de ecuaciones estructurales (SEM por sus siglas en inglés). Quizá no sea la herramienta perfecta para usted pero, si lo es, seguro que se alegra de conocerla.

El SEM es un marco de trabajo que reúne el análisis factorial y de regresión para facilitar el modelado de relaciones entre variables observadas y no observadas. Este marco se apoya en el análisis de la estructura de medias y covarianzas de los datos, permitiendo especificar relaciones complejas y multivariante. El SEM permite a los analistas considerar el error de medida, determinar cadenas de causa hipotéticas para identificar los mecanismos que dan lugar a los resultados, y tener en cuenta los datos faltantes con algoritmos de vanguardia. Estas funciones clave generan estimaciones más precisas de efectos que pueden apoyar la toma de decisiones en las empresas. Junto al SEM a menudo encontramos diagramas causales que, si se trazan correctamente, representan con precisión los modelos estadísticos subyacentes. De este modo, estos diagramas causales pueden facilitar la especificación e interpretación del SEM. 

El SEM es un marco de trabajo que reúne el análisis factorial y de regresión para facilitar el modelado de relaciones entre variables observadas y no observadas.

Varias técnicas estadísticas se ven incorporadas al marco del SEM, como las pruebas t, ANOVA, ANCOVA, MANOVA, regresión múltiple, análisis factorial, análisis causal y modelo de error de medida, entre otras. Lo que hace especial al SEM es su flexibilidad a la hora de especificar este u otros modelos y aplicar restricciones más laxas o estrictas en función de las nociones teóricas. Por ejemplo, podríamos ajustar, de manera simultánea, dos modelos ANOVA de medidas repetidas a dos procesos a lo largo del tiempo, facilitando la exploración de las dinámicas de dichos procesos según evolucionan, y relajando las asunciones estrictas propias del modelo ANOVA de medidas repetidas estándar. 

El SEM sobre variables no observadas o latentes es especialmente útil en campos que buscan estudiar conceptos intangibles; la psicología y la educación aplican el SEM de forma generalizada al estudiar la personalidad, la actitud, los logros, la cognición y otros muchos constructos latentes. Sin embargo, las variables latentes no se dan solo en estos campos; el marketing, la administración y los negocios, por ejemplo, pueden hallar valor en comprender la percepción, la satisfacción, la innovación o el rendimiento, mientras que la ingeniería y fabricación pueden aprovechar modelos sobre la calidad, la energía y otros valores no observables en los procesos industriales. 

Con la ventaja que suponen estas funciones, ¿cómo es que el SEM no es una herramienta más extendida? Mi hipótesis es que hay tres factores subyacentes:

Accesibilidad. El SEM es una técnica que se enseña sobre todo en grados de ciencias sociales, por lo que no es común encontrar el método o sus detalles técnicos en el currículum clásico de estadística o bioestadística.

Facilidad de uso. Los principales paquetes de software de SEM se han desarrollado desde siempre para académicos que comprenden muy bien la técnica pero no atienden mucho a la usabilidad. Además, una gran flexibilidad a veces acarrea una gran complejidad; cuando los analistas intentan resolver problemas grandes mediante SEM, los modelos complejos de más tienden a generar errores de especificación y, en última instancia, de estimación.

Experiencia en el campo. El conocimiento de los analistas les permite establecer modelos que se ajustan a la teoría y a su conocimiento previo. En muchas aplicaciones, no es tan importante comprender cómo o por qué predicen resultados ciertos factores. En estos casos, los modelos sin supervisión, basados exclusivamente en datos, son una opción más adecuada que el SEM.

Por suerte, la accesibilidad y la facilidad de uso ya no tienen que ser obstáculos para emplear SEM. JMP Pro ha incorporado recientemente una plataforma de SEM a su amplio abanico de métodos estadísticos, lo que supone que los analistas pueden encontrar abundantes recursos para aprender a aplicar SEM para orientar decisiones que mejoren sus empresas. La plataforma de SEM de JMP Pro hereda todas las funciones interactivas y dinámicas propias de JMP, además de poner la facilidad de uso como prioridad del desarrollo, con comprobación continuada de errores para avisar al usuario de problemas potenciales antes de que lleguen a la estimación. Nunca ha sido tan fácil incorporar el SEM a sus herramientas estadísticas. Esta sofisticada técnica puede ser la herramienta que lleve a su empresa a tomar mejores decisiones basadas en datos.


Acerca del autor

Laura Castro-Schilo trabaja en modelos de ecuaciones estructurales en JMP. Le interesa el análisis multivariante y su aplicación a distintos tipos de datos: continuos, discretos, ordinales, nominales, incluso de texto. Anteriormente fue profesora asistente en el Laboratorio psicométrico L. L. Thurstone en la Universidad de Carolina del Norte en Chapel Hill. Castro-Schilo tiene un doctorado en psicología cuantitativa de la Universidad de California, Davis.

Prólogo de JMP


¡Sigamos en contacto!

Pueden ponerse en contacto conmigo por correo electrónico para informarme sobre noticias, eventos y ofertas de JMP. Entiendo que puedo retirar mi consentimiento en cualquier momento.

*
*

JMP es una división de SAS Institute Inc. Sus datos personales serán tratados de acuerdo con la Declaración de Privacidad de SAS.