L'étude des concepts intangibles

par Laura Castro-Schilo, développeuse sénior en statistiques de recherche chez JMP

Alors qu'un nombre croissant d'entreprises ont recours aux analyses statistiques sophistiquées pour guider leur prise de décisions, le poids de ces dernières, lorsqu'elles sont basées sur des données, ne fait plus le moindre doute. L'utilité et le profit qui découle de ces décisions dépend directement de la qualité des outils statistiques à disposition. Dans quelle mesure vos outils sont-ils sophistiqués et adaptés à vos besoins ? Je vous invite à ajouter une technique statistique extrêmement efficace à votre collection : celles des modèles d'équation structurelle (SEM). Cet outil n'est pas forcément adapté à vos besoins, mais si c'est le cas, vous ne pourrez que vous réjouir de l'avoir découvert.

La méthode SEM est un cadre qui regroupe l'analyse de régression et l'analyse factorielle pour faciliter les relations de modélisation entre les variables observées et non observées. Ce cadre repose sur l'analyse de la covariance et de la structure moyenne des données, ce qui permet d'identifier des relations multivariées complexes. Les SEM permettent aux analystes d'expliquer les erreurs de mesure, de spécifier les chaînes causales hypothétiques afin d'identifier les mécanismes qui permettent d'obtenir des résultats, et de justifier les données manquantes à l'aide d'algorithmes de pointe. Ces fonctionnalités clés conduisent à des estimations plus précises des effets susceptibles de contribuer à la prise de décisions dans une organisation. Les diagramme de corrélation sont souvent liés aux SEM. Lorsqu'ils sont correctement esquissés, ils représentent les modèles statistiques sous-jacents avec une grande précision. Ainsi, les diagramme de corrélation peuvent faciliter la spécification et l'interprétation des modèles d'équation structurelle. 

La méthode SEM est un cadre qui regroupe l'analyse de régression et l'analyse factorielle pour faciliter les relations de modélisation entre les variables observées et non observées.

Le cadre SEM englobe plusieurs techniques statistiques, notamment les tests T, l'analyse de la variance (ANOVA), l'analyse de la covariance (ANCOVA), l'analyse de variance multivariée (MANOVA), la régression linéaire multiple, l'analyse factorielle, les diagramme de corrélation et les modèles d'erreur de mesure. Ce qui distingue la méthode SEM, c'est sa flexibilité vis-à-vis de la spécification de ceux-ci ou d'autres modèles, et le fait de pouvoir exclure ou imposer des contraintes en phase avec certaines notions théoriques. Par exemple, on pourrait ajuster (simultanément) deux modèles ANOVA à mesures répétées à deux processus se produisant au fil du temps, ce qui faciliterait l'observation de la dynamique de ces processus tandis qu'ils évoluent, tout en excluant les suppositions strictes du modèle ANOVA à mesures standard répétées. 

Les modèles d'équations structurelles à variables non observées, ou latentes, sont particulièrement utiles dans les domaines cherchant à étudier des concepts intangibles. Ainsi, les SEM sont largement utilisées en psychologie et dans l'enseignement, où de nombreuses structures latentes sont scrutées, comme la personnalité, les attitudes, la réussite ou encore la cognition. Toutefois, ces domaines n'ont pas le monopole des variables latentes. En effet, comprendre les perceptions, la satisfaction, l'innovation ou la performance est précieux en termes de marketing, de management et de commerce, tandis que les secteurs de la construction et de l'ingénierie peuvent bénéficier de la modélisation de la qualité, de l'énergie et d'autres facteurs non observables au cours de processus industriels. 

Au vu de ces caractéristiques clairement avantageuses, qu'est-ce qui explique que certains analystes se passent des SEM ? Trois facteurs permettent selon moi de répondre à cette question :

L'accessibilité. La technique SEM est avant tout enseignée dans les cursus universitaires spécialisés dans les sciences sociales, c'est pourquoi il est inhabituel pour un statisticien ou un biostatisticien ayant suivi une formation classique d'y être accoutumé ou d'en connaître les détails techniques.

Facilité d'utilisation. Les principales suites logicielles spécialisées dans les modèles d'équations structurelles sont depuis toujours développées par les académies, qui en maîtrisent la technique mais ne portent pas suffisamment d'attention à l'ergonomie. Par ailleurs, plus de flexibilité est parfois synonyme de plus de complexité. Alors que les analystes cherchent à relever des défis majeurs grâce aux SEM, des modèles trop complexes sont susceptibles d'entraîner des erreurs de spécification et, à terme, d'estimation.

Expertise sectorielle. Le savoir des analystes leur permet de spécifier des modèles en phase avec la théorie et les connaissances qu'ils ont déjà acquises. Dans de nombreuses situations, il importe peu de comprendre pourquoi ou comment certains facteurs prédisent un résultat. Dans ces cas précis, des modèles sans supervision, entièrement alimentés par les données, constituent un choix adapté, contrairement aux modèles d'équations structurelles.

Par chance, l'accessibilité et la facilité d'utilisation ne constituent plus un frein à l'utilisation des SEM. JMP Pro a récemment ajouté une plate-forme SEM à sa collection de méthodes statistiques déjà bien fournie. Ainsi, les analystes peuvent trouver de nombreuses ressources afin d'apprendre à utiliser les SEM pour guider des décisions à même d'optimiser leur entreprise. La plate-forme SEM dans JMP Pro hérite de toutes les fonctionnalités interactives et dynamiques qui font le succès de JMP. De plus, la convivialité est au cœur de son développement, avec un contrôle continu des erreurs pour alerter les utilisateurs de potentiels problèmes avant qu'ils ne surviennent lors de l'estimation. Il n'a jamais été aussi simple d'ajouter les SEM à votre kit d'outils statistiques. Cette technique sophistiquée est peut-être celle qui permettra à votre entreprise de prendre de meilleures décisions en se basant sur des données.


À propos de l'auteur

Laura Castro-Schilo travaille sur les modèles d'équations structurelles dans JMP. Elle s'intéresse à l'analyse multivariée et à son utilisation avec divers types de données (continues, discrètes, ordinales, nominales et même textuelles). Elle était auparavant professeure adjointe au laboratoire L. L. Thurstone Psychometric de l'université de Caroline du Nord à Chapel Hill. Laura est diplômée d'un doctorat en psychologie quantitative délivré par l'université de Californie à Davis.

JMP Foreword


Restons en contact !

J'autorise JMP à m'envoyer par e-mail des informations concernant les nouveautés, événements ou offres promotionnelles. Je peux retirer mon consentement à tout moment.

*
*

JMP est une division de SAS Institute Inc., vos informations seront utilisées en accord avec la politique de confidentialité de SAS.