Interprétation du WAIS-IV aux extrêmes : gare aux disparités entre l’échelle globale et ses composantes
Sébastien Trinh, psychologue
Psychologue au CIUSSS de la Capitale-Nationale et en pratique privée, M. Trinh a développé une expertise au niveau du diagnostic de déficience intellectuelle et exerce également la psychothérapie des troubles de la personnalité.
L’un des usages pour lesquels les tests de rendement intellectuel sont les plus utiles est la caractérisation d’individus présentant des besoins particuliers, des individus qui, bien souvent, offriront des performances qui s’écartent considérablement de la moyenne, que ce soit positivement (ex. : la douance) ou en fonction de certaines difficultés globales ou spécifiques (déficience intellectuelle, troubles neurologiques, etc.).
Le clinicien qui œuvre auprès de ces individus aura le souci d’évaluer les outils psychométriques qu’il utilise, que ce soit sur le plan de la façon dont les normes correspondent à la population qu’il dessert ou en fonction des caractéristiques intrinsèques des épreuves psychométriques qu’il utilise (validité, fidélité, etc.) et qu’il a à sa disposition. Au Québec, les psychologues ont l’habitude des situations imparfaites, puisque plusieurs épreuves psychométriques ne disposent pas de normes québécoises ou même francophones. Les échanges d’information et d’observations entre professionnels apparaissent donc comme des moyens de mise à jour précieux dans ce contexte.
Nous présentons ici nos observations sur le comportement du WAIS-IV (normes canadiennes), par rapport à son prédécesseur, le WAIS-III, pour illustrer comment les disparités entre les composantes et l’échelle globale peuvent mener à une apparence d’incohérence, en particulier au niveau des extrêmes. L’explication et l’analyse de ces observations pourraient éviter certaines erreurs d’interprétation possibles.
Notre présentation s’intéresse plus particulièrement au cas du WAIS-IV, parce qu’il nous a été donné de constater que les effets de disparité entre l’échelle globale et ses composantes y étaient particulièrement importants et parce que notre pratique, comme évaluateur diagnosticien de la déficience intellectuelle chez une population adulte, nous a donné l’occasion de faire une analyse approfondie de cette épreuve psychométrique.
Le lecteur doit cependant être averti que bien qu’il ne sera question, par souci de concision, que de l’évaluation du rendement intellectuel à partir du WAIS-IV ou du WAIS-III, une bonne analyse diagnostique, particulièrement aux extrêmes, doit tenir compte de plusieurs autres facteurs, dont, dans le cas du diagnostic de déficience intellectuelle, le fonctionnement adaptatif et l’histoire développementale. Ces facteurs sont considérés comme des critères diagnostiques tout aussi importants, sinon plus, que le critère d’un rendement intellectuel déficitaire.
Par ailleurs, les conclusions que nous tirerons de notre présentation sont tout aussi valides pour des épreuves psychométriques d’évaluation du fonctionnement adaptatif ou pour toute autre épreuve psychométrique comportant plusieurs composantes ramenées en échelle globale.
L’échelle globale (EGQI) n’est pas une moyenne de ses composantes
On sait que les épreuves de type Wechsler, plus particulièrement le WAIS-IV, sont structurées de façon à fournir un score global (EGQI) et des scores à quatre composantes (indice de la compréhension verbale [ICV], indice de raisonnement perceptif [IRP], indice de mémoire de travail [IMT] et indice de vitesse de traitement [IVT]). L’échelle globale et ses composantes sont construites de façon à se distribuer selon une courbe normale dont la moyenne est de 100 et l’écart-type de 15.
On pourrait être porté à penser qu’étant donné que l’échelle globale (EGQI) et ses composantes ont une distribution similaire (moyenne de 100, écart-type de 15), une personne présentant, par exemple, un score de 76 aux quatre composantes aura aussi un score global (EGQI) de 76. Ce n’est cependant pas le cas, car l’échelle globale n’est pas qu’une simple moyenne de ses composantes. Dans ce cas précis, la moyenne des quatre composantes, au WAIS-IV, qui est de 76, correspond à un score global (EGQI) de 70. L’écart entre la moyenne entre les composantes (76) et l’échelle globale (70) est ce que nous appelons la disparité entre l’échelle globale et ses composantes. Dans l’exemple présenté, cette disparité est de six points.
Ce phénomène peut sembler surprenant.
Il s’explique par des disparités dans les intercorrélations plus ou moins fortes des items, des sous-tests et des composantes entre eux.
Lors du passage du WAIS-III au WAIS-IV, l’éditeur Pearson a fait le choix de faire administrer 10 sous-tests plutôt que 11 comme c’était le cas dans le WAIS-III (le sous-test Séquence lettres-chiffres devient optionnel) pour composer l’échelle globale. Il fait également des modifications pour accélérer le temps d’administration de l’épreuve, diminuant donc le nombre d’items à administrer dans certains sous-tests (élimination de certains items redondants, critère d’arrêt qui passe de trois items manqués à seulement deux).
De plus, l’éditeur modifie certains items, de façon à retenir davantage les items susceptibles d’être réussis par un plus grand nombre d’individus et qui ont la possibilité de discriminer les différents niveaux de performance; l’objectif étant d’obtenir le profil le plus signifiant possible à partir d’un nombre d’items aussi réduit que possible. Cela a peu d’impact pour les individus dont les performances se situent autour du 50e percentile; cependant, pour les individus dont les performances se rapprochent des extrêmes du test psychométrique, moins d’items permettent de discriminer les différents niveaux de rendement intellectuel et, de plus, les items sont plus hétérogènes, moins interreliés.
Conséquemment, la réussite de plusieurs items dans plusieurs composantes différentes implique un niveau de rendement intellectuel plus élevé que la simple réussite dans une seule composante, ce qui explique qu’à l’échelle globale la valeur, distribuée selon une moyenne de 100 et un écart-type de 15, sera plus élevée que la valeur correspondante des composantes. À l’inverse, l’échec d’items dans plusieurs composantes différentes signale un niveau de difficultés cognitives plus élevé, la valeur de l’échelle globale se situant alors à un niveau plus bas que la valeur correspondante des composantes.
Autrement dit, plus un individu est fort dans plusieurs disciplines différentes, plus son score global (EGQI) devrait être plus élevé que ses résultats dans les composantes, tandis que plus un individu est faible dans plusieurs disciplines différentes, plus son score global (EGQI) devrait être plus faible que ses résultats dans les composantes.
Le graphique 1 illustre le phénomène à la fois pour le WAIS-IV et le WAIS-III, ce qui permet de prendre la mesure des changements qu’a impliqués la mise à jour du WAIS-IV pour les populations situées aux extrêmes de la courbe normale. On y retrouve les écarts entre la valeur (représentée par une moyenne pondérée) des composantes et le score global (EGQI) correspondant aux résultats aux sous-tests qu’il faut atteindre pour les observer (en abscisse). Par exemple, pour obtenir un score global (EGQI) de 71 au WAIS-IV, il est nécessaire d’obtenir un score de 6 pour les 10 sous-tests et ce profil générera une valeur moyenne de 76,8 pour les quatre composantes, d’où la valeur rapportée de 5,8 points d’écart au WAIS-IV en comparaison avec la valeur de 2,8 au WAIS-III.
Graphique 1 - Écarts entre le EGQI et ses composantes (WAIS-IV et WAIS-III)
Source : Manuel canadien du WAIS-IV (2010) et Manuel canadien de cotation du WAIS-III (1997).
Le tableau 1 donne les équivalences en scores standards et en percentiles des résultats aux sous-tests pour le score global et les quatre composantes au WAIS-IV et au WAIS-III.
Tableau 1 - Équivalences en scores standards et en percentiles des résultats aux sous-tests pour l’échelle globale (EGQI) et ses composantes (WAIS-IV et WAIS-III)
Source : Manuel canadien du WAIS-IV (2010) et Manuel canadien de cotation du WAIS-III (1997).
Implications pour l’interprétation d’un profil psychométrique dans le cas particulier du diagnostic de déficience intellectuelle
Les données présentées dans le graphique 1 et dans le tableau 1 permettent de constater l’effet de cette disparité entre l’échelle globale et ses composantes. Il en découle, par exemple, qu’on ne devrait pas se surprendre d’un résultat de huit ou de neuf à un sous-test (donc entre le 20e et le 34e percentile) pour un profil à la limite d’un rendement intellectuel déficitaire. En effet, si un rendement intellectuel de 70 implique des scores aux composantes dont la valeur tourne autour de 76, on ne devrait pas se surprendre de retrouver des valeurs de 79 ou 80 à certaines composantes, tandis que d’autres composantes se retrouveront à des valeurs inférieures à 76, pour compenser. Or un score de 79 ou 80 à une composante implique des sous-tests (au nombre de deux ou trois pour le calcul de la composante) dont la moyenne est de sept ou huit points. La même logique, qui veut que normalement on devrait avoir certains scores aux sous-tests au-dessus et au-dessous de cette moyenne, nous conduit donc à accepter un score de neuf à un sous-test donné comme étant compatible avec un profil déficitaire.
L’utilisation régulière du WAIS-IV comme épreuve psychométrique d’un arsenal plus vaste d’outils diagnostiques pour l’évaluation d’un diagnostic de déficience intellectuelle montre d’ailleurs que la situation où un ou deux sous-tests se rapprochent de la moyenne est loin d’être inhabituelle.
On devrait donc éviter de donner une significativité trop grande à des résultats plus élevés à des sous-tests isolés et rappeler que le meilleur indicateur pour l’évaluation d’un rendement intellectuel déficitaire est, selon les lignes directrices généralement utilisées, l’échelle globale.
Bien qu’a priori certaines performances plus élevées à un ou deux sous-tests, ou à une composante, puissent sembler incompatibles avec un diagnostic de déficience intellectuelle, elles pourraient aussi ne traduire que l’insuffisance de l’épreuve psychométrique à bien discriminer le niveau de performance de l’individu ou être associées à un profil de performances hétérogènes chez un individu en réelle difficulté cognitive.
À défaut de prendre en considération les disparités entre l’échelle globale et ses composantes, le clinicien qui cherche à vérifier la présence ou l’absence des critères diagnostiques est alors à risque de mal interpréter son profil psychométrique et d’écarter la possibilité qu’un ou des critères diagnostiques soient atteints (faux négatif).
Rappelons que, bien que la disparité entre l’échelle globale et ses composantes soit plus importante pour le WAIS-IV, ce qui justifiait la rédaction de cet article, elle existe également pour les versions Weschler antérieures et pour d’autres épreuves psychométriques dont, par exemple, certaines mesures du fonctionnement adaptatif (ABAS-II, VINELAND-II). On serait alors avisé de vérifier le comportement de l’échelle globale et de ses composantes préalablement à l’analyse fine d’une épreuve psychométrique donnée.
Bibliographie
- Luckasson, R., Coulter, D. L., Polloway, E. A., Reiss, S., Schalock, R. L., Snell, M. E., et coll. (1992). Mental Retardation: Definition, Classification, and Systems of Supports (9e éd.). Washington, DC: American Association on Mental Retardation.
- McGrew, K. S. (1994). Clinical Interpretation of The Woodcock-Johnson Tests of Cognitive Ability – Revised. Allyn and Bacon.
- Sattler, J. M., et Ryan, J. J. (2009). Assessment With The WAIS-IV. San Diego : Jerome M. Sattler.
- Schalock, R. L., Borthwick-Duffy, S., Bradley, V. J., Buntinx, W. E. M., Coulter, D. L., Craig, E. M., Yeager, M. H. (2011). Déficience intellectuelle : définition, classification et systèmes de soutien (11e éd.; trad. sous la direction de D. Morin). Trois-Rivières, Québec : Consortium national de recherche sur l’intégration sociale (ouvrage original publié en 2010).
- Wechsler, D. (2010). Wechsler Adult Intelligence Scale (4e éd.). Toronto, Ontario : Pearson.
- Wechsler, D. (1997). Wechsler adult intelligence scale – Third Edition: Administration and scoring manual. San Antonio, TX : The Psychological Corporation.