| |
P. BLANCHEMAISON
113, avenue Victor Hugo, 75116 PARIS.
Les premières échelles de mesure de qualité de vie sont apparues il y a une quinzaine d'années, dans le cadre des maladies chroniques. L'objectif était d'apprécier les changements du niveau de bien-être au cours de l'évolution de la maladie, ou bien la différence d'évolution de la qualité de vie entre deux groupes de traitement.
Dans le cadre de l'insuffisance veineuse des membres inférieurs, les quatre dimensions à évaluer sont l'inconfort, l'aspect clinique, l'aspect psychologique, et l'aspect social. Une échelle de qualité de vie doit être validée en deux étapes, l'une qualitative, l'autre quantitative.
La prise en compte de ces quatre dimensions a conduit au développement des échelles de mesure psycho-sociales, et à une méthodologie de construction et d'analyse appelée psychométrie. Des techniques statistiques spécifiques sont utilisées afin de tester les versions successives des différents questionnaires.
Une échelle peut être définie comme la réunion d'un ensemble de propositions dans un domaine particulier ; chaque proposition étant ensuite notée afin qu'un score global puisse être défini. Il existe deux grands types d'échelle [1] :
Un questionnaire est rempli par les patients eux-mêmes après explication. Ces échelles d'auto-évaluation présentent plusieurs avantages : elles ne nécessitent pas la présence d'un évaluateur qualifié, une utilisation répétée est possible chez un même patient, ce qui évite les distorsions liées à un intermédiaire.
Les inconvénients sont liés à la coopération du patient, comprenant et lisant parfaitement la langue. En cas de mauvaise interprétation, aucune rectification n'est possible.
Des erreurs ou des fausses évaluations peuvent provenir d'un désir de masquer la réalité, d'une tendance à répondre de façon évasive, ou exagérée.
Dans ce cas, l'évaluateur, le plus souvent un médecin, remplit le questionnaire. Sa formation préalable à ce type de questionnaire est extrêmement importante. Il ne doit en aucun cas induire la réponse. Cette formation doit faire prendre conscience de la tendance à la correction spontanée, qui représente le principal inconvénient de ce type d'échelle.
Si le questionnaire nécessite l'intervention de plusieurs évaluateurs, il faut tester au préalable le rapport afin de standardiser et de valider l'information recueillie : c'est le coefficient KAPPA de concordance, mesurant la variabilité interjuge.
Ces deux types d'échelle d'évaluation permettent d'obtenir des informations uniformes quel que soit le patient, ce qui n'est pas réalisable lors de simples interviews.
Trois types de réponse à une question peuvent être envisagés [2] :
1° Une réponse dichotomique (oui-non) à laquelle on peut associer la notion de doute (oui-non-peut-être).
2° Une réponse ordinale à plusieurs degrés.
Ce sont les adverbes de fréquence ou d'intensité qui sont utilisés, et que l'on va chiffrer. Ce chiffre représente un poids accordé à chaque réponse. Chaque niveau est supposé représenter des intensités également espacées et doit être exclusif des autres. Par exemple : durant ces quatre dernières semaines, avez-vous ressenti des douleurs de jambe pendant votre travail ou lors de tâches habituelles à la maison ?
1° presque jamais ;
2° de temps en temps ;
3° quelquefois ;
4° fréquemment ;
5° presque toujours.
Il faut réfléchir sur l'équivalence des écarts entre par exemple : « de temps en temps, quelquefois, et fréquemment ». Peut-on raisonnablement admettre que « de temps en temps » soit le symétrique de « fréquemment » par rapport à « quelquefois » ?
L'importance de ce choix est dictée par le traitement futur des données.
Une question est dite unipolaire lorsque l'une des graduations extrêmes représente l'état normal et bipolaire lorsque l'état normal se situe entre les deux extrêmes. Le nombre de degrés doit être choisi avec soin, en tenant compte de l'embarras créé par des nuances trop subtiles si les réponses possibles sont trop nombreuses. Et à l'inverse, de l'absence de nuances, de pouvoir discriminant, en cas de réponse en trop petit nombre.
L'introduction de graduations volontairement excessives (aux deux pôles pour une question bipolaire, comme jamais et toujours) permet de corriger la réticence fréquente à utiliser des graduations extrêmes.
Le choix d'un nombre pair de degrés force le malade à prendre position et permet ainsi d'éviter la tendance centrale (tendance à attribuer aux questions une note moyenne). Une autre solution est de proposer deux types de question pour chaque proposition : la première question renseigne sur l'importance que lui attribue le patient, la seconde question permet de mesurer l'impact réel sur sa vie quotidienne.
Par exemple, R. Launois propose [3] :
Question A : au cours des quatre dernières semaines, quel degré d'inconfort avez-vous ressenti à cause de vos jambes dans votre travail ou à la maison ?
Question B : quelle importance accordez-vous à cet inconfort dans votre vie ?
Dans ces échelles, la question est remplacée par une ligne d'un seul tenant, généralement d'une dizaine de centimètres. A ses deux extrémités, on inscrit deux notions opposées (par exemple : aucun gonflement-gonflement extrême).
Le sujet doit se situer entre ces deux extrêmes en traçant un trait coupant la ligne.
Le plus souvent le score de l'échelle est calculé par simple somme des notes attribuées à chaque question. Ce procédé est le plus efficace.
Il est également possible d'effectuer le calcul d'une combinaison linéaire des questions utilisant des pondérations obtenues après une analyse factorielle en composantes principales. Cette solution nécessite une discussion sur la pertinence du choix des pondérations.
Elles comportent deux étapes, qualitative et quantitative.
L'étape qualitative consiste en une analyse sémantique du vocabulaire employé par les patients, afin d'identifier les énoncés les plus fréquents et les plus facilement compréhensibles. Il faut ensuite sélectionner un groupe de questions à partir d'une banque adaptée à la symptomatologie étudiée. Ces questions doivent être clairement compréhensibles et nettement distinctes les unes des autres. Elles doivent également être sensibles à l'amélioration ou à l'aggravation de la qualité de vie mesurée. Elles doivent se rapporter à un symptôme fréquent de la maladie, les signes rares ne pouvant représenter un degré de variabilité suffisant pour figurer dans une échelle destinée à apprécier l'impact de la maladie sur la qualité de la vie des patients [4].
Par exemple, dans le cadre de l'insuffisance veineuse des membres inférieurs, les quatre dimensions à évaluer peuvent comporter les notions suivantes :
L'intensité de la douleur des membres inférieurs peut être appréciée lors des stations debout prolongées, travaux ménagers, repassage, lors de positions particulières telles la position agenouillée ou assise prolongée, la gêne lors de la marche rapide ou de la montée d'escalier.
L'étape quantitative comprend l'étude de la validité de l'échelle, de sa sensibilité et de sa spécificité.
On peut définir la validité comme l'aptitude de l'échelle à mesurer ce qu'elle est supposée mesurer. Selon les auteurs, différents types de validité ont été définis [5, 6].
La validité de contenu, qui doit juger si l'on répond correctement au problème posé nécessite l'analyse de corrélation avec un critère externe (Gold-Standard, Étalon, Autre échelle déjà validée). Mais la possibilité de disposer d'une référence absolue a amené à rechercher et à développer d'autres types de validité.
La validité perçue par les sujets prend en compte, à l'aide d'un échantillon pilote représentatif de la population, le degré d'acceptabilité et de compréhension de questions par les patients.
La validité de structure concerne le jugement théorique des experts sur la structure de l'échelle.
La validité de concordance étudie les liaisons de l'échelle avec d'autres variables explicatives. Elle évalue la correspondance du résultat avec un diagnostic clinique. Par exemple l'échelle GHQ possède un item : « vous êtes-vous réveillé plusieurs fois par nuit durant les trois derniers mois et avez-vous eu du mal à vous rendormir ? », qui lorsque la réponse est positive chez les hommes anglo-saxons entre 40 et 60 ans est concordante avec un diagnostic de dépression clinique.
La validité de prédiction recherche des liaisons entre l'échelle et les variables pronostiques de l'affection étudiée.
Par exemple, la même échelle GHQ dans la même population possède un item : « avez-vous pleuré plusieurs fois par jour durant les trois derniers mois ? », qui s'est révélé prédictif d'une tentative de suicide dans les six mois suivants.
Une échelle est sensible si elle donne des résultats nettement différents d'un individu à l'autre selon ses caractéristiques psychopathologiques. C'est-à-dire que si le vécu de la pathologie d'un individu est très différent de celui d'un autre en présence du même signe clinique, leur score sur une échelle de qualité de vie devrait être très différent.
Une échelle est spécifique si elle ne prend en compte que le phénomène qu'elle doit mesurer. Bien que l'on s'attende à une corrélation positive entre la qualité de vie et l'état clinique, cette corrélation ne doit pas être très élevée parce que les deux mesures évaluent des phénomènes complètement différents.
La fiabilité d'une échelle est mesurée par sa capacité à donner des résultats comparables dans des situations comparables.
Cette fiabilité peut être appréciée soit par le coefficient de corrélation test-retest, chez un même sujet à deux moments différents, dans la mesure ou son état est stable ; soit par le coefficient KAPPA de concordance chez le même sujet, au cours du même test et par deux observateurs différents ; soit enfin par la cohérence interne à l'échelle qui reflète l'homogénéité interne entre les questions et leur appartenance à un même domaine quand le sujet n'est sondé qu'une seule fois.
Plusieurs indicateurs
de fiabilité ont été développés, le plus
connu et le plus utilisé étant le coefficient Alpha et Crombach
[2].
Construire une échelle d'évaluation de la qualité de vie est un travail long et fastidieux. Pour cette raison, beaucoup sont tentés par la traduction d'une échelle préexistante dans une autre langue le plus souvent d'origine anglo-saxonne. Ce travail peut durer jusqu'à deux ans et permettre de disposer de standards reconnus au niveau international.
Cependant, lorsqu'une échelle a été conçue et utilisée dans un pays étranger, se pose le problème de son adaptation à une culture différente.
L'adaptation en langue française
d'une échelle nécessite donc tout d'abord un travail qualitatif
de traduction et d'adaptation très soigné avant l'étape
classique de validation de la nouvelle échelle sur un échantillon
de sujets de langue française.