Palabras clave
INTRODUCCIÓN
La atención primaria de salud (APS) es el ámbito adecuado para el seguimiento de los pacientes con insuficiencia cardiaca crónica (ICC), por ser esta una afección muy prevalente que precisa controles frecuentes. Existen pocos estudios realizados en APS que aborden aspectos sobre calidad de vida relacionada con la salud (CVRS) de pacientes con ICC1-3, lo que dificulta la implementación de guías de práctica clínica en nuestro entorno.
La calidad de vida (CV) de los pacientes con ICC es más importante de lo que generalmente se supone4-6. En un estudio cualitativo, el 49% de los pacientes seleccionaban una terapia que mejorase la CV, incluso si el tratamiento acortase la supervivencia7.
Los profesionales de atención primaria (AP) necesitan un instrumento sencillo y fiable que mida e identifique las necesidades de intervención, tratamiento y CV de los pacientes con ICC.
Para medir la CVRS en ICC tenemos instrumentos genéricos y específicos; entre los primeros destaca el Short-Form Health Survey-36 (SF-36) por su uso frecuente8,9. La versión española10 tiene demostradas buenas reproducibilidad y validez. Los específicos miden aspectos de la salud que se afectan por este trastorno; se espera de ellos mayor sensibilidad a los cambios clínicos. Los más comunes son el Chronic Heart Failure Questionnaire, el Kansas City Cardiomyopathy Questionnaire y el Minnesota Living with Heart Failure Questionnaire (MLHFQ)11. El último es el más utilizado en estudios de CV en pacientes con ICC del ámbito hospitalario1,2. Sus propiedades psicométricas han sido descritas y muestra buenas fiabilidad y validez12,13.
El presente estudio tiene como objetivo evaluar la aplicabilidad, la consistencia interna y la validez del MLHFQ para medir la CV en enfermos con ICC en APS, comparándolo con el cuestionario SF-36.
MÉTODOS
Se trata de un estudio transversal. Para ser incluido, todo paciente debía tener un diagnóstico documentado de ICC en la historia clínica de APS, mediante informe de alta hospitalario, de un médico especialista, o un diagnóstico realizado por el médico de APS, basado en criterios clínicos de Framingham (dos mayores o uno mayor y dos menores) y pruebas complementarias como electrocardiograma, radiografía de tórax y ecocardiograma, con signos característicos de ICC, y ser atendido por un médico de APS de León al menos durante los últimos 6 meses. Se excluyó a los pacientes cuya insuficiencia cardiaca fuera atribuible a una causa reversible.
Diseño muestral
La muestra se diseñó para realizar un estudio más amplio (estudio LEONIC) en el Área de Salud de León, cuyo objetivo principal era estimar características epidemiológicas, clínicas y de CVRS de los pacientes con ICC.
Se invitó a participar a todos los médicos de los equipos de APS. Cada profesional elaboró un registro anónimo con todos los enfermos con diagnóstico documentado de ICC de su cupo, revisando todas las historias clínicas, tanto en papel como informatizadas; para localizar estas últimas se utilizaron rutinas de búsqueda como «insuficiencia cardiaca crónica» e «insuficiencia cardiaca congestiva». De este registro seleccionamos una muestra con afijación proporcional a los estratos urbano y rural, mediante muestreo aleatorio sistemático. El intervalo de muestreo está definido por la expresión: N/n, donde N = población censada con ICC y n es el tamaño de muestra prefijado.
Tamaño muestral
Se calculó para responder al objetivo del estudio LEONIC de estimar prevalencias de características clínicas en pacientes con ICC tanto del medio rural como del urbano, con una confianza del 95% y precisión general del 4%, y resultó un tamaño total de 630 pacientes.
El trabajo de campo se realizó de enero a abril de 2009. Cada paciente cumplimentó los cuestionarios SF-36 y MLHFQ antes de que su médico lo examinara; la enfermera prestó ayuda en la cumplimentación de los cuestionarios en caso de dificultades de comprensión. En la anamnesis se recogieron variables clínicas y de tratamiento, ingresos y urgencias hospitalarias. Se utilizó la escala de la New York Heart Association (NYHA) para determinar la capacidad funcional.
Instrumentos para medir la calidad de vida
El SF-36 es un cuestionario autoaplicable válido tanto para la población general como para pacientes con diversas enfermedades. Utilizamos la segunda versión española, que incluye 36 preguntas que miden ocho dimensiones de la salud: función física, rol físico, dolor corporal, salud general, vitalidad, función social, rol emocional y salud mental. Puede resumirse en dos componentes sumario, físico y mental. Los ítems de cada dimensión son codificados, agregados, sumados y transformados en una escala con recorrido desde 0 (peor estado de salud) hasta 100 (mejor estado de salud)14.
El MLHFQ fue desarrollado en Estados Unidos por Rector15 como herramienta específica para medir la CV de los enfermos con ICC y se validó para utilizarlo en distintos ámbitos culturales y para medir la respuesta al tratamiento médico16-20. Es autoaplicable, con respuesta tipo Likert, que van desde 0 (CV no afectada), a 5 (máxima afectación de la CV), de manera que a mayor puntuación peor calidad de vida. La tabla 1 recoge el número de ítems en cada dimensión y una breve descripción del significado de las puntuaciones.
Se pregunta el grado en que la enfermedad le impidió vivir como le hubiera gustado el último mes. Las preguntas hacen referencia a signos y síntomas de la enfermedad, relaciones sociales, actividad física, sexual, trabajo y emociones.
Análisis estadístico
Se calcularon los índices descriptivos en ambos cuestionarios. La aceptabilidad se valoró mediante el porcentaje de pacientes con algún ítem no respondido en cada dimensión. Se obtuvieron los efectos techo y suelo que expresan el porcentaje de pacientes con puntuaciones mejores y peores, respectivamente, de cada componente. La consistencia interna se estudió mediante el coeficiente alfa de Cronbach, que mide la homogeneidad entre los ítems de una determinada dimensión, aceptando como estándares mínimos coeficientes de 0,7 para realizar comparaciones entre grupos21.
Los tres aspectos del MLHFQ de la validez de constructo estudiados fueron la estructura, la convergencia y la divergencia. Para decidir sobre la pertinencia del análisis factorial, se estimó el estadístico de adecuación de Kaiser-Meyer-Oklin (aceptable con valores superiores a 0,5) y la prueba de esfericidad de Bartlett. Se evaluó la estructura mediante un análisis factorial exploratorio con rotación varimax, en el se esperaba que cada dimensión establecida (dimensiones física y emocional) se comportara como un factor distinto, donde los ítems alcancen cargas de saturación de 0,4 o mayores22.
La validez convergente y la divergente del MLHFQ se evaluaron construyendo las matrices de correlaciones multirrasgo-multimétodo de Pearson entre las dimensiones de MLHFQ y las del SF-36, para verificar si los componentes que miden aspectos similares en los dos cuestionarios se correlacionan más intensamente que las dimensiones que no están relacionadas conceptualmente. Para ello se formularon a priori las siguientes hipótesis: las correlaciones más altas se encontrarán entre el componente físico del MLHFQ y la función física, el rol físico y la vitalidad del SF-36, así como entre el componente emocional del MLHFQ y el rol emocional y la salud mental del SF-36. Se supuso que correlaciones ≥ 0,6 se corresponden con una asociación de elevada intensidad y hablarían a favor de una validez de constructo convergente. Por el contrario, para evaluar la validez de constructo divergente, planteamos la hipótesis de que las correlaciones serían bajas (≤ 0,4) entre la función física, el rol físico y la vitalidad del SF-36 y la dimensión emocional del MLHFQ y también serían bajas entre la dimensión física del MLHFQ y el rol emocional y la salud mental del SF-36.
Para examinar la capacidad de discriminación del cuestionario, se contrastaron las siguientes hipótesis: ser mujer, haber estado ingresado, haber acudido a urgencias del hospital, estar en clase funcional de la NYHA superior y tener síntomas de disnea o fatiga en el último mes suponen puntuaciones más altas en las dimensiones del MLHFQ y más bajas en los componentes sumarios del SF-36. Se calcularon los intervalos de confianza y el contraste estadístico se realizó con la prueba de la t de Student y ANOVA. Todos los análisis se realizaron con el SPSS v.14.0.
Cuestiones éticas
Este trabajo fue aprobado por el Comité de Ética del Hospital de León el 27 de enero de 2009. Los participantes fueron informados del objetivo y firmaron el consentimiento.
RESULTADOS
Participaron en el estudio 97 médicos (el 46,6%, del medio rural). Censaron a 2.047 (el 58% mujeres) pacientes con ICC, de más de 39 años. De los 630 pacientes seleccionados, se estudió en la consulta o el domicilio a 589 (93,6%); 11 habían fallecido y 30 no acudieron a la consulta o no fueron localizados. Se consiguieron 544 cuestionarios válidos del MLHFQ y 542 del SF-36. No contestaron a los cuestionarios 21 por sufrir demencia moderada o grave y 14 inmovilizados; Se desecharon 10 por incoherencia de los datos o por tener un número excesivo de ítems en blanco.
La tabla 2 muestra las características demográficas y clínicas y las puntuaciones sumario de CV de los pacientes estudiados y de las submuestras de pacientes, según quién realizara el diagnóstico. En 407 (74,8%) el diagnóstico procede del hospital o de un médico especialista; entre estas dos submuestras se encontraron algunas diferencias significativas. Los diagnosticados en APS tienen más edad y mayor proporción de mujeres y de etiología atribuida a hipertensión arterial. No hay diferencias significativas en los componentes sumarios del SF-36 ni en las dimensiones del MLHFQ.
Aceptabilidad
La distribución de las puntuaciones y de los coeficientes de consistencia interna de ambos cuestionarios se presentan en la tabla 3. El porcentaje de participantes con algún ítem no respondido fue pequeño, tanto en las dimensiones del MLHFQ como en las del SF-36; únicamente en la puntuación total del primero fue un poco más elevada, con un 12,5% de algún ítem no respondido, debido a los ítems 8 y 10, que miden las dificultades para ejercer la profesión y para la actividad sexual respectivamente, que no pertenecen a ninguna dimensión.
El porcentaje de pacientes que presentan la peor y la mejor puntuación posible, efecto suelo y techo respectivamente, fue escaso en el MLHFQ, excepto en la dimensión emocional, con efecto techo del 15,4%. El SF-36 presenta porcentajes altos de efecto suelo en rol físico y salud mental. En cuatro dimensiones presenta unos porcentajes de efecto techo superiores al 20%.
Consistencia interna
La homogeneidad de los ítems que conforman cada dimensión (tabla 3) muestra una consistencia interna alta en todas las dimensiones de ambos cuestionarios (α > 0,7), excepto la dimensión salud en general (α = 0,68) en el SF-36.
Validez de constructo
La adecuación de las matrices de correlaciones, evaluada con el índice de Kaiser-Meyer-Olkin, obtuvo un valor de 0,92. El test de esfericidad de Bartlett resultó significativo con un χ2 = 4.213 (p < 0,0001), lo que revela la presencia de correlaciones significativas y refuerza la pertinencia del análisis factorial. El análisis factorial exploratorio, con una rotación varimax a dos factores, explica una varianza del 65,8%. Los ocho ítems del factor 1 (del 2 al 7, 12 y 13), coincidentes con los de la dimensión física del modelo teórico, presentan cargas factoriales altas, superiores a 0,4; por el contrario, los pesos factoriales son bajos para el factor 2 (tabla 4). Lo mismo sucede con los ítems que van del 17 al 21, que muestran cargas factoriales altas en el factor 2 y bajas para el factor 1; estos resultados revelan dos dimensiones subyacentes del fenómeno CV. En el primer factor el ítem 1, con una saturación de 0,48, aumenta un 8,2% la varianza explicada; este ítem no pertenece a ninguna de las dimensiones del modelo del cuestionario original. Los demás ítems, que no pertenecen a ningún factor, no superan el 0,4 de carga factorial.
La tabla 5 refleja altas correlaciones entre dominios similares de ambos cuestionarios. Entre la dimensión física del MLHFQ y el componente sumario físico (CSF), la función física, el rol físico, el dolor corporal y la vitalidad del SF-36 (columna I), los coeficientes van de -0,43 a -0,73 (negativos por escalas de puntuación contrapuesta entre los dos cuestionarios) e indican validez convergente. Entre el componente emocional del MLHFQ con el rol emocional y la salud mental del SF-36, se obtienen coeficientes de correlaciones moderados, entre -0,5 y -0,55 (columna V). En cambio, las correlaciones entre medidas que reflejan distintos dominios, planteadas para verificar la validez discriminante (columnas II y IV), no fueron tan bajas como se esperaba, con valores entre -0,33 y -0,51, por lo que la validez divergente es inferior a la convergente.
Validez discriminante
La validez discriminante se estudió comparando las dimensiones del MLHFQ y los componentes sumarios del SF-36, con resultados clínicos, capaces de distinguir entre diferentes niveles de gravedad de la ICC (tabla 6). Las mujeres muestran valores de peor CV que los varones en ambos cuestionarios (p < 0,001). Hay un empeoramiento progresivo de la CV según aumenta la clase funcional de la NYHA, con puntuaciones medias en la dimensión física del MLHFQ que oscilan entre 6,3 en el grado I y 30,2 en el grado IV (p < 0,0001). Los pacientes habitualmente con disnea y/o fatiga tienen puntuaciones estadísticamente significativas (p < 0,0001) de peor CV respecto a los que no presentan síntomas habitualmente. Las puntuaciones medias de quienes ingresaron o acudieron a urgencias en el último año también reflejan peor CV que la de quienes no fueron ingresados.
DISCUSIÓN
Los resultados obtenidos señalan que el MLHFQ presenta adecuadas propiedades métricas en cuanto a aceptabilidad, consistencia interna y validez convergente. De los resultados del análisis factorial exploratorio, igual que en el modelo original, se extraen dos factores que explican un porcentaje importante de la varianza, lo que indica su valor para medir la CVRS de los pacientes con ICC controlados habitualmente por el médico de APS.
La mayoría de los estudios de medición de la CV de los pacientes con ICC realizados en nuestro país, con el MLHFQ o con un cuestionario genérico, seleccionaron a los pacientes a partir del ámbito hospitalario1,2,23-25.
La validación de un cuestionario es un proceso largo y complejo y requiere realizar varios estudios en poblaciones diferentes26. El MLHFQ, el más utilizado27, recientemente ha sido validado en pacientes elegidos durante su ingreso hospitalario13 y estudiados después durante 2 meses tras el alta. Mostró una aceptable sensibilidad al cambio y buenas fiabilidad y validez, pero estos resultados no pueden generalizarse a pacientes con ICC atendidos habitualmente en APS.
La proporción de pacientes que completaron el cuestionario, lograda con un mínimo apoyo de personal de enfermería, fue similar a la de otros estudios3,28,29. El porcentaje de quienes no respondieron a alguno de los ítems fue pequeño, lo cual refleja buena aceptabilidad del cuestionario. Los bajos porcentajes de los efectos techo y suelo del cuestionario MLHFQ, en comparación con el SF-36, y la utilización de toda la gama de puntuaciones pueden reflejar mejor adecuación de los contenidos del cuestionario específico a problemas relevantes de CV para este tipo de pacientes, así como la posibilidad de detectar mejoría o deterioro.
La consistencia interna es satisfactoria en todas las dimensiones, con coeficientes alfa de Cronbach cercanos o superiores a 0,7, valores recomendados para comparaciones de grupo, lo que respalda la estructura factorial que emerge de la escala21,30. Los coeficientes son similares a los de la versión original17 y los obtenidos por Garin et al13, comparables o mayores a los del SF-36; tales datos confirman la fiabilidad de la versión española del MLHFQ.
La validez convergente está respaldada por las altas correlaciones observadas entre dimensiones del MLHFQ y el SF-36 que miden conceptos similares, lo que proporciona un soporte adicional en los constructos subyacentes. Sin embargo, la validez divergente no se confirmó totalmente, ya que las correlaciones entre conceptos distintos no han sido tan bajas como se esperaba.
Las estrategias aplicadas para evaluar el constructo revelan que las puntuaciones de cada dimensión miden los conceptos adecuados. El análisis factorial extrae dos factores, configurando una estructura similar a la de la versión original17, aunque nuestros datos presentan una discrepancia, en el sentido que el ítem 1 («¿la insuficiencia cardiaca le ha provocado hinchazón de tobillos, piernas, etc.?») tiene un valor de saturación compatible con formar parte de esta dimensión física. La validación del constructo se considera que debe ser el primer paso cuando se presenta un instrumento nuevo o de escasa experiencia en un determinado medio. En un estudio realizado en una pequeña muestra de enfermos con ICC sometidos a cirugía valvular31, la validez del MLHFQ también confirma un buen ajuste de los ítems a las dimensiones física y emocional, con cargas factoriales superiores a las obtenidas en nuestro estudio, tal vez por tratarse de pacientes muy similares.
En relación con otras variables que miden distintos estadios de gravedad de la enfermedad, nuestros resultados son coherentes con las hipótesis establecidas a priori. Las puntuaciones del MLHFQ discriminan nítidamente entre los grados de clasificación de la NYHA, los que presentan síntomas de disnea y/o fatiga y quienes ingresaron o acudieron a urgencias hospitalarias en el último año. El MLHFQ parece tener, respecto del SF-36, una mejor capacidad de discriminación entre los que ingresan o acuden a urgencias hospitalarias y los que no. Estos resultados proporcionan datos favorables sobre validez de criterio y validez predictiva, lo que se refleja también en otros estudios31-33 efectuados en pacientes diferentes de los de APS. Parajón et al1 hallaron que aumentar la clase funcional de la NYHA y los ingresos hospitalarios durante el año previo se asocian con puntuaciones más altas en el MLHFQ, es decir, peor CV. Morcillo et al2 comunican también buena correlación del MLHFQ con la clase funcional y con el SF-36 en una pequeña muestra de pacientes con ICC avanzada.
Sobre las limitaciones de este trabajo, creemos oportuno hacer una comentario sobre el criterio de inclusión que define la población de estudio, la formada por todos los pacientes con ICC documentada en la historia clínica de APS. La ICC diagnosticada mediante criterios clínicos exclusivamente conlleva falsos positivos34. Este posible sesgo podría condicionar la validez externa, en el sentido de que nuestra población no represente fielmente a todos los enfermos. En nuestra muestra, el 75% se diagnosticó en atención especializada; de los diagnosticados en APS, una porción importante (29,2%), conocemos el valor de la ecografía. El tiempo medio transcurrido desde el diagnóstico supera los 3 años, lo que supone un conocimiento adecuado de la situación clínica del enfermo por el médico de APS; por todo esto, pensamos que la posibilidad de cometer sesgo de selección es poco probable; creemos que la muestra representa a los pacientes diagnosticados de ICC controlados por el médico de APS. Esto es su mayor atractivo, pues las características métricas del cuestionario en validación se ven reforzadas por la variedad de pacientes incluidos.
Otra limitación del estudio es que no aporta las propiedades métricas de reproducibilidad y sensibilidad al cambio del cuestionario debido al diseño metodológico; sería interesante evaluar esas propiedades en diferentes poblaciones y contextos para poder propugnar la generalización del uso de este cuestionario.
Queremos hacer una reflexión sobre la interpretabilidad, entendida como el grado en que es posible asignar un significado comprensible a las puntuaciones de un instrumento de CVRS35; la supuesta carencia de interpretabilidad de las medidas de CV que aporta el MLHFQ es consecuencia de su novedad o del escaso uso. Las puntuaciones del MLHFQ no están estandarizadas, aunque valores medios totales de 27,7 y 42,7 corresponden a las clases funcionales de la NYHA II y III respectivamente en pacientes estables36, y un cambio de más de 5 puntos en la puntuación total se considera clínicamente significativo37.
Para implementar la interpretabilidad se precisan más trabajos con el MLHFQ en grupos diversos, con diferentes necesidades de tratamiento y capacidad de predicción de ciertos acontecimientos vitales.
CONCLUSIONES
Este estudio contribuye a describir las propiedades psicométricas de la versión española del MLHFQ y acredita su utilidad para usarlo tanto en futuras investigaciones como en la práctica clínica habitual en pacientes con ICC atendida en APS, sobre los que los datos de la literatura son escasos.
ABREVIATURAS
APS: atención primaria de salud.
CVRS: calidad de vida relacionada con la salud.
ICC: insuficiencia cardiaca crónica.
NYHA: New York Heart Association.
Full English text available from: www.revespcardiol.org
Correspondencia: Dr. J.C. Naveiro Rilo.
Gerencia de Atención Primaria de León.
Abad Viñayo, 1. 24008 León. España.
Correo electrónico: jnaveiror@saludcastillayleon.es
Recibido el 23 de noviembre de 2009.
Aceptado para su publicación el 15 de julio de 2010.