Estudiar la validez de la función SCORE original de bajo riesgo sin y con colesterol unido a lipoproteínas de alta densidad y SCORE calibrada en población española.
MétodosAnálisis agrupado con datos individuales de 12 estudios de cohorte de base poblacional. Se incluyó a 30.919 participantes de 40-64 años sin enfermedades cardiovasculares en el momento del reclutamiento, que se siguieron durante 10 años para la mortalidad cardiovascular contemplada en el proyecto SCORE. La validez de las funciones se analizó mediante el área bajo la curva ROC (discriminación) y el test de Hosmer-Lemeshow (calibración), respectivamente.
ResultadosSe dispuso de 286.105 personas/año. La mortalidad a 10 años por causas cardiovasculares fue del 0,6%. La razón de casos esperados/observados fue de 9,1, 6,5 y 9,1 en varones y de 3,3, 1,3 y 1,9 en mujeres con las funciones SCORE original de bajo riesgo sin y con colesterol unido a lipoproteínas de alta densidad y SCORE calibrada, respectivamente; diferencias estadísticamente significativas con el test de calibración de Hosmer-Lemeshow entre la mortalidad predicha con SCORE y la observada (p < 0,001 en ambos sexos y en todas las funciones). Las áreas bajo la curva ROC con SCORE original fueron 0,68 en varones y 0,69 en mujeres.
ConclusionesTodas las versiones de las funciones SCORE disponibles en España sobreestiman significativamente la mortalidad cardiovascular observada en la población española. A pesar de la aceptable capacidad de discriminación, la predicción del número de acontecimientos cardiovasculares mortales (calibración) fue significativamente imprecisa.
Palabras clave
Todo instrumento destinado a prevenir las enfermedades cardiovasculares es bienvenido porque estas siguen constituyendo la principal causa de muerte en España, sin que apenas haya cambiado su incidencia en los últimos 30 años1,2. La prevención primaria identifica población de alto riesgo de enfermedades cardiovasculares, en la cual se intensifican las medidas —farmacológicas y de estilos de vida— para disminuir y retrasar su incidencia3. Las funciones de riesgo se diseñaron para estimar el riesgo coronario global, que mejoró el simple abordaje individual de los factores de riesgo cardiovascular. Estos instrumentos se elaboran a partir de estudios de cohortes con seguimiento de 10 años o más, y permiten estimar el riesgo de presentar una enfermedad coronaria durante dicho periodo4.
La función SCORE (Systematic COronary Risk Evaluation), recomendada en las guías europeas y españolas3,5–7, establece el riesgo de muerte cardiovascular a 10 años. Desarrollada a partir de cohortes europeas, presenta una versión original para países de alto y bajo riesgo (SCORE-OBR)5, otra versión original que incluyó la razón colesterol total/colesterol unido a lipoproteínas de alta densidad (SCORE-OBR-cHDL) y una versión calibrada para su uso en la población española (SCORE-C)8. Las 2 últimas están disponibles online en HeartScore9. Todavía no se ha evaluado el rendimiento de ninguna de estas 3 versiones de la función SCORE en una cohorte de población española.
El objetivo del presente trabajo es analizar la validez de las 3 funciones SCORE recomendadas en España comparándose su predicción con la tasa de enfermedad cardiovascular mortal observada a 10 años en una cohorte de población general española.
MÉTODOSDiseño y participantesAnálisis agrupado con datos individuales de 12 estudios españoles de cohorte de base poblacional, realizados a partir de 199110 y con seguimientos hasta 2005, englobados en el estudio FRESCO11 (tabla 1 del material suplementario). Todos los participantes de las cohortes se seleccionaron aleatoriamente entre la población de 35-79 años sin enfermedad cardiovascular al inicio del seguimiento y firmaron su consentimiento informado. El estudio FRESCO se autorizó por el Comité de Ética del Parc de Salut Mar de Barcelona (2009/3391/I).
MedidasLa edad, el sexo y el resto de factores de riesgo considerados en las funciones SCORE (tabaquismo, presión arterial sistólica, colesterol total y colesterol unido a lipoproteínas de alta densidad [cHDL]), se encontraban disponibles en todas las cohortes y se habían recogido utilizando la metodología estandarizada recomendada por la Organización Mundial de la Salud10. Se clasificó a los participantes en fumadores (si fumaban en el momento del examen o eran exfumadores de ≤ 1 año) y no fumadores (exfumadores de > 1 año o nunca fumadores). La presión arterial sistólica y diastólica se determinó con la media de 2 determinaciones separadas al menos 5min. Las determinaciones analíticas se realizaron tras ayuno de 10-14h. El diagnóstico de diabetes mellitus se estableció a partir del diagnóstico previo o de una glucemia basal > 125mg/dl. En 9 de las 12 cohortes se realizó un estudio de concordancia de colesterol total y cHDL, en el que se obtuvieron resultados satisfactorios12. En la presente validación se consideró la población para la cual estaba diseñada la función SCORE: 40-64 años de edad, presión arterial sistólica ≥ 100 y ≤ 180mmHg y colesterol total ≥ 105mg/dl (3 mmol/l) o ≤ 305mg/dl (8 mmol/l) (figura 1).
El seguimiento de los participantes fue de al menos 10 años para las siguientes enfermedades cardiovasculares mortales de la CIE-9 (novena revisión de la Clasificación Internacional de Enfermedades), o sus equivalentes de la décima revisión, consideradas en SCORE5: códigos de 401 a 414 y de 426 a 443, con la excepción de los siguientes: 426.7, 429.0, 430.0, 432.1, 437.3, 437.4 y 437.5. Además, se clasificaron como muerte cardiovascular5 los códigos de la CIE-9 798.1 (muerte instantánea) y 798.2 (muerte súbita en ausencia de síntomas durante las 24h previas). La causa de la muerte se verificó a partir de la historia clínica, los informes de alta hospitalarios y los registros de mortalidad nacional y de cada comunidad autónoma.
Análisis estadísticoSe realizó un análisis estratificado por sexo. Las variables continuas se resumieron con la media ± desviación estándar y las variables categóricas mediante proporciones. Las tasas de mortalidad global y por causas (cardiovascular, no cardiovascular) se estimaron por el método de Kaplan-Meier.
Se estimó el riesgo de muerte cardiovascular a 10 años con la función SCORE-OBR con los coeficientes de la función Weibull5. También se estimó el riesgo con las funciones SCORE-OBR-cHDL y SCORE-C8 mediante la calculadora HeartScore de la Sociedad Europea de Cardiología9, ya que no se publicaron sus coeficientes7. Se utilizó el software libre AutoIt13 para añadir automáticamente, en el campo correspondiente de la calculadora, los valores de las variables sexo, edad, consumo de tabaco, presión arterial sistólica, colesterol total y cHDL (cuando fue necesario) tomados de la base de datos. El mismo programa capturó el resultado del riesgo estimado por la calculadora para SCORE-OBR-cHDL y SCORE-C y lo incorporó a la base de datos.
Para validar las funciones, se estimó en primer lugar la razón de mortalidad esperada/observada con cada una de las 3 funciones de riesgo. Para determinar la fiabilidad de la función SCORE-OBR5 se realizó un análisis de la capacidad de discriminación con el área bajo la curva ROC (receiver operating characteristic)14. La precisión se evaluó comparándose los riesgos observados en la cohorte y los estimados por las funciones mediante el test de Hosmer-Lemeshow modificado para estudios de cohorte en sextiles de riesgo de SCORE-OBR (calibración)15. No se pudo evaluar una curva ROC para las funciones SCORE-OBR-cHDL y SCORE-C, ya que la calculadora HeartScore solo proporciona cifras de riesgo redondeadas a enteros9. No obstante, se analizó la calibración comparándose los acontecimientos observados y esperados con 3 puntos de corte de riesgo enteros (1, 2 y 3%).
El riesgo estimado con las 3 funciones se multiplicó por 3 y por 5 en varones y mujeres con diabetes, respectivamente; siguiendo las indicaciones de la guía de práctica clínica más reciente de la Sociedad Europea de Cardiología3. Además, se realizó un análisis de sensibilidad en el cual se multiplicó el riesgo cardiovascular estimado con la función SCORE-OBR por 2 y por 4 en varones y mujeres con diabetes, respectivamente; según se indicaba en la publicación de referencia5.
Se calculó la distribución de la población en 4 grupos de riesgo definidos por los puntos de corte 1, 5 y 10% con las 3 versiones de SCORE y el porcentaje de muertes cardiovasculares observadas en dichos grupos.
Todos los análisis se realizaron mediante la versión 2.10 del programa estadístico R (R Foundation for Statistical Computing, Viena, Austria).
RESULTADOSDe los 56.577 participantes en el estudio FRESCO, se excluyó a 22.026 por tener una edad < 40 o > 64 años y a 3.632 por presentar valores de presión arterial sistólica y colesterol total fuera del rango considerado por SCORE. Finalmente, se incluyó a 30.919 personas en la validación (figura 1). La mediana de seguimiento fue de 10,0 años, con un total de 286.105 personas/año. La tasa de mortalidad a 10 años por cualquier causa fue del 3,0%, y por las causas cardiovasculares incluidas en la función SCORE fue del 0,6%. La causa de muerte era desconocida en 8 participantes (0,98%).
Las características de los participantes estratificadas por sexo se detallan en la tabla. El perfil de riesgo cardiovascular fue más desfavorable en los varones. La media de riesgo calculada con las 3 funciones fue siempre superior en varones que en mujeres, así como el porcentaje de varones clasificados en el grupo de riesgo alto (≥ 5%). El SCORE-OBR-cHDL clasificó al mínimo de personas en el grupo de alto riesgo (≥ 5%) (12,7% de varones y 2,8% de mujeres). La razón de casos estimados frente a observados fue de 9,1, 6,5 y 9,1 en varones y de 3,3, 1,3 y 1,9 en mujeres para las versiones SCORE-OBR, SCORE-OBR-cHDL y SCORE-C, respectivamente.
Características basales de los participantes, estimación del riesgo cardiovascular mediante las funciones SCORE-OBR, SCORE-OBR-cHDL y SCORE-C (riesgo multiplicado por 3 y 5, en varones y mujeres con diabetes, respectivamente) y variables de resultado estratificadas por sexo
Varones (n = 14.661) | Mujeres (n = 16.258) | |
---|---|---|
Edad (años) | 52 ± 7 | 52 ± 7 |
Fumador | 4.891 (33,7) | 2.284 (14,2) |
Colesterol total (mg/dl) | 220 ± 36 | 221 ± 37 |
cHDL (mg/dl) | 49 ± 13 | 59 ± 15 |
Diabetes mellitus | 2.393 (16,4) | 1.818 (11,2) |
Presión arterial sistólica (mmHg) | 134 ± 16 | 129 ± 16 |
SCORE-OBR ×3/×5 (%) | 3,50 ± 4,56 | 1,27 ± 2,44 |
SCORE-OBR ×3/×5 | ||
< 1% | 4.037 (28,0) | 10.756 (67,3) |
≥ 1-5% | 7.560 (52,4) | 4.394 (27,5) |
≥ 5% | 2.829 (19,6) | 822 (5,1) |
SCORE-OBR-cHDL | 3,47 ± 4,73 | 0,74 ± 1,29 |
SCORE-OBR-cHDL | ||
< 1% | 5.601 (41,6) | 13.368 (89,1) |
≥ 1-5% | 6.137 (45,6) | 1.219 (8,1) |
≥ 5% | 1.714 (12,7) | 421 (2,8) |
SCORE-C | 2,48 ± 3,22 | 0,51 ± 0,86 |
SCORE-C | ||
< 1% | 4.926 (35,8) | 12.472 (81,5) |
≥ 1 a < 5% | 6.005 (43,6) | 2.278 (14,9) |
≥ 5% | 2.833 (20,6) | 555 (3,6) |
Mortalidad total a 10 años* | 545 (3,7) | 275 (1,7) |
Causa de fallecimiento* | ||
Cardiovascular | 103 (0,7) | 52 (0,3) |
No cardiovascular | 439 (3,0) | 218 (1,3) |
Indeterminada | 3 (< 0,1) | 5 (< 0,1) |
cHDL: colesterol unido a lipoproteínas de alta densidad; SCORE-C: Systematic COronary Risk Evaluation calibrada; SCORE-OBR: Systematic COronary Risk Evaluation original de bajo riesgo; SCORE-OBR-cHDL: Systematic COronary Risk Evaluation original de bajo riesgo con cHDL.
Salvo otra indicación, los datos expresan n (%) o media ± desviación estándar.
La capacidad de discriminación de la función SCORE original se muestra en la figura 2. El área bajo la curva ROC fue de 0,68 en varones y de 0,69 en mujeres.
En la figura 3 se presenta la precisión de las estimaciones de la función SCORE-OBR. En ambos sexos se observan diferencias estadísticamente significativas entre el porcentaje de muertes observadas y esperadas en los sextiles de riesgo. En la figura 4 se observan también diferencias estadísticamente significativas para ambos sexos en los 4 grupos de riesgo analizados con las funciones SCORE-C y SCORE-OBR-cHDL.
Calibración en sextiles de riesgo de muerte CV de la función SCORE original de bajo riesgo. Las líneas en la parte superior de cada barra indican el intervalo de confianza del 95%. En pacientes diabéticos el riesgo se ha multiplicado por 3 y 5 en varones y mujeres, respectivamente. CV: cardiovascular.
Calibración en grupos de riesgo de muerte CV de las funciones de SCORE-C y SCORE-OBR-cHDL. Las líneas en la parte superior de cada barra indican el intervalo de confianza del 95%. En pacientes diabéticos el riesgo se ha multiplicado por 3 y 5 en varones y mujeres, respectivamente. CV: cardiovascular; SCORE-C: Systematic COronary Risk Evaluation calibrada; SCORE-OBR-cHDL: Systematic COronary Risk Evaluation original de bajo riesgo con colesterol unido a lipoproteínas de alta densidad.
La figura 5 muestra el porcentaje de participantes de la cohorte estudiada en 4 grupos de riesgo y el porcentaje de muertes en cada uno de ellos. Cerca del 80% de los acontecimientos cardiovasculares mortales ocurren en aproximadamente el 80% de la población femenina que presenta bajo riesgo (< 1% a 10 años) en SCORE-C y SCORE-OBR-cHDL. En los varones, con estas mismas funciones, alrededor del 40% de acontecimientos ocurre en aproximadamente el 60% de la población de bajo riesgo. En la versión SCORE-OBR más del 50% de los eventos ocurre en el grupo de riesgo de 1,1 a 5% (riesgo intermedio) en ambos sexos.
Proporción de población en diferentes grupos de riesgo de muerte cardiovascular según las funciones SCORE-OBR, SCORE-C y SCORE-OBR-cHDL (barras) y proporción de casos sobre el total que provienen de cada grupo (líneas y puntos). En pacientes diabéticos el riesgo se ha multiplicado por 3 y 5 en varones y mujeres, respectivamente. SCORE-C: Systematic COronary Risk Evaluation calibrada; SCORE-OBR: Systematic COronary Risk Evaluation original; SCORE-OBR-cHDL: Systematic COronary Risk Evaluation original de bajo riesgo con colesterol unido a lipoproteínas de alta densidad.
El análisis de sensibilidad realizado para las estimaciones de SCORE-OBR —aplicándose un factor de corrección por 2 y por 4 en varones y mujeres con diabetes, respectivamente— mostró resultados similares (tabla 2 del material suplementario y figura 1, figura 2 y figura 3 del material suplementario).
DISCUSIÓNEl presente estudio muestra por primera vez un análisis de los componentes de la validez (fiabilidad y precisión) de las estimaciones de riesgo cardiovascular de las función SCORE original con y sin cHDL5,9 y de su versión calibrada8,9 en una cohorte española con una base poblacional de más de 30.000 participantes seguidos durante 10 años. Las 3 funciones evaluadas proporcionaron estimaciones significativamente superiores (de 9,1 a 6,5 veces en varones y de 3,3 a 1,3 veces en mujeres) a la tasa de mortalidad cardiovascular observada (precisión). La discriminación (fiabilidad) de las funciones SCORE fue aceptable y similar a la mayoría de funciones de riesgo cardiovascular4,11,16,17.
Comparación con otros estudiosLa mayor parte de los estudios en la población europea que han analizado la validez de SCORE de alto riesgo indican que la estimación del riesgo de muerte cardiovascular en ambos sexos es significativamente superior a la observada en los Países Bajos18, Dinamarca19, Noruega20, 2 estudios llevados a cabo en Alemania21,22, Islandia23 y el Reino Unido24. En todos ellos, el SCORE duplica aproximadamente el verdadero riesgo de mortalidad cardiovascular. En la población australiana, mayoritariamente de origen europeo, se sobreestimó un 75% el riesgo en mujeres25.
La estimación de riesgo con SCORE-OBR fue un 40% mayor que la observada en población no diabética de Extremadura26. Esta función también se ha evaluado en países de alto riesgo como los Países Bajos18 e Islandia23, donde estimaba correctamente el riesgo de mortalidad cardiovascular. Sin embargo, en Alemania21 y el Reino Unido24 esta función sobreestimó el riesgo un 31 y 24%, respectivamente. En Noruega20 los resultados fueron aceptables en varones, pero se sobreestimó el riesgo en mujeres (razón de mortalidad observada/esperada: 0,69 en pacientes de 50 a 59 años y 0,56 en los de 60 a 69 años), así como en Australia (16%)25.
En coincidencia con nuestros resultados, un estudio transversal realizado en población catalana mostró que la función SCORE-C (particularmente en varones) clasificaba en mayor medida a pacientes como de alto riesgo en comparación con las funciones SCORE-OBR y SCORE-OBR-cHDL27. Además, también se ha observado una sobreestimación del riesgo con la función SCORE calibrada para los Países Bajos18 (aproximadamente el doble), mientras que la estimación fue adecuada en Alemania22. En Dinamarca, la función calibrada no mejoró la validez de la función SCORE-OBR19.
Implicaciones para la práctica clínicaGlobalmente, las 3 versiones de SCORE analizadas proporcionan estimaciones del riesgo cardiovascular significativamente diferentes de las observadas en la realidad de la población española. En las mujeres, el 80% de los acontecimientos cardiovasculares mortales se concentran en los grupos de bajo riesgo en las versiones SCORE-C y SCORE-OBR-cHDL y en las de intermedio y bajo en la versión SCORE-OBR; mientras que en los varones, el 80% de los acontecimientos se concentran en los grupos de riesgo bajo e intermedio con SCORE-C y SCORE-OBR-cHDL y el 65% en SCORE-OBR. Esta observación indica que los puntos de corte que definen riesgo bajo, intermedio y alto deberían revisarse a la baja. La definición de los puntos de corte está limitada por la ausencia de decimales de la estimación de la calculadora de la Sociedad Europea de Cardiología para las funciones SCORE-C y SCORE-OBR-cHDL9.
Los resultados del presente estudio sugieren que todas las versiones SCORE5,8,9 tienen limitaciones significativas en la precisión de las estimaciones obtenidas en población española. Se constata además el hecho de que la mayoría de los acontecimientos cardiovasculares ocurridos en España no son mortales11. La precisión de las tablas basadas exclusivamente en mortalidad cardiovascular puede variar con el tiempo, ya que en las últimas 3 décadas desde la constitución de las cohortes SCORE dicha mortalidad se ha reducido mucho2,5. Igualmente, merece la pena mencionar que la exclusión de las personas de 65 a 74 años constituye otro aspecto de gran relevancia clínica; ya que en esta población fallecieron por causas cardiovasculares el doble de personas que en el rango de edad (40-64 años) de nuestra cohorte. En un estudio danés los autores sugieren que las futuras guías consideren prioritariamente a las personas > 65 años, puesto que concentran la mayor parte de los acontecimientos cardiovasculares mortales19. Recientemente se ha publicado la versión de SCORE Older People, que permite estimar el riesgo de muerte cardiovascular en población de 65 a 74 años28. Para su derivación se utilizaron las cohortes SCORE de Noruega (mayoritariamente, 86,9% del total de la muestra incluida en la derivación), pero también de Italia, Bélgica y Dinamarca. En España, las tablas SCORE Older People mostraron un riesgo inferior al estimado mediante SCORE para personas mayores de 65 años29. En esta circunstancias, parece razonable promover también el uso de las funciones validadas en España: Framingham-Wilson calibrada por REGICOR4,16,17 y FRESCO11, que además aumenta la edad de aplicación hasta los 79 años.
Con el fin de poder realizar una prevención efectiva de las enfermedades cardiovasculares, es recomendable que los modelos de predicción de riesgo individual sigan las guías TRIPOD30, las cuales promueven la transparencia en la publicación de los métodos utilizados con el fin de facilitar su evaluación.
Limitaciones del estudioEl estudio FRESCO reúne datos de 12 cohortes españolas representativas de la población de diferentes áreas de referencia reclutadas entre los años 1991 y 2004. El estudio cuenta con un amplio tamaño muestral, un seguimiento exhaustivo de eventos cardiovasculares a 10 años, una metodología estandarizada de recogida de datos en las cohortes componentes y una amplia representatividad de la población española11. A pesar de la robustez de estas características, puede existir alguna heterogeneidad residual entre estudios componentes. Primero, no se dispuso de los coeficientes de la función SCORE-C y SCORE-OBR-cHDL dado que no se publicaron8. Por esta razón se tuvo que recurrir a la calculadora online HeartScore, diseñada para uso en el ámbito asistencial9, que redondea el resultado a un entero. La ausencia de decimales no permitió el cálculo del área bajo la curva de las 2 funciones. Esta limitación también afectó al análisis de la calibración, para el cual únicamente se pudieron crear 4 grupos de riesgo; en lugar de sextiles o deciles de riesgo (como en el caso de la función SCORE-OBR) utilizados clásicamente para evaluar la precisión de las funciones de riesgo cardiovascular15,16.
CONCLUSIONESLas predicciones de riesgo de todas las funciones SCORE difieren significativamente de las tasas de incidencia a 10 años en población española contemporánea candidata a prevención primaria cardiovascular. Su uso conduce a una considerable sobreestimación del verdadero riesgo de mortalidad cardiovascular que requeriría su recalibración para que sus predicciones se ajusten mejor a las tasas reales de mortalidad cardiovascular.
FINANCIACIÓNEl presente trabajo ha recibido las siguientes ayudas: Fundació La Marató de TV3 (081630); Instituto de Salud Carlos III, Red de Investigación Cardiovascular RD12/0042 (Programa HERACLES); Red de Investigación en Actividades Preventivas y de Promoción de la Salud RD06/0018; CP12/03287; Agència de Gestió d’Ajuts Universitaris i de Recerca (2005SGR00577, 2009SGR1195, 2014SGR240); CIBER de Epidemiología y Salud Pública; CIBER de Fisiopatología de la Obesidad y la Nutrición; Fondo Europeo de Desarrollo Regional (FIS CP12/03287, FIS 14/00449, FIS PI081327, FIS PI1101801).
CONFLICTO DE INTERESESNo se declara ninguno.
- –
El cálculo del riesgo cardiovascular mediante funciones de riesgo cardiovascular es fundamental como estrategia de prevención primaria.
- –
La guía europea de prevención de las enfermedades cardiovasculares y el Comité Español Interdisciplinario para la Prevención Cardiovascular recomiendan, entre otras, la función SCORE.
- –
La única función de riesgo cardiovascular validada en España es la calibración de la función de Framingham-Wilson realizada por el grupo REGICOR y la función FRESCO.
- –
Las funciones SCORE no han demostrado su validez en población española contemporánea.
- –
Las funciones SCORE sobreestiman significantemente el verdadero riesgo de mortalidad cardiovascular, incluso en su versión calibrada para la población española.
- –
Es necesario redefinir los puntos de corte de las funciones SCORE para conseguir una estratificación eficiente de la prevención cardiovascular en la práctica clínica.
Los autores agradecen a Susanna Tello, Marta Cabañero y Leny Franco su trabajo en la gestión de datos del proyecto.