La aproximación científica a la predicción del futuro de los pacientes (pronóstico) y la planificación sanitaria se basa en la estimación de riesgos y beneficios. Las funciones de riesgo cardiovascular son un ejemplo paradigmático de este esfuerzo aplicado a la clínica: a partir de hechos bien establecidos (factores de riesgo bien medidos como la diabetes, el perfil lipídico, el consumo de tabaco, etc.), se establece el riesgo de cierta evolución (sufrir una enfermedad cardiovascular en los próximos 10 años) con un margen de error1. A medida que avanza el conocimiento, se intenta mejorar progresivamente este punto de partida mediante la ampliación de factores predictivos de las funciones, como las puntuaciones de riesgo poligénico2. Si alguien presenta un 1% de riesgo, sabemos que 1 de cada 100 pacientes como esa persona tendrá un evento coronario en los próximos 10 años1. El problema es que no sabemos quiénes son esos pacientes. Aceptamos resignadamente esta contingencia porque no sería asumible el esfuerzo y el gasto necesarios para neutralizar esta baja incidencia. En cambio, en los pacientes en riesgo alto o muy alto (> 10% a 10 años), los recursos empleados se vuelven coste-efectivos: hay mucha menos población con este riesgo y el número de eventos prevenibles es mucho mayor.
Para tomar decisiones que garanticen la igualdad de oportunidades y la inversión óptima de recursos, los planificadores sanitarios se nutren de informaciones sobre la incidencia y la prevalencia de enfermedades, su posible relación con el consumo de recursos sanitarios (estudios de coste-efectividad), sobre beneficios y efectos indeseables de las intervenciones o factores socioeconómicos que relacionan el consumo de recursos con la mortalidad hospitalaria por algunas enfermedades cardiovasculares, como han publicado recientemente en Revista Española de Cardiología de la Torre Hernández et al.3. En dicho estudio se concluye que el uso de las tecnologías cardiológicas varía considerablemente entre comunidades autónomas, sin que esta variabilidad se explique por las diferencias en su producto interior bruto, su gasto sanitario per cápita o la frecuentación hospitalaria debida a las enfermedades consideradas. El mérito del esfuerzo realizado para obtener una base de datos amplia sobre la actividad asistencial cardiológica en varias comunidades autónomas merece una mención especial. El estudio indica que la variación intercomunitaria en el uso de la intervención coronaria percutánea en general y primaria, del desfibrilador automático implantable, de la terapia de resincronización cardiaca o del implante percutáneo de válvula aórtica no depende de factores económicos. Hay otros factores candidatos a explicar esa variabilidad:
- •
La incidencia de las enfermedades cardiológicas que se benefician de estas técnicas, y que se han sustituido por índices de frecuentación hospitalaria de RECALCAR. Los informes de la página web de la Sociedad Española de Cardiología (SEC) admiten que el conjunto mínimo básico de datos (CMBD) suministrado por el Ministerio de Sanidad, Consumo y Bienestar Social tiene limitaciones de codificación y de cobertura4. La propia encuesta RECALCAR es de respuesta voluntaria, aunque cubre el 77% de los 161 hospitales públicos con cardiología que identifica4. El estudio excluye los 229 centros privados con cardiología y otros 122 centros de los 283 hospitales públicos con cardiología identificados por el Ministerio de Sanidad en su informe de 20165. Posiblemente esto se deba al hecho de que no encajan en la definición de «unidad cardiológica» del RECALCAR, que excluye a los hospitales de menos de 200 camas4. Los hospitales privados representan el 20% del total de camas operativas. En 2016, los públicos tenían 3,49 unidades de hemodinámica/millón de habitantes, y los privados ofrecen otras 2,15, según el informe del Ministerio de Sanidad5. El informe RECALCAR admite también que los recursos de tecnología cardiológica disponibles por millón de habitantes son superiores al estándar internacional admitido como suficiente.
- •
La mortalidad poblacional por enfermedades cardiovasculares —o pormenorizada por cardiopatía isquémica, insuficiencia cardiaca, etc.— es un dato disponible para cada comunidad autónoma y que podría haberse utilizado para el ajuste en lugar de la razón de mortalidad estandarizada por riesgo (RAMER), que mide la mortalidad hospitalaria por estas causas ajustada por riesgo en los hospitales con datos disponibles. Las publicaciones del RECALCAR refieren el método previamente descrito6 y el método del ajuste se detalla en una publicación de 20137. Este indicador se proporciona en todos los informes sin un intervalo de confianza del 95%, que es sensible al tamaño muestral y en muchos casos seguramente revelaría que las tasas de muchos hospitales no son distintas entre sí. Además, se promedian las RAMER de los hospitales de cada comunidad sin ponderar por el número de pacientes aportados ni tener en cuenta los intervalos de confianza de estos estimadores de calidad. La mortalidad poblacional total o por causas específicas de la comunidad, en cambio, no está afectada por el tamaño muestral y constituiría un sistema poblacional de ajuste suplementario para las diferencias entre comunidades autónomas.
- •
La media de edad de la población y la esperanza de vida de cada comunidad pueden ejercer, y a la vez recibir, influencia en la incidencia y la prevalencia de las enfermedades cardiacas. Estos indicadores están disponibles en el Instituto Nacional de Estadística y también son robustos.
- •
La indicación de los procedimientos estudiados constituye un punto crítico a la hora de evaluar las diferencias en la práctica clínica entre regiones u hospitales. Se trata de disponer de la información necesaria sobre la indicación y la contraindicación de cada caso candidato a recibir una determinada técnica o dispositivo. La variabilidad asistencial tiene un componente importante basado en la decisión razonada de emplear o no una técnica diagnóstica o terapéutica determinada. Esta decisión depende fundamentalmente de las características de los pacientes individuales. Si en la base de datos no se dispone de estas características que permiten analizar la indicación, es difícil juzgar cuántos procedimientos se han realizado correctamente, cuántos podrían haberse practicado y no se llevaron a cabo y cuántos no se realizaron por contraindicación correctamente evaluada.
- •
La variabilidad en la práctica clínica. Por último, el componente de insuficiente implantación de buena práctica clínica establecida en las guías sería la parte no explicada por los puntos anteriores debidamente analizados.
De todos los diseños posibles en investigación biomédica, el de de la Torre Hernández et al.3 quedaría clasificado como estudio de correlación ecológico. En este tipo de estudios la unidad de comparación deja de ser el individuo y pasa a ser un grupo de población, en este caso, la comunidad autónoma. Con este tipo de diseños se construyó la teoría lipídica de la arterioesclerosis y su posible relación con la dieta mediterránea hace más de 50 años8. Se admite que la capacidad de este tipo de diseño es muy limitada porque está sujeta a muchos posibles sesgos no controlables. Por lo tanto, la inferencia que se puede realizar es igualmente limitada y se admite que su utilidad se centra en la generación de hipótesis que contrastar en diseños de investigación más potentes. Si se analiza la proporción de accidentes de motocicleta letales, seguramente se observará que dicha proporción es menor en los países con leyes que obligan al uso del casco, pero otros factores pueden incidir en ella, como la edad a la que se puede conducir una moto en cada país, la limitación de la velocidad, los quitamiedos en las curvas de las carreteras, la calidad del parque móvil y otras que seguramente no podríamos ni imaginar.
La aproximación al análisis de diferencias entre regiones mediante un diseño ecológico, en el que se sustituye a los individuos por grupos de individuos, es siempre arriesgada y choca con problemas de representatividad de las muestras y sesgos de información, fiabilidad diagnóstica, recursos sanitarios y prácticas clínicas variados, la mayoría de los cuales no se conocen con precisión9.
Las fuentes utilizadas por de la Torre Hernández et al.3 son el Instituto Nacional de Estadística para los datos económicos de las comunidades autónomas, las publicaciones sobre actividad asistencial del Registro de la Sociedad Española de Cirugía Cardiovascular y Endovascular, el Registro Español de Hemodinámica y Cardiología Intervencionista de la Asociación de Cardiología Intervencionista de la SEC, el Registro Español de Marcapasos de la Asociación del Ritmo Cardiaco de la SEC y el registro RECALCAR de la SEC.
La mayoría de los registros se basan en la declaración voluntaria anónima y no auditada de actividad asistencial de varios hospitales de las comunidades autónomas. Hay 764 hospitales en España, privados 421 de ellos5. Asumiendo que todos los hospitales con cardiología puedan colocar marcapasos, serían 512 (67%) los que podrían hacerlo. El XVII Informe Oficial de la Sección de Estimulación Cardiaca de la Sociedad Española de Cardiología de 2019 presenta resultados de su registro en 109 hospitales que participan voluntariamente, de modo que la actividad informada representa el 39% de la declarada por la industria de marcapasos10. En el caso de la cirugía cardiovascular, se incluyen entre 49 y 64 centros —según el año— de los 146 hospitales con cirugía cardiaca del país en 20165,11. El Registro de Hemodinámica y Cardiología Intervencionista trabaja en su último informe con 109 hospitales (83 públicos) con sala de hemodinámica11 de las 254 existentes en 20165.
En ningún caso —ni en el artículo de de la Torre Hernández et al.3 ni en los registros mencionados10–12— se analiza la representatividad de las muestras de hospitales por comunidad autónoma excepto en RECALCAR, que la sitúa en un mínimo del 60% de los hospitales públicos con cardiología y al menos 200 camas invitados a participar. A la luz de la parcialidad de la información necesaria disponible para la evaluación de la calidad asistencial a escala comunitaria, queda preguntarse si la combinación de la información de las fuentes utilizadas permite llegar a conclusiones suficientemente fiables a dicha escala.
Una alternativa más eficiente al análisis por zonas geográficas sería la creación de indicadores objetivos, robustos, independientes y universales de calidad asistencial que puedan aplicarse en todos los centros o en centros centinela. Estos indicadores tienen que ajustarse por características locales (geográficas, de población y de pacientes) y presentarse con un intervalo de confianza del 95%.
Hace unos años, en dos proyectos europeos (EURHOBOP y EUROTRACS) se desarrolló un instrumento que permite establecer el percentil de calidad de un hospital que trata a pacientes con infarto de miocardio en el contexto de los hospitales europeos y de acuerdo con el país donde se encuentra, la tipología del hospital y las características de los pacientes que recibe13,14. El modelo, creado con unos 15.000 pacientes con síndrome coronario agudo de 6 países europeos y validado en otros 55.000, tenía una calibración excelente (el estadígrafo C tenía un intervalo de confianza del 95% del 74-82%). En el estudio ATHOS15, cada hospital participante recibió una evaluación individual y confidencial sobre su rendimiento objetivo en el tratamiento de los pacientes con infarto de miocardio basado en el estudio EURHOBOP. A diferencia del RAMER, el sistema EURHOBOP proporciona directamente el percentil en que se encontraría el hospital evaluado en el contexto de los hospitales de sus mismas características, según la tipología de pacientes que recibe. Está disponible una aplicación en línea para pruebas completamente anónimas16. Este tipo de herramientas encaja perfectamente en el programa SEC-EXCELENTE17. También es cierto que siempre existirá el sesgo de participación: es probable que solo participen los hospitales que crean que tienen buenos resultados. Sin embargo, la confidencialidad de la información y la posibilidad de realizar autoevaluaciones anónimas online estimularían seguramente la curiosidad y el deseo de mejora. Un resultado subóptimo podría acompañarse de búsqueda de asesoramiento, implantación de un programa de mejora y un proceso posterior de certificación de calidad.
En la declaración STROBE (Strengthening the Reporting of Observational studies in Epidemiology) se listan 22 puntos esenciales que presentar y tener en cuenta en cualquier estudio observacional18. Nos gustaría destacar los siguientes:
El número 3 requiere que se indiquen los objetivos específicos, incluida cualquier hipótesis preespecificada. Este último punto es clave para entender qué se espera encontrar en un estudio ecológico. La especificación de los objetivos también permite saber cuáles tienen la potencia estadística necesaria, asumiendo una estimación correcta del tamaño de la muestra, y cuáles son generadores de hipótesis.
El número 6 exige que se proporcionen los criterios de elegibilidad y las fuentes y los métodos de selección de los participantes.
El número 10 requiere que se explique cómo se determinó el tamaño muestral o, en su defecto, qué potencia estadística proporciona el tamaño muestral disponible para responder al objetivo principal.
El punto 12(a) requiere que se especifiquen todos los métodos estadísticos, incluidos los empleados para controlar los factores de confusión. Conviene recordar que, cuando se realiza un gran número de contrastes de hipótesis, es importante corregir los valores de p por comparaciones múltiples para reducir el número de relaciones espurias.
El punto 13(a) implica describir el número de participantes en cada fase del estudio; por ejemplo: cifras de los participantes/centros potencialmente elegibles, los analizados para su inclusión, los confirmados elegibles, los incluidos inicialmente en el plan de análisis del estudio, los que tuvieron un seguimiento completo y los analizados finalmente, así como las razones de la pérdida de participantes en cada fase. Se propone presentar la información mediante un diagrama de flujo con estos datos descriptivos.
El punto 19 invita a discutir con sinceridad las limitaciones del estudio, teniendo en cuenta posibles fuentes de sesgo o de imprecisión y razonando tanto sobre la dirección como sobre la magnitud de cualquier posible sesgo.
Por último, el punto 21 apunta que se discuta la posibilidad de generalizar los resultados, es decir, la validez externa del estudio.
Para concluir, es necesario reconocer el encomiable esfuerzo realizado por el equipo de de la Torre et al. a la hora de obtener y además combinar datos de tan variadas fuentes, así como por los elaborados análisis y conclusiones extraídas de sus resultados. Por otro lado, nos gustaría proponer a los editores que, para comprender mejor la validez interna y externa de los estudios observacionales ecológicos de descripción de la actividad asistencial que se publiquen, se siga la guía de publicación STROBE18. Ello permitirá evaluar objetivamente la representatividad y la validez de los datos presentados. En cualquier caso, creemos que el nivel ideal de evaluación de la calidad asistencial es el del centro sanitario, ya que las agrupaciones de centros por regiones o niveles asistenciales están expuestas a un gran número de condicionantes, muchos de los cuales no se pueden conocer ni, por lo tanto, controlar con suficiente precisión.
FINANCIACIÓNEste trabajo no ha recibido ninguna financiación. La afiliaciones cubren nuestros sueldos y ya están citadas.
CONFLICTO DE INTERESESSin conflicto de intereses.