A vueltas con el desconfinamiento

Uno de los principales puntos de interés de todo el mundo respecto del COVID-19, es el de cómo vamos a deshacer el proceso que nos ha llevado a todos a encerrarnos en nuestros hogares: el llamado desconfinamiento y con él, la vuelta a una nueva normalidad (distinta de la existente en la etapa pre-COVID-19). Parece evidente que, con ya más de cincuenta días de confinamiento y un cierto cansancio en la población, pocos temas pueden ser de más actualidad que este. Habrá que aparcar, por interés público, algunos ángulos interesantes que quedaban por examinar sobre cómo los sistemas de inteligencia artificial podían ayudar en un sistema de alerta temprana para la futura pandemia, que denominábamos COVID-20 (donde “20” viene por especular que su aparición sería posiblemente a finales de 2020 ;->, no porque haya 20 ediciones del COVID como pensaba una asesora de Trump, en este video).

No se trata pues de contar en detalle las fases de la enfermedad y las virtudes diagnósticas de algún tipo de prueba concreta o cualquier otro aspecto relacionado con la enfermedad o las medidas de salud pública. Si una cosa está poniendo de manifiesto este periodo excepcional en la cantidad existente de buenos relatores tanto por escrito como audiovisuales, por lo que desde el blog crónicas de un humano en la era digital no vamos a abundar en esa línea.

El objetivo entre este artículo es simplemente introductorio del problema del desconfinamiento y la medición con pruebas rápidas, mientras que, en los siguientes, entraremos a analizar este problema a través de la lente de lo que pueden ofrecer los sistemas de Inteligencia Artificial (IA) o, al menos, las técnicas que utiliza esta disciplina y que son comunes con otros campos de conocimiento. ¿Pueden los sistemas de IA ayudarnos a controlar de manera adecuada el desconfinamiento, de manera que no vuelvan a producirse brotes de infectados? o, al menos, si estos se producen, ¿pueden ayudarnos a controlarlos lo más rápidamente posible para no tener que volver a la situación actual?

En todo caso, cualquier estrategia en este sentido pasa por mantener las medidas de distanciamiento social, la limpieza e higiene reforzadas y el uso obligatorio de mascarillas, no para evitar ser contagiado, sino para evitar contagiar.  Dada la temática que tratamos en Crónicas de un ser humano en la era digital, no voy a entrar a discutir más sobre este punto, pero remito al lector a este enlace, donde encontrará toda la información necesaria sobre mascarillas, tipos y usos. Vayan acostumbrándose a llevar mascarilla a todos lados los próximos meses, lo cual con el calor se hará más incómodo, pero, en este punto, debe prevalecer nuestro sentido de la responsabilidad social sobre nuestra comodidad personal.

Nuestro futuro previsible en el desconfinamiento

Dos características del COVID-19 hacen especialmente difícil este proceso de desconfinamiento:

  1. Que un porcentaje importante de personas, alrededor del 30% según las estimaciones disponibles hasta la fecha (seguramente irá cambiando), no manifiesta ningún síntoma de la enfermedad. Son los denominados infectados asintomáticos, lo cual hace que la tasa de transmisión de virus sea de 2,5 personas por infectado, mucho mayor que la de la gripe común. Cuando las personas ya presentan síntomas es más fácil que acudan a un centro sanitario y queden aislados o sean sometidos a cuarentena, de manera que su potencial de infección baja mucho. Y luego que hay un 56% con síntomas leves que en muchos casos se pueden confundir con una gripe o un resfriado común, lo cual dificulta aún más la detección de estos casos.
  2. Existe otro grupo de potenciales personas que pueden infectar y no son conscientes de ello. Son las personas que aparentemente han superado la enfermedad (puede que inadvertidamente) y que han generado anticuerpos, los suficientes para recibir el alta o seguir inconscientemente sus quehaceres diarios, pero no tienen una cantidad suficiente de anticuerpos como para que no queden restos de coronavirus en algún tejido en nuestro cuerpo que actúe como reservorio, como señala en este video el virólogo Luis de Juanes director del Centro Nacional de Biología del CSIC (minuto: 12:54 pero vale la pena verlo todo).

Esto equivale a que un porcentaje, por el momento indeterminado de los curados, en realidad no han superado la enfermedad completamente, sino que nunca han dejado de estar infectados, aunque hayan podido generar una cierta cantidad de anticuerpos.

Formulando el problema del desconfinamiento

El problema al que nos enfrentamos es que, con lo que hemos dicho en el apartado anterior sobre las características de este COVID-19, si no lo hacemos el proceso de desconfinamiento con mucho cuidado, es probable que, al relajar las medidas de confinamiento, vuelvan a producirse nuevos brotes epidémicos.

Queremos que las personas vayan abandonando el confinamiento de acuerdo con el siguiente orden:

  1. Aquellas personas de las que, en un momento determinado, podamos tener una seguridad alta que no son portadoras del virus por haber superado la enfermedad y haber generado anticuerpos en cantidad suficiente para ser inmunes a la enfermedad (aunque no sepamos por cuanto tiempo podemos suponer por otros coronavirus, que la inmunidad puede estar entre 6 meses y 2 años, pero habrá que establecerlo).
  2. Personas que no han pasado la enfermedad y que no se encuentren en alguno de los grupos de riesgo como personas mayores, o personas inmunodeprimidas por causas diversas, como tratamientos de quimioterapia, por ejemplo. Aquí se encuentra la inmensa mayoría de la población.
  3. En la medida en que vayamos disponiendo de tratamientos paliativos o vacunas rápidas de eficacia relativa, el resto de la población que puedan tener algún riesgo específico mayor que la población en general, como población infantil.
  4. Población de riesgo, en la medida en que se dispongan de vacunas eficaces y no esté contraindicado bien por la naturaleza de la condición que las caracteriza como grupo de riesgo, o bien en relación con la administración de la vacuna en sí o sus posibles efectos secundarios.

Y además, queremos que de las poblaciones anteriores se incorporen primero aquellos que trabajan en servicios esenciales, después los que trabajan en servicios importantes pero no esenciales, después aquellos que trabajan en servicios no esenciales y no tan importantes, pero que no pueden teletrabajar y finalmente, aquellos que no trabajando en servicios esenciales pueden teletrabajar.

Muchos epidemiólogos y expertos en salud pública y la experiencia de otros países que han contenido bien el estallido del COVID-19 como Corea del Sur, hablan de que el éxito del desconfinamiento se basa en el despliegue simultáneo de tres estrategias, un ejemplo puede verse aquí (de la fundación Rockefeller, video en inglés):

  1. La realización de grandes cantidades de pruebas rápidas a la población, pero no para el diagnóstico, sino para el cribado (screening) de personas inmunes de la población, con la idea de validar de forma continua quien puede circular por las calles y quienes deben ser confinados un periodo de dos semanas al menos.
  2. La utilización de aplicaciones móviles para la detección precoz de casos y contactos de COVID-19 con un código de colores según el número de días que hayan pasado desde la declaración del caso en cuestión.
  3. Medidas de re-confinamiento en zonas calientes en función de los datos agregados recogidos con la aplicación móvil anterior.

Este dos último casos, ya los comentamos tangencialmente, en el primer artículo de esta serie y, a nivel de privacidad de los datos, lo que comentamos en otro artículo sobre la red de alerta temprana sanitaria y la privacidad diferencial, también es aplicable aquí, así que por el momento no entraremos en ellos.

En este artículo vamos a explorar únicamente algunas cuestiones acerca del sistema de realización de múltiples pruebas a la población usando técnicas de IA (punto 1).

La IA es una técnica para gestionar la incertidumbre

Como siempre esta exploración la haremos desde la óptica de los sistemas de Inteligencia Artificial (IA), clarificando algunos conceptos sobre mediciones y su valor probatorio de la existencia de una enfermedad y también a nivel de si los sistemas de IA pueden ayudar a establecer una estrategia de realización de pruebas adecuadas que evite, en lo posible, un nuevo pico de contagios debido a la “vuelta a la normalidad”.

Los conceptos que vamos a examinar a continuación no son propiamente de IA, sino de estadística, pero dado que uno de los campos en que descansa la IA es la estadística, la IA los ha hecho suyos, especialmente en el ámbito denominado reconocimiento de patrones, que es el que se aplica a la hora de detectar si una pieza tiene defectos o para diagnosticar una enfermedad a través de imágenes médicas o pruebas diagnósticas, por ejemplo. Uno de los objetivos de este artículo es precisamente explicar estos conceptos estadísticos sin tener que recurrir (apenas) a las matemáticas.

De entre las múltiples definiciones que hay de IA, dos son especialmente relevantes para nuestro análisis, la primera es la que define la IA como “una técnica de gestión de la incertidumbre” y la segunda, mucho más pragmática, que exploraremos en otro artículo, es la que define la IA como “lo que hay que hacer cuando no sabes lo que hay que hacer”. Aunque la epidemiología y la salud pública son disciplinas sólidamente establecidas, la escala y otras características distintivas de esta pandemia son las que nos hacen entrar en terreno inexplorado. Nadie nunca se ha enfrentado a algo ni remotamente parecido por escala: ni el Ébola, ni el SARS o el MERS que han sido estos dos últimos, los coronavirus con más víctimas que se han producido en el S.XXI. Desde muchos puntos de vista el confinamiento es un gran laboratorio de experimentación, como nunca habíamos tenido en la historia de la humanidad (con el máximo respeto a la tragedia que estamos viviendo de fondo).

Entrando en la primera de las definiciones de IA, entre las causas de incertidumbre, hay dos que quiero destacar:

  1. Que se trata de un entorno estocástico (i.e. aleatorio), debido a que el ser humano es una maquinaria bioquímica tan extraordinariamente compleja y única que cabe una variación sensible en los síntomas de la enfermedad y su prognosis (pronóstico), de acuerdo con la siguiente figura (los porcentajes irán evolucionando conforme dispongamos de más información sobre la enfermedad).

Como muestra de esta afirmación. En la siguiente tabla se recogen los síntomas presentados por los primeros pacientes de coronavirus en Wuhan (China):

Fuente: adaptación, simplificación y traducción propia de Wikipedia “Coronavirus disease 2019“
Fuente primaria: informe OMS, 16-24 febrero de 20202. https://www.who.int/docs/default-source/coronaviruse/who-china-joint-mission-on-covid-19-final-report.pdf

Puede verse que, aunque existen unos síntomas bastante generales, ni siquiera estos son universales y además para el resto de los síntomas menos frecuentes hay una gran dispersión. Hasta aquí, nada nuevo, esto es biología en el fondo, pero no está demás ponerla de manifiesto para toda la discusión subsiguiente.

Y en cuanto a la evolución de la enfermedad, nuevamente se vuelve a manifestar esta diversidad:

Tasa de transmisisón de las fases del cornoavirus

Respecto de la evolución de la enfermedad, un aspecto en el que la IA podría ser de ayuda y que quizás tratemos en otro artículo posterior (lo cierto es que, casi a cada paso, surgen oportunidades de aplicar la IA en todo esto), es la de poder hacer un pronóstico de la evolución de los pacientes con sólo disponer de la información de los 2-4 primeros días que un paciente está en sala o en cuarentena domiciliaria (i.e. recluido forzosamente en su casa). Esto implica el tratamiento de series temporales de datos, es decir cuando el orden en que vamos obteniendo datos es relevante.

  1. Las limitaciones de los sensores: dado que el coronavirus (o los anticuerpos generados por el organismo en respuesta al coronavirus) no son observables directamente por nosotros, hemos de utilizar sensores que nos digan si estamos infectados, o lo hemos estado y hemos desarrollado anticuerpos. Y esto es precisamente la misión de las pruebas diagnósticas tanto las rápidas como las que se hacen en laboratorio. A partir de sus resultados hemos de poder inferir si se está o no infectado (es lo que se conoce como inferencia diagnóstica).

Fuente: Sociedad Española de Enfermedades Infecciosas y Microbiología Clínica (SEIMC)

En la figura de arriba, pueden verse los periodos temporales en los que cada una de las técnicas diagnósticas es detectable en el transcurso de la enfermedad. Puede observarse que todos los sistemas de medición diagnóstica tienen partes del curso de la enfermedad o en el de post-convalecencia, en las cuales no son capaces de medir nada y otros momentos en las cuales se obtendrán resultados indeterminados o no concluyentes, o falsos negativos.

Además, a la incertidumbre temporal derivada de las fases de la infección en las que hay presencia de anticuerpos se ha de añadir, incluso aunque nos hagamos una prueba en un momento en que es posible medir anticuerpos, la incertidumbre del propio método de detección que son las que se incluyen dentro de sensibilidad y especificidad de la prueba y de las que vamos a hablar posteriormente.

Y, finalmente, para complicar aún más la cuestión, los fabricantes de los kits de las prueba de medición ha determinado estos dos parámetros  con una muestra de la población de infectados muy pequeña (~< 500) en relación con la población potencialmente infectada (entre centenares de miles o varios millones, sólo en España), por lo que pueden no resultar suficientemente representativas de la población o incluso la cepa predominante en nuestra población puede ser distinta de la de la muestra que permitió establecer la sensibilidad y especificidad del sistema de medición (ninguno de los fabricantes es español). Así, en general, la sensibilidad y especificidad reales, con poblaciones mucho mayores y probablemente distintas que las utilizadas para determinar la sensibilidad y la especificidad, pueden ser apreciablemente diferentes y han de ser ensayadas sobre el terreno donde realmente se quiere contener la infección.

Quizás esto es lo que podría haber sucedido (al menos en parte) con las pruebas rápidas basadas en antígenos (que no son más que precursores de los anticuerpos) que el gobierno compró en China, que tenían una sensibilidad teórica del 68% y una especificidad del 100%, pero luego, de acuerdo con el Instituto de Salud Carlos III, al ser contrastadas en las urgencias de los hospitales españoles, su sensibilidad bajaba al 30%, lo que no las hace útiles para el diagnóstico, como pone de manifiesto la siguiente figura, que ilustra el protocolo de actuación hospitalaria en estos casos (esto puede variar conforme vayamos conociendo mejor la enfermedad).

Fuente: SEIMC. Sociedad Española de Enfermedades Infecciosas y Microbiología Clínica. Nota: IR=Infección Respiratoria *: La prueba rápida del antígeno tendría sentido con una prueba que tuviese una sensibilidad aceptable

Puede observase que existen otras pruebas diagnósticas a nivel hospitalario, pero requieren de equipos especializados como rayos-X o tomografía axial computarizada (TAC), por lo su uso se limita a los hospitales, aunque son muy apropiadas para su uso mediante técnicas de IA diagnóstico de imágenes, como, por ejemplo, además del sistema de la empresa china Alibaba de que hablamos en el primer artículo sobre la IA y el COVID-19 hace varias semanas, en este sistema de la Universidad de Granada y otros sistemas de detección basado en técnicas de IA (y específicamente de aprendizaje profundo) que están surgiendo por doquier.

Pero nosotros vamos buscando una solución de campo al problema que hemos definidos anteriormente, ya que necesitamos algo rápido, barato y que se pueda hacer en un centro de salud normal e, idealmente, que uno se pudiera hacer en su casa la prueba, a muy bajo coste y con la suficiente fiabilidad al menos para un cribado.

Los parámetros clave de una prueba: la sensibilidad y la especificidad

Si nos ceñimos al uso de la IA para el diagnóstico médico, la sensibilidad de una prueba en la que se basa una predicción automática (aunque es válido sin IA, con predicción humana), se refiere a su habilidad para detectar las personas que tienen una determinada enfermedad, mientras que la especificidad se refiere a la capacidad de la prueba de identificar correctamente a aquellos que no tienen una enfermedad.

Para fijar conceptos, si de 100 personas que se sabe están enfermas, 56 salen positivos, la sensibilidad de la prueba es del 56%. Si, por el contrario, se hace la prueba a 100 personas que se sabe que no están enfermas y 90 salen negativos, entonces su especificidad es del 90%.

El tema tiene una cierta complejidad, especialmente cuando consideramos que existe en algunos tipos de pruebas un tercer caso, el de los resultados indeterminados. En la siguiente figura se definen de forma gráfica ambos conceptos.

Fuente: adaptado y traducido parcialmente de wikipedia

Así que, en general y simplificando un poco para evitar las matemáticas, una prueba con una alta sensibilidad permite, cuando el resultado es negativo, descartar con bastante fiabilidad que la persona sometida a la prueba tenga la enfermedad (o en este caso la inmunidad), CUANDO LA MAYORÍA DE LA POBLACIÓN NO ESTÁ INFECTADA.

Fuente: Wikipedia. Mediciones de inmunidad con alta sensibilidad se pueden usar para discriminar las personas que no son inmunes (y, por tanto, susceptibles de infectarse) cuando el resultado es negativo.

Recíprocamente, una prueba con una alta especificidad que tenga un resultado positivo es un indicador muy fiable de que el sujeto probado tiene la enfermedad (o la inmunidad para el caso), ya que la prueba raramente da falsos positivos en sujetos sanos, pero SÓLO EN EL CASO DE QUE UN PORCENTAJE APRECIABLE DE LA POBLACIÓN, -POR ENCIMA DEL 20%-, ESTÉ INFECTADO (o en este caso sea inmune).

Fuente: Wikipedia. mediciones de inmunidad con alta especificidad se pueden usar para discriminar las personas que son inmunes (y por tanto no susceptibles de infectarse) cuando el resultado es positivo.

Lo que no quiere decir, en ningún caso, es lo que mucha gente piensa que sucede en el contexto actual del COVID-19 y es que por tener una prueba diagnóstica una sensibilidad y una especificidad alta, un resultado positivo en una prueba rápida, en este caso de presencia de anticuerpos del COVID-19, quiere decir que esa persona sea inmune al coronavirus con una alta probabilidad, como a continuación pasamos a examinar, ya que las consecuencias de tomar pocas precauciones bajo esta premisa falsa, puede acabar en infección y en un pequeño porcentaje de casos incluso en muerte.

El hecho de dar positivo en la prueba de inmunidad, no nos debe hacer abandonar el uso de la mascarilla y la distancia social, al menos hasta que una gran parte de la población haya pasado la enfermedad.

Lo relevante es el poder predictivo positivo de la prueba. Loa al reverendo Thomas Bayes.

La sensibilidad y la especificidad son dos indicadores relacionados con la prueba, no con la prevalencia de la enfermedad en la población, es decir con cuantas personas enfermas hay en la sociedad en un momento dado, lo que, a efectos de la salud pública es el dato relevante. Este último matiz lleva a la confusión descrita más arriba. La gente confunde la sensibilidad o la precisión (ver a continuación) con el término valor predictivo positivo (VPP).

La precisión (accuracy) de la prueba, es el porcentaje de verdaderos positivos y verdaderos negativos correctamente identificados sobre el total de positivos y negativos ensayado, pero este término hace referencia a la bondad de la clasificación correcta sea esta positiva o negativa, pero no nos dice nada sobre la probabilidad de estar infectados o inmunizados, por lo que para nuestra discusión no debe preocuparnos y podemos olvidarnos de ella, aunque naturalmente una precisión mayor da una idea general de resultados más fiables en positivos y en negativos.

Para entender este concepto de valor predictivo positivo (y también el negativo), nos hemos de remontar a 1750, cuando el reverendo presbiteriano Thomas Bayes publicó un ensayo en el que demostraba cómo se podía deducir la probabilidad de la causa de algo a partir de conocer la probabilidad de sus efectos, problema conocido en ese tiempo como el de la “probabilidad inversa”. Esta probabilidad inversa es anticausal (va en contra de cómo suceden temporalmente las cosas) y por lo tanto nuestro cerebro no se maneja bien con ella, a  diferencia de la probabilidad directa, que es la que siguen las relaciones causa-efecto que nuestro cerebro usa constantemente para predecir el futuro y que ningún sistema de IA en un entorno real de operación puede replicar hoy en día (y dicho sea de paso, es una de las causas de por qué estamos tan lejos aún de tener una “inteligencia artificial general” o AGI).

Como nota cultural, conviene saber que lo que Bayes quería probar tenía un origen teológico, a saber, ¿cuánta evidencia necesitamos para convencernos de que algo que considerábamos improbable había sucedido realmente? En particular, quería rebatir el ensayo de 1748 “sobre los milagros”, del filósofo David Hume en el que decía que los testimonios de testigos nunca podrían probar que un milagro había ocurrido (sin llegar a decirlo, para que no lo metieran en la cárcel por blasfemo, Hume se refería a la resurrección de Jesucristo). Aunque los detalles para llegar a la siguiente afirmación exceden del ámbito de nuestra discusión, tomo prestado el razonamiento de Judea Pearl, para señalar que esta fórmula de Bayes también implica que cuanto más sorprendente es la evidencia, es decir, más pequeña es la probabilidad de la evidencia:  P(evidencia), más convencido debería estar uno de la causa, es decir mayor probabilidad de la causa:  P(causa). De acuerdo con Bayes (aunque no lo dijo explícitamente, ya que en ese tiempo había que medir muy bien lo que se decía), si la evidencia es un milagro (“Jesús se levantó de entre los muertos”,) y la causa (“Cristo es Hijo de Dios”) está relacionada íntimamente con la evidencia, entonces nuestro grado de creencia en la causa debería incrementarse dramáticamente, si sabemos que la evidencia es cierta (porque la hemos visto con nuestros propios ojos). De ahí el gran valor probatorio que le conferían los redactores del Nuevo Testamento a su propio testimonio visual. Puesto de otra forma, el teorema de Bayes, nos permite implementar el último paso del método científico en un entorno real con incertidumbre.

Fuente: propia. El método científico visto de otra manera.

Pero, con independencia de las motivaciones originales de Bayes, sus hallazgos, conocidos como el Teorema de Bayes, siguen utilizándose profusamente en el campo de la IA más de 250 años después, ya que generalizaciones de este teorema con muchas variables, conocidas como redes de Bayes (o redes de creencias), que se aplican a largas y complejas cadenas de relaciones entre variables (unas veces causales y otras no), son la clave en la que se sustenta gran parte de la IA en entornos de incertidumbre que hay en la actualidad.

Por ejemplo, un vehículo autónomo que tenga que decidir entre varias rutas posibles, si sabe que de repente, hay un problema en alguna de ellas, que por ejemplo hace que haya que circular más lento por un tramo, podría usar el teorema de Bayes para elegir una nueva ruta sujeto a que ha incorporado una nueva información y es posible que a la luz de ello la ruta óptima sea otra.

Y volviendo a nuestra discusión sobre el diagnóstico de enfermedades, en vez de hablar de si se tiene o no el COVID-19, cosa que no podemos observar directamente, las pruebas diagnósticas rápidas lo que detectan por diversos métodos como hemos visto, es si se es inmune a la enfermedad, porque se disponen de los anticuerpos necesarios en cantidad suficiente, lo cual si es observable por nosotros.

Podemos usar una calculadora de inferencia estadística que viene a realizar lo que se expresa en el citado cuadro sobre Bayes y en algunos casos, además, da información gráfica útil. Recomiendo ésta (en inglés) por la información gráfica y ésta más sencilla (también en inglés). El valor predictivo positivo es la probabilidad de ser inmune una persona, sujeto a que haya salido positivo en la prueba, es decir: P(Inmune/+).

Pero todas estas calculadoras necesitan de tres datos: la sensibilidad y especificidad de la prueba, de la que ya hemos hablado y de la prevalencia de la enfermedad en la población (o de su inmunidad en este caso) en la población.

Para hacer las comparaciones, vamos a usar el kit del fabricante Heales, que es una prueba rápida combinada COVID-19 Anticuerpo IgG / IgM (oro coloidal), con las siguientes especificaciones:

Fuente: Biogen.es. Datos de la prueba rápida de anticuerpos.

Y las estimaciones de personas inmunes entre los que nos movemos en la actualidad, son los siguientes (sobre una población en España según el INE a 1 de julio de 2019 de 47.100.396 habitantes):

Fuente: elaboración propia


¿?: datos a 4 de mayo de 2020.

*: Suponemos de forma simplificada que todos los recuperados tiene anticuerpos porque han superado la enfermedad, mientras que los que están actualmente enfermos aun no tiene anticuerpos o no en cantidad suficiente para producir una respuesta inmune fuerte.

+: Usando la cifra de fallecidos del ministerio de Sanidad suponemos una tasa de mortalidad efectiva del COVID-19 del 1% (según previsiones de diversos expertos una vez podamos contar mejor la población realmente infectada), lo que arroja una población infectada de 2.542.800 personas y nuevamente, simplificando, que el 86% de ellos tienen anticuerpos suficientes para salir positivos en las pruebas (todos exceptos los pacientes severos y críticos), tenemos 2.186.808 infectados “inmunes”. Se trata de una estimación para saber órdenes de magnitud que no tiene en cuenta las ecuaciones diferenciales que describen la dinámica de la infección y el periodo aproximado de 30 días desde la infección hasta la recuperación.

**: El Imperial College del Reino Unido calcula en un estudio que podría haber hasta 7 millones de infectados en España, luego simplificando, el 86% de estas personas habrían desarrollado suficientes anticuerpos como para salir positivos en las pruebas rápidas.

++: De acuerdo con el planteamiento inicial del primer ministro del Reino Unido, Boris Johnson

Los lectores con vocación de expertos generalistas pueden encontrar en el cuadro al final del artículo, una explicación diferente a la tradicional, más basada en la idea de original de Bayes de actualización de nuestras creencias en la hipótesis previa al conocer nueva información, que en la estadística.

Aunque es interesante, el cuadro referido es perfectamente prescindible para nuestra explicación, aunque resulta muy reconfortante comprobar que obtenemos el mismo resultado que con la calculadora.

Como podemos observar en la tabla, el valor predictivo positivo y negativo depende de forma apreciable no sólo de lo sensible y específica que sea la prueba, sino también de cuanta gente sea inmune, es decir de la prevalencia de la inmunidad, de ahí la importancia de averiguar de forma lo más fiable posible este dato.

En el próximo artículo hablaremos sobre este asunto de la prevalencia, así como sobre las condiciones que deberían cumplir las pruebas rápidas para que, a pesar de su relativamente poca precisión, pudieran ayudarnos en el desconfinamiento gracias al uso de la IA.


EL TEOREMA DE BAYES EXPLICADO PARA EXPERTOS GENERALISTAS SIN APENAS MATEMÁTICAS

Si no eres inmune es que eres susceptible de contraer la enfermedad o directamente la padeces, aunque es posible que no hayas desarrollado síntomas (pacientes asintomáticos), o no lo hayas hecho aún (por estar en la primera semana desde la infección):

La hipótesis en este caso es que el sujeto bajo prueba es inmune. La evidencia, para ello es el resultado de la prueba, en este caso la prueba de detección rápida por cromatografía de los anticuerpos IgM/IgG.

La probabilidad actualizada de ser Inmune una persona determinada “sujeto a” que ha dado positivo P(Inmune / +) se puede escribir evitando la escritura en términos de probabilidades condicionales:

 P(Inmune / +) = “relación de verosimilitud” x probabilidad previa de ser Inmune

La probabilidad previa de ser inmune es la prevalencia de la inmunidad en la población, es decir, antes de hacer la prueba a alguien, lo que sabemos es que la P(Inmune)= prevalencia de la Inmunidad = nº casos registrados /población total.

Y la llamada “relación de verosimilitud” es:  

Donde P(+/Inmune) es la sensibilidad de la prueba, es decir la probabilidad de que siendo inmune te salga positiva la prueba.

¿Y cuál es la P(+)? es la probabilidad de que la prueba sea positiva? (porque se es inmune o por un falso positivo).

La probabilidad de que tengamos un falso positivo, P(+/ No inmune)= 1- p(-/ No inmune), es decir, es la probabilidad complementaria a la especificidad de la prueba, que es p(-/ No inmune)) Es decir, que será la suma ponderada entre la sensibilidad de la prueba y la P(+/ No inmune), que es denominada tasa de falsos positivos. Y ha de ser ponderada porque en general hay muchísima más población no inmune que inmune (al menos en estos momentos y en un futuro previsible), por lo que la probabilidad de que un positivo en la prueba de inmunidad al azar debe estar mucho más influenciada por las personas no inmunes, que por las personas que sí son inmunes, esto es su prevalencia. Es decir, que  esta P(+) será generalmente (en estos momentos) un valor muy cercano a la falsa tasa de positivos, que en el kit de este ejemplo es del 2% para IgM (100%-98%) y del 4% para el IgG (100%-96%).

Lo que dice el teorema de Bayes es que la nueva evidencia surgida al hacer la prueba (que ha dado positiva) aumenta la probabilidad de la causa (que se es inmune) en una cantidad fija, sin importar cual fuera la probabilidad previa de ser inmune.

Y esta cantidad fija, mide como de más probable es una prueba positiva en gente inmune que en la población en general. Y esto es una media ponderada, como se ha dicho anteriormente. Y en este punto hemos de pagar un precio por evitar (casi completamente) las matemáticas sobre probabilidades condicionales, de manera que nos hemos de creer que, manipulando el teorema de Bayes, se puede escribir en términos sencillos la relación de verosimilitud en función de la sensibilidad, la especificidad de la prueba y la prevalencia en la población:

Lo que nos interesa a nosotros para poder controlar adecuadamente el desconfinamiento, es cuál es la probabilidad de ser realmente inmune si damos positivo en una prueba p(Inmune/+)^:

P(Inmune / +) = “relación de verosimilitud” x probabilidad previa de ser Inmune =

(obtenemos el mismo valor que con la calculadora de inferencia estadística.¡Bien!)

¡Ojo con pensar que se es inmune y quitarse la mascarilla!

^: suponemos kit de anticuerpos IgM/IgG del fabricante Hales descrito más abajo para IgG y una prevalencia, según la tabla en base al número de recuperados que habían enfermado (0,26%) a 4 de mayo de 2020.

Posted by santiago

Deja un comentario