Cuando el coronavirus tiene una secuencia ajena

Poco antes de las vacaciones, un seguidor y oyente me pasó un enlace a un tweet en el que se destacaba que en la secuencia del coronavirus se encuentra una secuencia del VIH. Eso demostraba, según la persona que escribía el tweet y el hilo, que el coronavirus es un virus artificial creado en el laboratorio. Lamentablemente, en el momento no guardé la captura del tweet y el hilo ha sido borrado. Ahora parece que la persona que lo escribía tiene nuevas hipótesis que implican más virus.

En este post voy a guiar a quien lo lea por el razonamiento y la búsqueda, con una serie de capturas y con datos suficientes para que cualquiera pueda reproducirlo en su casa. El único punto de partida es la búsqueda inicial, ya que no sé cómo se llegó a localizar inicialmente la secuencia. El caso es que, en cuanto vi la secuencia, en mi cabeza que tiende a memorizar secuencias de aminoácidos, rápidamente se encendió una bombillita que me dijo «esta secuencia me suena». Pero no adelantemos acontecimientos. Vamos por pasos.

La secuencia X… ¿Está en el coronavirus?

La secuencia que vamos a analizar, y que vamos a llamar X por ahora, es la siguiente: GYIPEAPRDGQAYVRKDGEWVLLSTFL. Un conjunto de aminoácidos que desde luego no pueden aparecer en dos virus completamente diferentes por puro azar. Se podría explicar si los dos virus fuesen de la misma familia, pero no es el caso. Lo primero que vamos a hacer es comprobar que dicha secuencia está depositada en secuencias del coronavirus. Para ello usamos blast, una herramienta online de búsqueda de secuencias (podéis hacerlo aquí). Hay que asegurarse de que la opción seleccionada es blastp, para comparar proteínas. Ahí pegamos la secuencia en la caja correspondiente y en organismo especificamos que SARS-CoV-2. Le damos a buscar y efectivamente los resultados muestran que existe, siendo este el primer resultado, pero apareciendo en otras muchas secuencias depositadas:

Esto nos muestra, sin lugar a dudas, que esa secuencia se encuentra casi al final de la cadena B de esa glicoproteína spike depositada. Concretamente, en las posiciones 1303 a 1329 de un total de 1380.

La secuencia X y el VIH

El siguiente paso es comprobar que efectivamente se encuentra en el VIH. Para ello, volvemos a la pantalla inicial (podemos editar la búsqueda) y en este caso en el apartado del organismo elegimos HIV-1. El resultado, nuevamente, es evidente:

Aquí vemos que la secuencia se encuentra en un trímero asociado a la proteína gp41. El caso es que si analizamos el resto de resultados, empiezan las dudas… llama especialmente la atención el tercer resultado:

¿Ébola? Esto parece más grave de lo que podría parecer inicialmente, porque aquí ya no estamos hablando de que la secuencia X haya sido potencialmente trasladada del VIH al coronavirus, es que parece que está en más virus. ¿Será cierto? Vamos a analizarlo…

Otros virus con la secuencia X

Para salir de dudas, volvemos a la pantalla inicial y esta vez no especificamos qué virus queremos analizar. El apartado de organismo lo dejamos en blanco. Y aquí viene la sorpresa… o no.

Ahora vemos que la secuencia se encuentra, al 100%, en un virus de E. coli, en adenovirus, en un virus porcino, en uno felino, en MERS y hasta en un coronavirus de pangolín. Lo único que todos los resultados parecen tener en común es que parece que siempre se refieren a proteínas Spike. ¿Por qué será?

Foldon trimérico, la primera solución y la más sencilla

Efectivamente, la solución la encontramos aquí, en el primer resultado que se obtiene sin especificar organismo. La secuencia X, realmente pertenece a un dominio denominado Foldon que se encuentra en la fibritina del bacteriófago T4, que infecta E. coli. Se trata de un dominio natural, que se añade a otras proteínas triméricas para estabilizarlas cuando se expresan fuera de su contexto natural y que trimericen correctamente. Aunque quizá se me escape algún artículo previo, creo que la primera vez que se describió el uso fue en el año 2001 en este artículo.

Eso resuelve rápidamente por qué yo reconocía la secuencia, y es que tras años trabajando con fibras de bacteriófagos, una acaba memorizando lo que lee. Aunque se empezó a usar hace 20 años, desde entonces el dominio foldon se ha añadido a las proteínas spike de casi cualquier virus que tenga spikes triméricas, para poder expresarlas en el laboratorio en su forma trimérica sin necesidad de expresar otras proteínas del virus, pudiendo aislarlas del resto sin perder su trimerización y ayudando a que se mantengan estables.

Entonces… ¿está o no está?

Como dije tras el primer resultado, esta secuencia X, que ahora sabemos que se llama foldon, se encontraba justo al final de la secuencia de coronavirus depositada. Estar está, pero no pertenece al coronavirus. Los resultados que obtenemos tras una búsqueda en Blast incluyen, además de las secuencias de los virus completos, las secuencias de todos aquellos vectores de expresión y proteínas con las que se ha trabajado en laboratorios para estudiar las proteínas del virus individualmente. Si hubiésemos profundizado en los resultados, es lo que habríamos obtenido. Podemos comprobar que no está en el virus si vamos a la secuencia original depositada de Wuhan (aquí), le damos a «Run Blast» y ahí, tras seleccionar la pestaña de blastx (porque vamos a comparar ácido nucleico con proteínas), le pedimos que alinee dos secuencias y en la segunda caja ponemos la secuencia del foldon:

Nuestro resultado indica que esos 17 aminoácidos, no se corresponden con el resultado. Además, si profundizamos en aquel primer resultado de la cadena B del coronavirus, hacemos clic en la referencia y buscamos el artículo de la referencia, en su material suplementario indican claramente que han añadido el dominio de trimerización del bacteriófago T4. Vamos, que no se trata de una conspiración ocultando datos, está todo ahí delante. La secuencia está en lo que se depositó porque se añadió después, no porque pertenezca al virus. Y eso se hizo para estudiar la spike en el laboratorio, aislada y completamente inofensiva.

¿Conclusiones?

Además de quedar claro que el VIH y el coronavirus no comparten esos 17 aminoácidos, lo que deberíamos reflexionar es la forma en la que se nos presentan los datos. Aquellas personas que puedan haber creído que los resultados de las primeras capturas demostraban algo creían tener datos para ello. Para poder demostrarle que los datos que tienen son parciales y que además existe un sesgo (por buscar lo que se quiere encontrar al limitar la búsqueda al virus concreto), es necesario enseñar el resto de datos y argumentar que esa afirmación es errónea con otros datos. Si yo pido que se me demuestren las cosas con datos y estudios previos, no puedo decirle al contrario que se equivoca porque yo lo diga. Tendré que demostrar con datos mi hipótesis.

Dicho eso, me parece especialmente llamativo que alguien haya localizado esa secuencia sin tener ni idea de qué se trata, y que realmente haya podido llegar a la conclusión de que es un complot… porque un plan oscuro para «introducirnos el VIH con la vacuna del Covid» (que lo he leído en varias ocasiones) no se sostiene si la supuesta principal prueba, esa secuencia, se ha utilizado de forma rutinaria para trimerizar proteínas en laboratorio y se han publicado cientos de artículos haciendo referencia a ello.

Si pretenden demostrar que esa secuencia supone un problema de algún tipo, serán necesarios datos que lo apoyen. Por ahora, lo que podemos afirmar es que no se ocultan cosas en la secuencia, ya que está disponible para que cualquier la analice. Desde luego, el bombazo que se decía tener en el tweet original… no es que sea mucho bombazo. Quizá por eso el hilo ha sido borrado.

Si has llegado aquí con dudas, o hay algún aspecto que genere dudas, los comentarios están abiertos para analizar los datos. Es posible que si repites el análisis los resultados no sean exactamente iguales porque se hayan depositado más secuencias desde el momento en el que yo las analicé, pero las conclusiones serán las mismas.

Además de compartir esta entrada con aquellos a los que les pueda resultar interesante la información, te puedes suscribir a mi newsletter para no perderte otros temas y ayudarme a seguir aquí. O puedes apoyarme de otras formas, como con un café:

Deja un comentario

A %d blogueros les gusta esto: