Tuesday, May 05, 2009

Diversidad nucelotídica del virus de Influenza A H1N1 / Nucleotide Diversity of Influenza A H1N1

Nucleotide diversity comparison between the dataset of "swine" influenza A/H1N1 2009 and the 90's NewYork A/H3N2 human influenza outbreak. First column is the set with the uncut, complete sequences. Second column is the set with only the region shared by all sequences. The 2009 sequences are much less diverse, and no sites under selection are found. Data available below.

Insisto de nuevo que no soy virólogo. Soy biólogo y me dedico a la evolución y ecología molecular de comunidades bacterianas. Pero eso no quita que podamos analizar las secuencias disponibles en caso de una emergencia sanitaria. Así pues, y mientras califico los ~40 exámenes de los alumnos de Evolución Molecular, me puse a sacar los parámetros clásicos de diversidad para los tres segmentos de la influenza A H1N1 (HA, NA y MP) más abundantes en el GenBank hasta hoy. Se los dejo en la tabla de aquí. Las dos primeras columnas corresponden al juego de datos completo pero sin secuencias fragmentadas (long) y al juego de datos recortado para las regiones compartidas por todas las secuencias.

En la última columna los comparo con un juego de secuencias disponibles tras la epidemia de influenza en Nueva York en los 90's. El virus es otra variante (A/H3N2), pero es el único reciente que infecta a humanos y que hay muchas secuencias disponibles (o no se buscar secuencias de virus, que también es posible). Lo que dice la tabla es que las secuencias de A/H1N1 con las que contamos son menos diversas (Pi y Theta) que las secuencias de NuevaYork, aunque eso puede deberse a que 1) la muestra sigue siendo muy pequeña o 2) las secuencias de NewYork comprenden toda la temporada (uno o dos años), y las de A/H1N1 sólo las últimas 3 semanas. Por otra parte, la D de Tajima no es significativa en ninguno de los casos, lo que sugiere que se explica por un modelo neutral. El análisis por ventanas no revela sitios bajo selección. Si tengo tiempo, ampliaré ésta discusión y la existencia de las cuasiespecies virales. Las alineaciones disponibles aquí:

SecuenciasFASTA/FASTAsequences.zip

4 Comments:

Panda en la bañera... said...

Bueno...yo no entendí tanto esta entrada...pero le dejo un texto que está interesante:

http://raulfuentes.blogspot.com/2009/05/esto-lo-publico-ja-en-su-blog-y-me.html

El autor se llama Jorge Atala. Me parece una aproximación psicoanalitica bastante interesante...mejor que la conspiración del shock (odio ese video tanto, me parece 100% manipulación, como Javier Alatorre o Carlos Loret de Mola).
Saludos.

Cínico said...
This comment has been removed by the author.
zercath said...

grandioso sitio

sildenafil citrate said...

Al igual que vos soy biólogo y trato con ecología molecular de comunidades bacterianas. Pero eso no elimina que podamos analizar las secuencias disponibles en caso de una emergencia sanitaria.