Saturday, August 20, 2011

Inmolación bacteriana con conciencia ecológica

ResearchBlogging.org Saeidi N, Wong CK, Lo TM, Nguyen HX, Ling H, Leong SS, Poh CL, & Chang MW (2011). Engineering microbes to sense and eradicate Pseudomonas aeruginosa, a human pathogen. Molecular systems biology, 7 PMID: 21847113

Uno de los más grandes retos de la medicina y biotecnología de éste siglo es desarrollar alternativas al uso de antibióticos para combatir infecciones bacterianas. Si bien la aplicación de antibióticos durante el siglo pasado cambió por completo tanto la esperanza de vida de las poblaciones con atención médica como el estilo de vida mismo de las poblaciones humanas, muchas cepas bacterianas han desarrollado resistencia contra algunos antibióticos, y algunas pocas como Staphylococcus aureus (MSRA) o Pseudomonas aeruginosa han desarrollado resistencia a múltiples antibióticos. Esto se convierte en un problema de salud pública severo cuando los dos organismos mencionados resultan ser las causas más frecuentes de infecciones en hospitales. Es decir, en aquellos lugares donde abrimos a la gente, existen dos bacterias patógenas que no podemos combatir. Es por esto que en la actualidad de destinan muchos recursos (en tiempo, dinero y cerebro) a la búsqueda de alternativas en la guerra contra las bacterias infecciosas.

El grupo encabezado por Chueh Loo Poh, de la Universidad Tecnológica de Nanyang en Singapur, se puso a pensar en cómo hacer para combatir a la antes mencionada Pseudomonas aeruginosa, una gammaproteobacteria que es un parásito oportunista (o sea que se aprovecha para infectar cuando nuestras defensas están bajas, por ejemplo tras una cirugía). Generalmente se encuentra en los tractos respiratorios y gástricos, y todavía es una de las principales causas de muerte en hospitales de pacientes con inmunodeficiencias como cáncer, fibrosis cística y VIH.

En el artículo de Nazanin Saeidi publicado en Molecular Systems Biology, el grupo de Poh aplica principios de ingeniería a la biología sintética, encargada de desarrollar organismos que lleven a cabo funciones que no existen en la naturaleza. En este caso, utilizan al organismo mejor estudiado, la enterobacteria Escherichia coli, y la modifican genéticamente para atacar a P. aeruginosa aprovechando tres características naturales de estas dos bacterias:

La primera, es la habilidad de P. aeruginosa para medir su propia densidad poblacional. Es decir, para censar su propia población (como el INEGI). Las bacterias solitarias se van a comportar de una manera muy distinta a cuando están en  bola. Por ejemplo, solitas van a moverse mucho en búsqueda de alimento y se van a reproducir rápidamente. Cuando encuentran alimento y su población aumenta, no necesitan flagelos para su motilidad y deciden reproducirse más lentamente ("pocos hijos para darles mucho") y crecen en bola, secretando entre todas un moco que les proteje. Pero para hacer éstos cambios tienen que saber cuántas son. Su manera de conocer el tamaño de su población es la siguiente: cada célula secreta una proteína como señal química en concentraciones muy pequeñas, y a su vez tiene en la membrana miles de receptores de ésta misma señal. Si está sóla, va a recibir la señal de pocas proteínas. Cuando son muchas, la concentración de la señal química aumenta y los receptores en las membranas de las células detectan muchas proteínas. Cuando la cantidad de proteínas detectadas supera cierto límite, se induce un cambio fisiológico en la célula. Éste proceso se conoce como "quorum sensing", algo así como "censando el quórum". La palabra quorum viene del latín "de quién", y se utiliza en derecho para referirse a la cantidad mínima de personas necesarias para aprobar un decreto.

La segunda son las armas de guerra propias de P. aeruginosa. Éste inocente angelito produce bacteriocinas, unos péptidos antimicrobianos que matan a otras bacterias que compiten por los mismos recursos que P. aeruginosa. Las bacteriocinas atacan sólo a los parientes cercanos de P. aeruginosa porque son éstos los que compiten más fuertemente por sus mismos recursos, y a la fecha no se ha detectado que las bacterias se hagan resistentes a ellas. El grupo de Poh determinó anteriormente que la Pyocina S5 es una bacteriocina efectiva contra aislados clínicos de P. aeruginosa pero no contra E. coli.

La tercera es la habilidad suicida de Escherichia coli para reventar su propia membrana celular bajo condiciones de estrés ambiental, mediante una proteína pequeña llamada proteína de lisis E7 que desestabiliza la cara interna de la membrana celular. Ésto permite que las proteínas sintetizadas en el interior de la célula sean eficientemente exportadas al exterior.

En resumen, el equipo construyó un plásmido que contiene 1) el gen del receptor lasR de la señal química del "quorum sensing" de P. aeruginosa, 2) el gen de la Pyocina S5 y 3) el gen de la proteína de lisis E7. En éste plásmido, los genes de la Pyocina S5 y de la proteína de lisis E7 tienen un activador por quorum sensing llamado luxR. Es decir que tanto la bacteriocina como la proteína de lisis se van a producir sólo cuando se detecte una cierta cantidad de la señal química propia de P. aeruginosa (3OC12HSL). Y éste plásmido fue introducido en E. coli.

Diagrama del sistema. (c) Nature Publishing Group 2011                                http://www.nature.com/msb/journal/v7/n1/full/msb201155.html

Entonces el sistema funciona así: la Escherichia coli construída vive feliz de la vida como toda E. coli normal y corriente, hasta que se encuentra con P. aeruginosa. Si se encuentra con una no pasa nada, no hay que exagerar. Pero si la población de P. aeruginosa crece, la concentración de la seña química crece también. Normalmente, los receptores naturales luxR propios de P. aeruginosa detectarían esta concentración e inducirían cambios en su comportamiento, pero no cuentan con que la E. coli singapurense tiene el mismo luxR y por lo tanto detecta también la nueva concentración. Es decir, E. coli espía el crecimiento poblacional de P. aeruginosa con los propios ojos de P. aeruginosa.  Pero en E. coli, lo que se va a inducir es primero la producción de la Pyocina S5, mortal para P. aeruginosa pero inocua para E. coli. El problema es que la Pyocina S5 es una proteína de Pseudomonas, y E. coli no cuenta con el complejo sistema de secreción, de manera que la Pyocina S5 será producida y almacenada en las células de E. coli sin afectar a P. aeruginosa. Hasta que la concentración de la señal química de P. aeruginosa es tal que se activa la producción de la proteína de lisis E7 también por el sistema de quorum sensing de luxR que se encuentra en el plásmido de la E. coli construída. De esta manera, cuando la población de P. aeruginosa supera cierto tamaño (y por lo tanto su señal química supera cierta concentración), las células de la E. coli van a explotar liberando la Pyocina S5 en altas concetraciones y aniquilando la población de P. aeruginosa.  El sistema es eficaz in vitro, inhibiendo el crecimiento de P. aeruginosa de vida libre en un 99% y en un 90% cuando crece en biofilm.

¿Porqué tanto escándalo? Por muchas cosas. Primero, porque es una bonita forma de atacar un problema antiguo. Segundo, porque utiliza un sistema muy simple y elegante (simple IS beauty). Tercero porque utiliza las mismas armas de P. aeruginosa en su contra. Cuarto porque es una aplicación real y práctica de la biología sintética (llamada biotecnología hace diez años). Y quinto porque es una manera inteligente de reconocer un problema real, médico, humano, y proponer un resultado producto del conocimiento de la historia natural del organismo.

Finalmente,  cuando se diagnostica una infección por P. aeruginosa en un hospital, se combate generalmente con un coctél de múltiples antibióticos (para no errarle pues). Ésta aproximación tiene dos efectos indeseados: uno, que en teoría se puede promover la selección de cepas que sean resistentes a TODOS los antibióticos conocidos, favoreciendo la aparición de una Pseudomonas malisísima que no podamos combatir. El otro es que en nuestro cuerpo tenemos muchas bacterias diferentes que viven sobre nosotros y nos ayudan y protegen de un sinfín de amenazas. Por ejemplo la microbiota intestinal que nos ayuda a digerir alimentos que nosotros no podemos aprovechar por nosotros mismos. Y cuando uno utiliza un coctél de antibióticos, los que terminan pagando los platos rotos son las bacterias de la microbiota, con efectos contraproducentes para la salud del paciente. El sistema propuesto es muy específico contra las Pseudomonas indeseadas simplemente porque viene de esas mismas Pseudomonas indeseadas, y promete tener un bajo impacto negativo en otras bacterias. Es decir, que es una alternativa médica con conciencia ecológica.


Thursday, May 06, 2010

Better the metagenome you know than the metagenome you don't...

ResearchBlogging.org
Morgan, J., Darling, A., & Eisen, J. (2010). Metagenomic Sequencing of an In Vitro-Simulated Microbial Community PLoS ONE, 5 (4) DOI: 10.1371/journal.pone.0010209

A new era for the design of metagenomic controls starts! Morgan et al. present the benchmarking of metagenomic tools using artificial "microbial communities" mixed up in the lab.

The Hook...
Metagenomics is a fancy name for what's actually a large and obscure toolbox of molecular biology procedures and computational algorithms that promises to help us in the understanding of whole, natural microbial communities. It is so exciting because it allows us to study organisms (bacteria and archaea specifically) that would otherwise remain unacknowledged because we cannot grow them in the lab. It also provides for the first time the opportunity to analyse whole natural communities, and not only sectors of it (like "granivorous community" or "photosynthetic guild"). The comparison of natural functional communities would help us understand a lot about how communities are assembled, how they evolve and change in time and how are they affected by external disturbances.

Having said that, we still lack the tools to analyse such large databases and the quality standards to produce and compare metagenomes. This happens each time a new technology appears, because there has been not enough time to try and experiment with it as to accurately know its flaws. This is even worse with metagenomics since no whole community has ever been studied and so we don't really know or even suppose how our data should look like. Here's where Morgan et al. come to rescue with a very neat approach.
The Setting...
Their logic is simple and clear: since we do not have any community whose composition is completely known, let's make one. So they retrieved ten different microorganisms from the culture collections whose genomes have already been sequenced, and prepared aliquots so that they would have the same number of cells from each organism. Then they mixed them up, extracted the whole community DNA with three different DNA-extraction protocols and then sequenced four metagenome databases (one was replicated with an alternative sequencing method).

The Bad...
Surprisingly, none of the sequenced metagenomes reflected the original composition of the community mix. This can be caused for a number of reasons: the size of a genome and the number of genome copies per cell affect the probability of sequencing; differences in cell wall and matrix thickness and composition could prevent efficient DNA extraction; specific DNA segments might be harder to clone and/or sequence... When they compared between metagenomes, they found that most differences were due to the type of DNA extraction utilized. That is, the same community will result in different metagenomes when different DNA extraction methods are used. This also means that metagenomes obtained with different DNA extraction protocols should not be compared. Ever.

It still puzzles me one thing: the love for BLAST. Even when they assigned each sequence to a specific organisms by "blasting" each read from the metagenomes to the ten complete genomes of the organisms in the mix, there's a large number of sequences that could not be mapped back to the source organism. Sure, there seems to be a phage infecting some cultures that was not in the sequenced genome. But it is surprising that there was a large number of reads that actually hit a Bacillus, when there were five Lactobacillus strains in the mix. My point is that BLAST is a very poor algorithm to recover precise hits, and the short lenght of the sequences reduce the taxonomic resolution attainable by it, misleading the results. If we add a really biased and incomplete reference database, it ends up being almost impossible to accurately define the genomic composition of a natural community. This also calls for better and more precise methods of assigning or binning of metagenomic sequences.

The Good...
Since "all different" is not a very hopeful result, they prepared three replicas of each DNA extraction method so to say which of them showed a lower variability and hence would be more reliable. It turned out that the DNA kit extraction protocol has a larger repeatability, most likely because there's a lower variation in reagent concentrations.
And then again, although there's large variability inter- and intra- protocol, there are no radical changes in the relative abundance of each organism. That is, there is no change from the dominance of one organism to another. Although they're still not reflecting the "true" abundances.

The Ugly...
One of the samples was sequenced twice, one time with classic Sanger capillary sequencing and the other with pyrosequencing. This helped them to show that differences between extraction methods are far greater than differences between sequencing platforms. Still I sensed a bit of anti-pyrosequencing in it. Sure, pyrosequencing gives shorter reads and so a larger amount of reads will be unassignable to reference organisms (at least by BLAST standards). But I'm not sure that these results actually demonstrate that cloning-bias is not so important. It would be necessary to repeat each sample with pyrosequencing to demonstrate this. And it would be also great to replicate the same example as they did with Sanger. This would actually show how much of this variability is really attributable to DNA extraction and how much of it is attributable to cloning bias.

The Finale...
We desperately need more research like this, that would help us not only to standarize the technology behind metagenomics but also allows to build the robust theoretical framework that metagenomics (and community ecology in general) is so in need. This kind of work should be complemented with in-silico modelations of metagenomes (like that in Mavrommatis et al. 2007), and also with the development of better algorithms to cluster and assign taxonomy to sequenced reads.
After all the metagenomic hype, we still do not know the true structure and composition of sequenced microbial communites. But we do know a lot more than before.

Tuesday, September 15, 2009

Baños de pureza... y micobacterias

Thanks to Kim Ross from Pace's Lab for pointing this paper out.

ResearchBlogging.orgFeazel LM, Baumgartner LK, Peterson KL, Frank DN, Harris JK, & Pace NR (2009). Opportunistic pathogens enriched in showerhead biofilms. Proceedings of the National Academy of Sciences of the United States of America, 106 (38), 16393-9 PMID: 19805310

"Cantando en el baño, me acuerdo mucho de tí..." decía Tintán.

Y desde ahora también de Mycobacterium avium (link en español), un grupo de bacterias pertenecientes al grupo de las Actinobacteria. Éstos están caracterizados por tener una compleja pared celular repleta de ácidos micólicos conocida como ácido-resistente [totalmente diferente de las Gram(+) y Gram(-)]. Ésta gruesa pero flexible pared disminuye el tráfico de compuestos entre la célula y su entorno, aumentando la capacidad de retención de agua dentro de la célula y evitando la incorporación de compuestos tóxicos, como por ejemplo antibióticos y antibacteriales, lo que hace de éste organismo una bacteria sumamente resistente.

Pared celular de las mycobacteria

M. avium es lo que se conoce como un patógeno oportunista, es decir que puede infectar humanitos pero sólo cuando éstos se encuentran inmunodeprimidos (con fibrosis cística, VIH, y según algunos doctores, !con depresión!). Tan excéntrico es éste personaje que disfruta de infectar las células fagocíticas (que se comen agentes externos), dejándose "comer" por el fagocito y sobreviviendo con agrado dentro de las vesículas formadas en el interior del fagocito, a pesar del coctél de enzimas vertidas en la misma vesícula con la intención de deshacer al agente infeccioso.

Colonias de Mycobacterium avium

El chiste de ésta entrada es que recientemente anda dando vueltas por toda la media la siguiente noticia: el grupo del Dr. Norman Pace , de la Universidad de Colorado, Boulder, USA (quien también fundó la microbiología ambiental), publicó recientemente en PNAS un artículo en donde reporta un análisis de la diversidad microbiana encontrada en las cabezas de las regaderas de Denver y NewYork, y resulta que el grupo de M. avium y sus parientes es uno de los mejores representados. El problema con M. avium es que generalmente se transmite por aerosoles (es decir, gotitas microscópicas de baba que salen expulsadas al estornudar o toser) que son fácilmente inhalados. Y pues resulta también que la mayoría de las regaderas producen aerosoles al atomizar el agua.

¡Pero que no cunda el pánico!: antes de correr y bañarse con tapabocas o lavar con geles "antiinfluenza" el interior de las regaderas... hay una serie de FAQ's que el laboratorio del Dr. Pace publica en su página, y en resumen dice que no hay que paniquarse, que esto sólo representa un peligro moderado para personas inmunodeprimidas y que simplemente basta con cambiar un par de veces al año la cabecera de la regadera (ojo: las mycobacteriae son generalmente resistentes a los lavados con cloro)... y en caso de que sean súper paranoicos pues tratar de substituír los componentes de plástico por componentes de metal (si claro... unos empaques de hierro son la onda).

En fin... es bonito saber que no sabemos nada y que no tenemos nada sanitizado a pesar de la necesidad de control de ciertas personas que hablan inglés y dominan al mundo.

regadera: dícese de la ducha... para los que no hablan mexica...

y les dejo un video de la noticia en gringolandia:
http://cbs2chicago.com/video/?id=62649@wbbm.dayport.com

Saturday, May 02, 2009

Filogenética de Influenza / Influenza Phylogenetics

Some links to the trees and data on the new H1N1 variant I worked on while we're on quarantine in Mexico City, on behalf on data sharing and open access. There's a much better site with analysis of real virologist here. Follow the links below.

La cuarentena citadina nos ha quitado las opciones del ocio (cines, teatros, museos, cafés y restaurantes) y la paranoia masiva nos quita opciones para socializar. Así que, aunque no soy virólogo y teniendo sólo el internet para conectarme con el mundo, me dediqué a jugar con las secuencias liberadas del virus de la influenza. Hice las filogenias de 3 segmentos antes de que ldalcaraz me indicara que un grupo de virólogos inglés hizo lo mismo que yo pero bien y sabiendo cómo se hace. Así que les dejo el link de los virólogos ingleses (http://tree.bio.ed.ac.uk/groups/influenza/) y los links a mis datos analizados. En mi filogenia incluí los segmentos de la variantes utilizadas para las vacunas del 2007 y 2008 y en donde pude las variantes de la gripe española de 1918 y la aviar del 2004. La nueva variante es pues nueva y diferente. Dado que la variante de la vacuna del 2007 no es efectiva contra la del 2008 y que la distancia entre éstas es mucho menor que la distancia entre éstas y la nueva variante 2009, es muy poco probable que la vacuna sirva de nada (lástima con la donación de vacunas de sanofi). Los tres segmentos analizados tienen orígenes distintos: HA viene de la influenza porcina clásica H1N2; NA viene de la influenza porcina de norteamérica pero éste virus a su vez viene de la influenza aviar eurasiática; y finalmente PB1 viene de influenzas porcinas (H3N2/H1N2) que a su vez eran originalmente de humano (H3N2) [Todos los árboles están en los links de abajo]. O sea que también les pasamos nosotros nuestros virus a los pobres puercos. En fin, creo que es de suma importancia darle seguimiento a todo ésto y para ello la liberación de secuencias, análisis e información es vital.

Sitio de Filogenias de Andrew Rambaut sobre la nueva variante H1N1
Andrew Rambaut's Human/Swine/H1N1 influenza A Phylogenetics site


Sitio del NCBI con todas las secuencias liberadas de la nueva variante
NCBI's flu site with all H1N1 public sequences


Alineación de HA en FASTA / HA alignment in FASTA
Alineación de NA en FASTA / NA alignment in FASTA
Alineación de PB1 en FASTA / PB1 alignment in FASTA

Árbol de HA en PDF / PDF of HA phylogenetic tree
Árbol de NA en PDF / PDF of NA phylogenetic tree
Árbol de PB1 en PDF / PDF of PB1 phylogenetic tree

Árbol de HA editable en MEGA (MTS) / MEGA format (MTS) HA tree
Árbol de NA editable en MEGA (MTS) / MEGA format (MTS) NA tree
Árbol de PB1 editable en MEGA (MTS) / MEGA format (MTS) PB1 tree

Monday, March 02, 2009

Revisión Darwin, Metagenómica y la "Nueva Ecología"

ResearchBlogging.orgGermán Bonilla-Rosso, Valeria Souza, & Luis Eguiarte (2008). Metagenómica, Genómica y Ecología Molecular: La Nueva Ecología en el Bicentenario de Darwin TIP - Revista Especializada en Ciencias Químico-Biológicas, 11 (1), 41-51

Si de por sí ya uno no podía encontrar ninguna exposición de biólogo en la que no se mencionase a Darwin, pues ahora en el susodicho Año de la Evolución lo vamos a ver hasta en la sopa...

Y yo no voy a ser el biólogo de excepción, así que me autopromociono un poco con éste bonito artículo de colección para la dama y el caballero...

Éste es una breve revisión de metagenómcia y sus recientes avances en metagenómica y la aplicación de las herramientas de la biología molecular a la ecología. A nuestro entender, los enfoques metagenómicos representan una culminación del legado de Darwin como la aproximación al mundo natural visualizando individualmente a los organismos como el producto de su historia evolutiva delineada por su funcionamiento e interacción con su entorno abiótico y con otros organismos.

Y aprovecho para desahogar lo siguiente: hoy día, las publicaciones en español y en revistas no indexadas o de difusión (aunque sea difusión para la misma élite científica) no tienen peso curricular o incluso llegan a valer puntos negativos en el SNI, así que con frecuencia los intentos por producir éste tipo de textos se ven rápidamente desalentados. Éste artículo salió en una publicación de la FES Zaragoza que, hasta donde sé, no se encuentra en la red (por cierto, vale la pena echarle un ojo a esa publicación si tienen oportunidad). Pero ayer recibimos un correo electrónico de una alumna de Coahuila solicitando el texto completo. Curiosamente, mi tesis se desarrolla en Coahuila. Así que me llena de orgullo poner a disponibilidad el pdf nuestro artículo.

¡A escribir en español, pues!

Update: Aquí está el link a la revista, aquí el original.

Wednesday, October 08, 2008

Metagenome Sequence Simulators

ResearchBlogging.orgRichter DC, Ott F, Auch AF, Schmid R, & Huson DH (2008). MetaSim: a sequencing simulator for genomics and metagenomics. PloS one, 3 (10) PMID: 18841204


An article from the Huson's Group at Tübingen University has just came out in the Open Access (and scientific publishing innovator) journal PLoS ONE, describing MetaSim, a software to produce artificial or syntetic or in silico metagenomes out of a selection of completely sequenced genomes.

This is just "heaven-sent" for me since I've been working on a set of syntetic metagenomes for the past two months, and will be happy to use this software first hand like... today. It seems that the software not only lets you choose the source genomes from a phylogenetic tree (figures reproduced here from the original article al PLoS ONE thanks to the Creative Commons License), but also choose from three different type of sequencing technology output (Sanger, 454 and Illumina) and generate theorethical metagenome.

This is the continuation of a very important change in genomic sciences, moving from experiments far too expensive or long to be replicated and hence out of hard statistical comparision, to null-model based in silico genomic analysis.

The first effort to analyze the true scope of metagenomic analysis was presented by Kostas Mavrommatis and others from the Genome Biology group at JGI (unfortunately published in an non-OA journal), where they produced three simulated metagenomes of contrasting complexity to asses assembly, gene prediction and annotation (SPOILER: the best combination assesed was Arachne assembler with Fgenesb predictor and PhyloPhytia for binning, and BLAST "performed poorly" as usual). This work also produced a database for the Fidelity of Analysis of Metagenomic Samples (FAMeS), a great effort to standarize metagenomic analysis software. A great alternative is ProxyGene annotation, as reported by the Markowitz group.

ResearchBlogging.orgMavromatis K, Ivanova N, Barry K, Shapiro H, Goltsman E, McHardy AC, Rigoutsos I, Salamov A, Korzeniewski F, Land M, Lapidus A, Grigoriev I, Richardson P, Hugenholtz P, & Kyrpides NC (2007). Use of simulated data sets to evaluate the fidelity of metagenomic processing methods. Nature methods, 4 (6), 495-500 PMID: 17468765

I'll play a little with the software and post some of my impressions here... and maybe in the original PLoS ONE webpage since it is totally open to post-publication review!!!!

You can download MetaSim at Huson's Labpage!!!

Sunday, April 13, 2008

Bacillus coahuilensis : the genomical TexMex

After a long publication struggle, two articles from two close friends have finally been published: the description of novel species Bacillus coahuilensis by my former bacteriology teacher and former owner while doing my Social Service and actually the one to blame for my adscription to the lab I work in now, René Cerritos (a.k.a. Dr. Chapultepec) in the IJSEM Journal. The other is the publication of the complete genome sequence of the very same strain in PNAS by my former schoolmate, my former Represenant in the Universitary Council and beermate Luis Alcaraz (a.k.a. The Dude). Both are the product of a weird collaboration between the CINVESTAV and LANGEBIO in Iruapuato, the Texan universities of Rice and Houston and the institutes Biotechnology and Ecology in UNAM, where I'm at.

In short:

Cuatrociénegas Valley is in a 750 m basin above sea level in North Mexico, deep in the Chihuahuan Desert and formerly a coastal region during the Jurassic. It is characterized by the presence of many oligotrophic ponds in the middle of the desert supporting large bacterial communities, appearingly from a marine origin (as shown by Souza and Desnues), that have been studied by my labgroup leaded by Valeria Souza and Luis Eguiarte (the very same place where I'm conducting my Theses). Cerritos isolated many bacilli strains from one of the widest and shallowest pond (Churince's Laguna Grande) and found many moderately halophilic species (that tolerate slightly salty envirnoments). A novel aerobic strain (m44) belonged to a group of aquatic, moderatedly halophilic species (B .marisflavi, B. aquimaris, B. vietnamensis) , and could not grow on most sugar-contaning media (uncommon for the bacilli). The team in CINVESTAV sequenced the genome (leaded by Gaby Olmedo and Luis Herrera-Estrella) and Alcaraz anotated it. He also conducted most of the sequence analises, with some help of Siefert from Rice University, Putonti from the UofH and me, during our stay in Houston a year ago. The genome turned out to be the smallest genome within bacilli with 3.35 Mbp with many mobile elements.

The most important feature of B. coahuilensis is that this is the second mexican microbial genome sequenced to date (the two bacteria genomes sequenced in Mexico are Rhizobium etli by the CCG and this), but whose sequence has been analized in the light of ecology and evolution (remember Dobzhansky's maxima?), that is, the adaptations of a formerly marine lineage to an oligotrophic lentic environment.

That is, the sequence pointed towards an adaptation to growth within low-phosphorus environment: namely the presence of sulfoquinovose synthase (sdq1) that synthesises sulfolipids to replace membrane phospholipids (which constitute around 30% of the total phosphorus), never reported before outside chloroplasts and unicellular cyanobacteria. The CINVESTAV team looked into the membrane and corroborated its sulfolipid composition.

The genome also codes for a sensory bacteriorrhodopsin gene, reminiscent of its marine origin where they are very abundant (see work by Venter and Rusch). The expression analyses proved it to be constitutive and not -light dependent, suggesting it to be an adaptation to shallow-water irradiance exposure.

Analysing the enconded transmembrane importers is a good way to analyse what the organism is uptaking for the environment, that is, it's "feeding-habits". The family of Iron-Siderophore importers is overrerpresented in B. coahuilensis, a feature shared with other aquatic bacilli, suggesting that marine bacilli actively scavenge for iron. It also show a preference for the uptake of single aminoacids and not large polypeptides, with absolute requirement of 8 aa and partial of another 5, a feature shared by the aquatic, small-genome organism Minibacterium massiliensis.

This, taken together with the fact that it has the lowest number of genes involved in nitrogen cycle, together with the experimental evidence of being incapable of utilizing a wide variety of sugars, suggests that this organism is totally dependent of the rest of the community to live on, and has evolved from a primitive bacterial component of that community with specific adaptations for a novel environment.

I'm very proud of the product of this collaboration and expect to continue this way. And also very happy because from the moment of this publication on, The Dude is able to obtain its PhD!!!

Monday, March 31, 2008

My Geek Pride is hurt: BLOSUM matrices

BLOSUM (BLOcks of Amino Acid SUbstitution Matrix) are the canonical substitution matrices used for scoring protein sequence alignments. In essence, it calculates the relative frequencies of all aminoacids in each position within an alignment and assigned a probability to the substitution of a particular residue. BLOSUM matrices built with closely related sequences are more stringent and have high numbers (BLOSUM80) indicating the percentage similarity allowed to include a sequence in the matrix (in the latter case, all proteins share at least 80% sequence identity).

BLOSUM matrices were developed in 1992 by Henikoff and Henikoff and since then have been extensively used in all analyses involving protein sequences...

and then, here comes he "AAARRGHHHH!!!"

Styczynski et al (2008) were killing their time looking at the evolution of the BLOCKS database and found the unthinkable.... an error in the source code for the algorithm that calculates de BLOSUM matrices!!!! that means... the results obtained with the available BLOSUM matrices differ significantly from the expected algorithm from Henikoff & Henikoff... merde!

Weirdest thing of all.. when corrected and tested back for the use of the matrices in database sequence search, it turned out that the "wrong" matrices performed much better in retrieving protein homologs than the "corrected" matrices.

Fortunately, it seems that though the difference is statistically significative, it is not big. That means, we haven't fucked it up so bad.

Epilogue to the blosum...

1) 16 years of extensive usage doesn't mean it is RIGHT.

2) how come that no one, ever, in 16 years, ever noticed this difference!!! THAT is what happens with dogma... when you take anything from granted

3) messing things up is not always THAT bad...

4) I didn't understand from the article if they proposed that the matrices were corrected even if they performed worse...

5) I would expect to see a huge ocean of erratas everywhere because "when using the revised blosum matrices... our results from the past ten years have completely changed!!"

Wednesday, November 21, 2007

To Metagenome or not to Metagenome

A masterpiece of science blogging was posted here (http://suicyte.wordpress.com/2007/11/20/smallest-primate-ever-discovered/), addressing the finding of primate sequences in the GOS dataset, just one of the unassesed ambiguities in metagenomics.

The post is beautifully written and made me laugh really loud. The point is that metagenomics is sometimes being overselled just in the very same way as genomics has been (see Eisen's blog for just some examples) and this leads to an skeptic counterwave.

My brief cons and pros:

a) metagenomics offers indeed the unprecedented opportunity to explore unculturable microbial diversity, which no other tool can do.

b) metagenomics is not only a technological advance like genomics was, it fits perfectly in an ecological (community/ecosystemic) theoretical background

c) no matter what everybody says, the GOS sampling has provided an incredible amount of data on previously unknown (and often unimagined) microbial diversity

d) criticisms on the amount of money spent on metagenomics seem to me like questioning the financial support on Humboldt's (or any other naturalist) voyages, which were explorative and not precisely focused on any hypothesis.

e) metagenomics is obviously error-prone, and it's biases have been poorly evaluated

f) metagenomics is much more useful in small, simple communities where a reasonable coverage can be achieved

g) metagenomics is much more useful in well known, deeply studied natural communities where it is employed to answer specific biological questions

h) metagenomics is expensive!

i) a great deal of work is still to be done on: defining parameters for comparing different samples, assessing taxonomical and functional biases, increasing assembly effectiveness and contig construction, improving functional prediction, developing tools for the analysis of such huge datasets, etc.

j) metagenomics is best when interdisciplinary, that is when it's used along with techniques and analyses from other disciplines that might provide physiological, evolutionary or ecological information

That being said, metagenomics rocks!

ResearchBlogging.orgRusch DB, Halpern AL, Sutton G, Heidelberg KB, Williamson S, Yooseph S, Wu D, Eisen JA, Hoffman JM, Remington K, Beeson K, Tran B, Smith H, Baden-Tillson H, Stewart C, Thorpe J, Freeman J, Andrews-Pfannkoch C, Venter JE, Li K, Kravitz S, Heidelberg JF, Utterback T, Rogers YH, Falcón LI, Souza V, Bonilla-Rosso G, Eguiarte LE, Karl DM, Sathyendranath S, Platt T, Bermingham E, Gallardo V, Tamayo-Castillo G, Ferrari MR, Strausberg RL, Nealson K, Friedman R, Frazier M, & Venter JC (2007). The Sorcerer II Global Ocean Sampling expedition: northwest Atlantic through eastern tropical Pacific. PLoS biology, 5 (3) PMID: 17355176

Tuesday, March 20, 2007

Muestra de ciencia joven mexica...

La queridísima Dra Vocecita se llevó una portada este mes y un artículo más, ambos sobre modelos de redes en regulación del desarrollo en plantas... ¡la portada es sobre equivalencias de patrones en contextos diferentes! esta bueno:













El Javier publicando una aproximación bien divertida sobre evolución metabólica por redes después de visitar a Barabasi. Es highly accessed y highly recomendado por mí.


El buen Dieguiño con su aportación al cristal de una proteína viral que se pliega como cuna y no tiene pliegues homólogos reconocidos, pueden ver más en su blog.

Mi rumie con un trabajode evolución adaptativa de genes B MADS-Box y diversificación por duplicación... se ve bueno.





The Dude con aportes en la caracterización de una nueva familia de proteínas multigénica con dedos de zinc que parece pegarse al DNA (aunque el gordo todavía está por venir).
El artículo de Ana y Lau que es también el primer artículo sobre cuatrociénegas, en PNAS....



Y aunque no es estrictamente de éste año, pues este es mi blog y el Edgardo es mi amigo. Es sobre la identificación de rctA, un gen que reprime la transferencia conjugativa de los megaplásmidos simbiontes en Rhizobium



Hasta ahorita éstos son los que tengo frescos. Si me acuerdo de alguien más lo pongo luego. Si saben de alguien pues me avisan pa subirlo. Y otros muchos (como el David) que seguro publicaron ya pero no tengo noticia de ellos. Esto me lleva a las siguentes reflexiones:

  • Primero, ¿cómo que la UNAM no publica? Todos los arriba mencionados somos producto de la UNAM (aún cuando los trabajos no sean de la UNAM, todos se formaron aquí)
  • Segundo, ¿cómo que NO a las universidades públicas? todo es de universidad pública.
  • Tercero, seguro lo anterior es un sesgo, pero aún así éstos son todos más o menos de mi generación, mi pequeño círculo de amigos, mi petit comité, people I know... !ocho en un año es mucho y de calidad carajo!
  • Cuarto, tengo puros amigos re abusados!
  • Quinto, a que nos gusta la evolución molecular, ¿no?
  • Sexto, ¿los modelitos de redes es lo de hoy o qué?
  • Séptimo, tres de los artículos son de los Capuleto... creo que me equivoqué de lab! jajajaja!
¡LA UNAM ES LA NETA!

Tuesday, March 13, 2007

Paper GOS de Venter


Pues tras poco más de un año de estira y afloje, finalmente hoy salió publicada la primera parte de la Global Ocean Sampling Expedition (GOS), en donde el Venter Institute, en colaboración con un buen de instituciones de todo el mundo, explora la diversidad bacteriana marina de la cual se conoce sólo un 1% cultivable. Esta primera parte contiene los datos de Canadá al canal de Panamá, las Galápagos y de ahí hasta la Polynesia Francesa. Una de las muestras es del canal de Yucatán, y está bajo resguardo de la UNAM. Es un evento sin precedentes que según yo equivale a los primeros listados florísticos de Humboldt o algo así. !Y además es mi primer paper publicado! (entre otros dieciocho autores, claro). En fin, vale la pena que todo el mundo le eche un ojo, especialmente si son biólogos o están interesados en los recursos bióticos microbianos.

Felicidades a todos los que se echaron un broncón para que saliera publicado. Especialmente Shibu, Doug y Aaron.

ulk is api

Conferencia de prensa:

Sinopsis de Resultados:

Artículo en PLoS:

Conferencia de Prensa en Vivo HOY: