En teoría, basta medir 293 metabolitos para conocer el estado de los 2763 de una célula humana

Por Francisco R. Villatoro, el 31 enero, 2013. Categoría(s): Biología • Bioquímica • Ciencia • Matemáticas • Mathematics • Noticias • Physics • Recomendación • Science ✎ 4

Dibujo20130131 inference diagram - example metabolic network

El metaboloma humano (H. sapiens) comprende 5.283 reacciones bioquímicas que relacionan 2.763 metabolitos con una red metabólica de 21.026 conexiones. Para reconstruir el estado completo de esta red metabólica, es decir, la concentración de todos los metabolitos, ¿cuántas concentraciones de metabolitos hay que medir en laboratorio? La respuesta es 293 (para S. cerevisiae bastan 99 y para E. coli solo 96). ¿Sólo 293 permiten reconstruir el valor de 2.763? Así es, en teoría, claro, pues en la práctica que se pueda hacer no significa que sea factible lograrlo. Lo afirma un nuevo artículo interesantísimo de Albert-László Barabási y dos colegas que estudia la observabilidad (según la teoría del control) de redes metabólicas y de regulación génica. Todo biólogo matemático, o matemático biólogo, debería leer este artículo (tanto si trabaja con datos in silico como, y sobre todo, in vivo). El artículo técnico es Yang-Yu Liu, Jean-Jacques Slotine, Albert-László Barabási, «Observability of complex systems,» PNAS Early Edition, Jan 28, 2013. A los biólogos que tengan dificultades a la hora de entender el concepto de derivada de Lie y el jacobiano correspondiente les recomiendo consultar a cualquier matemático, o si no tienen ninguno a mano estudiar la tesis de licenciatura de Milena Anguelova, «Nonlinear Observability and Identi ability: General Theory and a Case Study of a Kinetic Model for S. cerevisiae,» Department of Mathematics, Chalmers University of Technology and Göteborg University, April 2004 [pdf].

Un sistema general tiene entradas, salidas y variables internas. El experimentador puede ajustar el valor de las entradas, que actúan como variables de control. El valor de las salidas se puede medir (observar). Sin embargo, no suele ser posible medir las variables internas, o cuando se pueden medir es imposible evitar que la medida altere sus valores e influya en el resultado final. Por ello, en la teoría del control de sistemas se ha introducido el concepto de observabilidad.

El problema de la observabilidad consiste en determinar si existe una relación entre las variables de entrada, de salida y sus variaciones en el tiempo que permita calcular los valores de todos las variables de estado del sistema (incluidas las que no son ni entrada ni salida) sin conocer su condición inicial. Saber si un sistema no lineal de ecuaciones es observable y cuál es el conjunto mínimo de variables necesaria para observarlo es el problema que resuelve la teoría de la observabilidad. Como suele ocurrir con todas las teorías matemáticas, saber que una solución existe (o que un sistema es observable) no significa que sepamos calcularla (o que podamos «invertir» el sistema a partir de las variables observadas y reconstruir el valor de todas ellas). Aún así, la información sobre la observabilidad de una red metabólica puede ser muy útil para el biólogo (o para el físico, químico, ingeniero, etc.).

Dibujo20130131 chemical reaction system with 11 species in four reactions

Barabási y sus colegas introducen un nuevo grafo llamado diagrama de inferencia y un algoritmo que permite determinar los nodos «sensores» del grafo, los nodos cuya observación en el tiempo permite reconstruir (en teoría) el valor de todos los demás nodos. La figura que abre esta entrada representa el diagrama de inferencia de esta red metabólica con 11 especies (metabolitos) y 4 reacciones (7 ya que 3 son reversibles). Las ecuaciones para la ley de acción de masas parecen muy complicadas, pero son «triviales» comparadas con las ecuaciones típicas de una red metabólica con enzimas alostéricas, realimentación, etc.

La teoría de Barabási y sus colegas es aplicable a toda cinética química representada por un polinomio o un cociente de polinomios (la más utilizada por los enzimólogos, aunque algunas leyes como las de Hill no están incluidas por tener exponentes no enteros). En la figura que abre esta entrada, basta observar 3 de las 11 especies para reconstruir el estado de las 8 restantes (los nodos «sensores» marcados en rojo). No quiero entrar en los detalles del algoritmo, aunque es muy sencillo (se basa en dividir el grafo en componentes fuertemente conectadas o SCC (los nodos envueltos en elipses con trazo discontinuo), elegir entre ellos los que cumplen cierta condición (los SCC raíces) y luego elegir un nodo dentro de cada SCC).

Dibujo20130131 A to B simple metabolic reaction and inference diagram

Como sé que algunos lectores estarán un poco perdidos, creo que convendría que tomemos la red metabólica más sencilla posible, una única reacción química A→B, donde A es el reactivo (sustrato) y B es el producto. Queremos conocer las concentraciones en el tiempo A(t) y B(t). Obviamente bastaría medir A(0) y B(0), y luego resolver el sistema de ecuaciones, pero en problemas más grandes hay concentraciones que no podemos medir, ni siquiera su valor inicial. En laboratorio medir ambas concentraciones es más costoso que medir una sola de ellas. ¿Cuál elegimos?

No hay que pensar mucho para darse cuenta de que basta medir la concentración de B(t), ya que la de A(t) se pueden reconstruir «invirtiendo» la dinámica de la red. ¿Por qué no basta con medir A(t)? No es suficiente porque desconocemos el valor inicial B(0); aunque conozcamos con todo detalle A(t), como no depende del valor de B(0), será imposible conocer B(t) en detalle, solo podremos calcular su valor como función de B(0), un parámetro arbitrario a priori (de hecho si podemos medir B(0) también podremos medir B(t) y no hay que molestarse en nada más). ¿Pero realmente basta con medir sólo B(t)? Sí, porque la solución B(t) depende tanto de A(0) como de B(0), con lo que se puede «invertir» la dinámica para obtener A(t) en completo detalle a partir de B(t).

Como este ejemplo es muy sencillo, quizás ayude ilustrar todo esto utilizando las soluciones exactas (que en general son imposibles de obtener) del sistema de ecuaciones diferenciales para la red (suponiendo la aplicación de la ley de acción de masas): x1(t)=x1(0) exp(-k1 t), y x2(t)=x2(0)+x1(0)(1-exp(-k1 t)). Se ve claramente que conociendo x2(t) en detalle podemos obtener x1(0) y en principio x1(t) también; hay que recordar que «invertir» la dinámica no siempre es factible, aunque sea posible hacerlo en teoría.

Dibujo20130131 simple chemical reaction - observability

No quiero entrar en detalles matemáticos, pero podemos elegir como variable a observar x1(t) o x2(t). En función de esta elección se calculan sendas matrices jacobianas para el sistema (utilizando derivadas de Lie respecto a cada una de estas variables) y se estudia si su rango es máximo (igual a la dimensión de la matriz, en este caso, dos); si lo es, el sistema es observable con la variable elegido, y si no lo es, no es observable. En nuestro sencillo ejemplo, eligiendo x2(t) se obtiene un sistema observable, pero eligiendo x1(t) no lo es. Por ello, en esta nueva figura se ha marcado en rojo el nodo x2(t).

Dibujo20130131 another example of observability of a chemical reaction

Aquí tenéis otro ejemplo sencillo de aplicación de la técnica a dos reacciones que involucran cuatro metabolitos. Basta observar uno de ellos (x4) para conocer en teoría el estado de todos los demás. Obviamente, reconstruir el valor de la concentración de todos los metabolitos a partir de x4(t) no es un problema trivial y por ahora no está resuelto, salvo para sistemas de ecuaciones lineales. Ello no quita que, sabiendo que la solución existe, se pueda aplicar un algoritmo de optimización (basado en técnicas de Montecarlo) que permite obtener una aproximación «aceptable» a la solución.

Dibujo20130131 simplified glycolytic reaction map - inference diagram

Como los biólogos me dirán que solo se creen estas técnicas si las ven aplicadas a un problema «realista,» presento en esta figura una versión simplificada de la glicolisis (o glucólisis). En teoría, conociendo en el tiempo la concentración del piruvato es posible reconstruir las concentraciones de todos los demás metabolitos, es decir, basta observar el piruvato para observar el sistema completo. Por cierto, el artículo técnico presenta el modelo metabólico detallado utilizado en este análisis (que omito aquí).

Para los que vemos la biología con los ojos de un matemático (aunque yo sea licenciado en ciencias físicas), este tipo de artículos nos resultan apasionantes. Por supuesto, el biólogo de laboratorio húmedo pensará que no merece la pena aprender las matemáticas avanzadas necesarias para entender estas cosas; su mejor opción será esperar hasta que se disponga de un software automático que realice estas labores por él. Yo creo que puedo augurar sin equivocarme que tal software estará disponible en los próximos años y que será una herramienta muy utilizada.



4 Comentarios

  1. Pues… interesante. Sólo hay un «pequeño problemilla». Para los físicos que no entiendan: esas «k» les diré que tienen que ver con un concepto atrasado de la química que se llama estequiometría. Desde la hipótesis quimiosmótica de Mitchell, los biólogos sabemos que la vida no sólo viola, sino que se basa en la violación de la estequiometría.

Deja un comentario