domingo, 23 de marzo de 2008

Resolve for a Rainstorm

Recomendaciones para los agroecólogos a la hora de utilizar pruebas estadísticas.

Diego Griffon B.
.
1. No abusar del empleo de pruebas estadísticas (Yoccoz, 1991).
.
2. No sobre utilizar las pruebas de significación (Yoccoz, 1991).
.
3. Hacer énfasis en la significación biológica por sobre la significación estadística (Yoccoz, 1991).
.
4. No limitarse a mostrar los P-valores, inclusive peor, solo mencionar: diferencias no significativas (NS), se debe presentar los valores reales de las diferencias, (Yoccoz, 1991).
.
5. No comparar P-valores sin considerar el tamaño de las muestras o los grados de libertad (Yoccoz, 1991).
.
6. Tomar en cuenta la potencia de las pruebas utilizadas (Yoccoz, 1991).
.
7. No asumir que el P-valor es la probabilidad de que la hipótesis nula sea cierta (Yoccoz, 1991).
.
8. Una prueba de significación, no es mas que una forma de medir la consistencia de los datos con la Ho (Yoccoz, 1991).
.
9. Cuando se rechaza una Ho, se debe estar claro que cualquier aspecto de esta hipótesis puede ser falso (Yoccoz, 1991).
.
10. Se deben entregar valores con intervalos de confianza (Yoccoz, 1991).
.
11. Se deben mostrar los errores estándar, así como estimaciones de las diferencias y sus intervalos de confianza (Yoccoz, 1991).
.
12. Los gráficos son herramientas muy útiles, no sub-utilizarlos (Yoccoz, 1991).
.
13. Es importante tener en cuenta que el error de la varianza no necesariamente se distribuye normalmente, esto puede ser común en los datos biológicos. Fuentes de no normalidad: la distribución subyacente no es normal, datos anómalos, errores de la varianza heterogéneos (Potvin y Roff, 1993). Soluciones: (1) transformar los datos, trimming, winzorization, transformación por rangos (2) métodos basados en rangos, (3) métodos de remuestreo (permutación y bootstrap) (Potvin y Roff, 1993).
.
14. Tomar en cuenta la eficiencia relativa asintótica (ARE) de la alternativa noparametrica antes de utilizarla (Potvin y Roff, 1993).
.
15. Para bajo numero de datos usar métodos de remuestreo (Potvin y Roff, 1993).
.
16. Cuidado con el uso irracional de α =0,05 como criterio para establecer la significación (Yoccoz, 1991).
.
17. Establecer los niveles de significación a priori (Yoccoz, 1991).
.
18. No sobre valorar la importancia del error tipo I (α), en detrimento del error tipo II (β) (Smith, 1995), establecer una razón α/β en función de información biológica.
.
19. La importancia de un tipo de error sobre otro depende del problema en estudio, por lo tanto es una buena practica asignarles a priori valores ad hoc (Smith, 1995).
.
20. No forzar los datos a pruebas para los que no son adecuados (Yoccoz, 1991).
.
21. Solo usar no parametricas cuando existe violación de los supuestos de la alternativa parametrica (Smith, 1995).
.
Bibliografía

Potvin C. and D. Roff. 1993. Ecology 74(6):1617-1628.
Smith S.M. 1995. Ecology 76(6):1997-1998.
Yoccoz,N.G. 1991. Bull. Ecol.Soc.Am 72 (2):106-111.

jueves, 13 de marzo de 2008

AH

Dinamica no lineal en Tribolium

Diego Griffon B.


El grupo de dinámica no lineal de Tribolium, esta conformado por un conjunto interdisciplinario de investigadores, con un elegante acercamiento a la unión entre teoría y experimentación. Sus trabajos se fundamentan en el uso de un modelo tipo Ricker (May y Oster, 1976), ajustado para que represente la dinámica poblacional de especies del genero Tribolium.
.
A partir de este modelo, los autores hacen una serie de predicciones sobre la dinámica del insecto bajo ciertos valores de los parámetros del modelo, luego estos resultados son contrastados con el comportamiento de poblaciones experimentales en condiciones de laboratorio que reproducen los valores de los parámetros previamente considerados.

En estos trabajos, en un conjunto sorprendente de resultados, se muestra el alto grado de ajuste encontrado entre las predicciones del modelo y los resultados experimentales, lo que representa una elocuente validación de su poder predictivo.

Para la construcción de este modelo, los autores siguen una serie de criterios, que ya de por si son una rica enseñanza (3, 4):

I. Los modelos no se deben diseñar ad hoc, por el contrario se deben basar en mecanismos específicos, considerados importantes biológicamente. Restringiendo en la medida de lo posible los parámetros y las variables consideradas, para que de esta manera el modelo pueda ser validado estadísticamente.

II. El modelo debe considerar la estocasticidad inherente a todo proceso biológico, por lo que una versión estocástica del modelo determinista debe ser siempre construida. La manera en la cual se incluya aleatoriedad al modelo, debe estar fundamentada en consideraciones biológicas. Esta versión del modelo tiene la ventaja de poder ser puesta a prueba como hipótesis nula para la de explicación de datos reales, convirtiéndose de esta manera en una conexión entre el modelo y los datos.

III. La estimación de los parámetros del modelo (parametrizacion) y la validación de este, deben ser procedimientos distintos. De esta manera se evitan tautologías que validen el modelo artificialmente.

IV. Un buen modelo es tanto predictivo como descriptivo. De hecho, la mejor evidencia en favor de la potencia de un modelo, se obtiene cuando sus predicciones concuerdan con los resultados de experimentos controlados y rigurosamente analizados estadísticamente.

Sin lugar a dudas, los hallazgos fundamentales de este grupo de investigación, en boca de los propios autores son (4):

Our studies comparing model predicted dynamics with data, whether they deal with exotic dynamics such as chaos or other seemingly less important dynamic patterns, serve at least two important purposes. First, they add to the catalog of nonlinear phenomena rigorously documented to occur in a biological population, and by doing so they demonstrate the importance of nonlinear dynamics in ecology. Second, as they accumulate, these studies provide stronger and stronger support for the validity of the LPA model and therefore to biological conclusions based on that model.”

O en palabras de Robert May (1999):

In a series of beautiful experiments, Constantino et al. (1995) have shown how essentially by changing development rates, laboratory populations of Tribolium in constant environments can move, in a way that is predictable, from steady cycles to chaotic fluctuations”

En términos generales, los aportes fundamentales de estos trabajos son:

Demuestra la posibilidad de ocurrencia de dinámicas complejas (i.e., ciclos cuasiperiódicos y caos) en poblaciones reales.

Llevan a cabo de manera exitosa la unión entre teoría y práctica.

Desarrollan un modelo con alto poder predictivo (cuantitativo).

Presentan una metodología extrapólable para la elaboración y validación de modelos ecológicos.

Suman evidencias a la presencia de rutas al caos a través de bifurcaciones en ecuaciones simples y demuestran que estas rutas también se cumplen en poblaciones reales.

Demuestran que malos manejos de poblaciones naturales (e.g., plagas, peces de interés económico) que alteren sus mortalidades, pueden generar dinámicas complejas, que entre otras cosas produzcan aumentos o disminuciones abruptas en las densidades poblacionales.

En el último de estos aportes existe una enseñanza para el manejo de recursos naturales, como bien lo expresan los autores:

“For applied ecology, the experiment suggests adopting a cautious approach to the management or control of natural populations, based on sound scientific understanding. In a poorly understood dynamical population system, human intervention— such as changing a death rate or a recruitment rate—could lead to unexpected and undesired results.”
Costantino et al., 1997

A continuación se describen en detalle el modelo y algunos de los resultados fundaméntales obtenidos por este grupo de investigación.

El modelo

El modelo estudiado por este grupo de investigación, se fundamenta en las interacciones entre los estadios larva, pupa y adulto de Tribolium castaneum, por lo cual se conoce al modelo como LPA. La interacción entre estos estadios que simula en modelo es el canibalismo. La cual, de acuerdo a los resultados de estos trabajos, es determinante en la dinámica poblacional de la especie (4).

En T. castaneum los estadios móviles (larvas y adultos) canibalizan a los inmóviles (huevos y pupas) (1, 2, 3, 4). El hecho de que la ontogenia del animal este conformada por estadios conspicuos, es la razón por la cual se utiliza un modelo estructurado por etapas (4).

Este modelo pertenece a la familia de modelos tipo Ricker (4), en este caso estructurado por etapas y con solapamiento de generaciones en una de ellas (i.e., adulto). Si denotamos por Lt , Pt , At el numero de larvas, pupas y adultos en un tiempo t, el objetivo del modelo es aplicar alguna función a las cantidades anteriores para obtener los valores Lt+1 , Pt+1 , At+1. En este modelo se asume que un intervalo de tiempo t es igual a dos semanas, tiempo de duración tanto de la fase pupal y como de la fase larval (4, 5).

El en caso de las larvas, la función que permite relacionar t+1 con t es (5):
Donde b representa el número de larvas que se originan a partir de cada adulto, obsérvese que este parámetro representa implícitamente el número de huevos puestos por los adultos en conjunto con la probabilidad de sobrevivir hasta la eclosión (5). En el modelo se asume que los encuentros entre los diferentes instares son aleatorios, es decir siguen una distribución Poisson (4). Por lo tanto aparecen en la expresión como exponentes, donde -cea representa la probabilidad de que un huevo escape del canibalismo por un adulto y -cel representa la probabilidad de que un huevo escape del canibalismo por una larva (4). De esta manera, al multiplicar estos términos por las cantidades de individuos presentes en las clases apropiadas en un tiempo t, obtenemos el número de individuos en un tiempo t+1 (i.e., Lt+1) (4).

El en caso de las Pupas, la función que permite relacionar t+1 con t es (es importante recalcar que las larvas no sufren canibalismo) (4, 5):

Donde μl representa la probabilidad de que una larva muera en un intervalo de tiempo t (4, 5).

Finalmente, para los adultos la expresión que permite relacionar t+1 con t es (4, 5):

Donde –cpa representa la probabilidad de que una pupa escape del canibalismo por un adulto (asumiendo encuentros aleatorios) (4) y μa representa la probabilidad de que un adulto muera en un intervalo de tiempo t.

En esta expresión podemos apreciar que el modelo contempla (a diferencia de los modelos tipo Ricker convencionales) solapamiento de generaciones. Los adultos presentes en un instante de tiempo t+1, están compuestos por aquellos que sobrevivieron en el instante de tiempo t (i.e., (1- μa) At), mas los que se incorporan partir del estadio anterior (i.e., Pt exp -cpaAt) (4, 5).

En definitiva el modelo comprende el siguiente sistema de ecuaciones (1, 2, 3, 4, 5):

Es de destacar que este sistema recursivo tiene forma de matriz de Leslie no lineal (4).

Tomando en cuenta el criterio II propuesto por los autores para la construcción de modelos, se incorpora aleatoriedad al modelo introduciendo ruido al esqueleto determinístico ya descrito. Desde un punto de vista ecológico se consideran dos tipos de estocasticidades, i.e., demografía y ambiental.

El modelo se incorpora la estocasticidad ambiental de la siguiente manera:


Donde Et = (E1, E2 y E3) es un vector de ruido, constituido por variables aleatorias de distribución normal con media cero y matriz de covarianza igual a ∑ = (σij), los valores de estas variables no están correlacionadas en el tiempo.

Para el caso de estocastisidad demográfica se utiliza una trasformación de raíz cuadrada de la siguiente forma:

Dadas las altas densidades poblacionales que se pueden llegar a obtener en esta especie, se prefiere el modelo que contempla estocasticidad ambiental, ya que este proceso se cree más importante que la estocastisidad demográfica a densidades altas (5).

Es interesante mencionar que en todos los casos cuanto ∑ =0 el modelo estocastico se hace igual al determinístico (3, 4, 5).


La dinámica

Los modelos tipo Ricker (i.e., con exponentes) se caracterizan por presentar un conjunto muy diverso de comportamientos, dependiendo de los valores de sus parámetros (May & Oster, 1976). Estudiando el cubo positivo (volumen con sentido biológico) del espacio de fases compuesto por las variables L, P, A, se puede analizar los resultados del modelo para diferentes valores de los parámetros (aquí se hace ∑ = 0).

Un resultado interesante desde un punto de vista topológico, es la existencia dentro de este cubo, de un subcubo (caja), delimitado por: 0 ≤ L ≤l*,0 ≤ P ≤ P*,0 ≤ A ≤ A*, en el cual permanecen todas las orbitas que se originen en R+3 (4). Esto implica la existencia de un atractor global conectado en el subcubo (4).

Para b < μa/(1-μl) el atractor global es el punto (L, P, A) = (0, 0, 0), es decir que cualquier trayectoria que se origine en el cubo positivo del espacio de fases, tenderá a ese punto a medida que el tiempo tienda a infinito, lo que significa que la población se extingue (4).

Para b > μa/(1-μl) el origen es inestable y la dinámica es persistente con respecto a este, es decir, para cualquier valor no negativo de las condiciones iniciales, la población nunca llega a extinguirse (4).

Para b > μa/(1-μl) existe un equilibrio positivo único. Este equilibrio es de forma local asintoticamente estable, para valores de b cercanos a μa/(1-μl). Para otros valores de los parámetros, el equilibrio puede ser inestable, y bifurcaciones a dinámicas de periodo dos o caóticas pueden ocurrir.

A modo de ejemplo, en la Figura1 se presenta el diagrama de bifurcación obtenido al variar los valores de la mortalidad de adultos (μa), mientras se dejan constantes los otros parámetros del modelo (b = 7,483; μl = 0,2670; cae = 0.009170; cel=0,01200; cpa=0,004139).

Figura 1. Diagrama de bifurcación del modelo LPA determinístico para diferentes valores del parámetro μa (b = 7,483; μl = 0,2670; cae = 0.009170; cel=0,01200; cpa=0,004139).

En esta figura se aprecia como para diferentes valores del parámetro μa, se puede obtener diferentes valores de equilibrio, ciclos limites de periodo 2 y bucles invariantes (ciclos cuasiperiódicos). Inclusive para μa ≈ 0,6 se observa una bifurcación reversa.

Los experimentos

El conjunto fundamental de experimentos realizados por el grupo de investigación, consisten en el mantenimiento de poblaciones de dos líneas genéticas (SS y RR) de T. castaneum durante considerables periodos tiempo, y variar b o cpa haciendo ceteris paribus. Por lo tanto, los experimentos están relacionas con el efecto de manipular el numero de individuos en la fase de adultos. Esto se logra variando el número de adultos (agregando o quitando) a la hora de realizar los censos poblacionales (cada dos semanas).

En todos los casos, la mitad de los experimentos se utilizan para parametrizar las ecuaciones del modelo, mediante estimaciones máxima verosimilitud y la otra mitad se utilizan para evaluar el poder predictivo del modelo parametrizado.

Es en esta parte del trabajo, donde los resultados más espectaculares aparecen. Por ejemplo, si se comparan los resultados obtenidos numéricamente para la dinámica asintótica variando μa, con sus contrapartes experimentales, se obtiene un asombroso ajuste (Figura 2).

Figura 2. Resultados del modelo determinístico (∑ =0) y correspondientes experimentos. Círculos negros modelo determinístico, círculos blancos experimentos.

Nótese que estos resultados concuerdan con la ocurrencia de una bifurcación reversa (Figura 2, diagramas de fases inferior derecho e inferior izquierdo) como ya había sido comentado en la discusión de diagrama de bifurcación de este experimento (Ver figura 1, μa ≈ 0,6).

Otro conjunto de experimentos, se realizaron variando la probabilidad de canibalismo adulto-pupa (cpa), obteniéndose resultados igualmente asombrosos (Figura 3) (3, 4). En este caso, los resultados son particularmente llamativos, por que involucran una ruta compleja al caos mediante bifurcaciones, similar a la señalada por Robert May (May & Oster, 1976) en la ecuación logística. Demostrando de esta manera, que este comportamiento es posible en poblaciones naturales.


Figura 3. Caos en el modelo LPA. a.- Diagrama de bifurcación de la ruta ala caos para diferentes valores del parámetro cpa (b = 7,483; μl = 0,2670; μa = 0,96 cae = 0.009170; cel=0,01200; =0,004139). b.- Atractor extraño para cpa.= 0,35 en el modelo determinístico. c.- Resultados (7500) del modelo estocástico para iguales condiciones a las utilizadas en “a”. d.- Resultados de los experimentos con poblaciones reales de Tribolium para iguales condiciones a las utilizadas en “a” y “b”.


Bibliografía:

(1) Costantino, R. F., Cushing, J. M., Dennis, B. y Desharnais, R. A.. 1995. Experimentally induced transitions in the dynamics behaviour of insect populations, Nature. 375, 227-230.
(2) Costantino, R. F., Desharnais, R. A., Cushing, J. M. y Dennis, B. 1997. Chaotic dynamics in an insect population. Science. 275, 389-391.
(3) Cushing, J. M., Costantino, R. F., Dennis, B.,. Desharnais, R. A. y Henson, S. M. 1998. Nonlinear Population Dynamics: Models, Experiments, and Data, Journal of Theoretical Biology. 194, No. 1, 1-9.
(4) Cushing, J.M., Henson, S.M., Desharnais, R.A., Dennis, B., Costantino, R.F., y King, A. 2001. A chaotic attractor in ecology: theory and experimental data. Chaos, Solitons, and Fractals. 12: 219–234.
(5) Dennis, B., Desharnais, R. A., Cushing, J. M. y Costantino, R. F.. 1995. Nonlinear demographic dynamics: mathematical models, statistical methods, and biological experiments. Ecological Monographs. 65, 261-281.

May, R.M. & Oster, G.F. (1976) Bifurcations and dynamic complexity in simple ecological models. The American Naturalist, 110, 573-599

May, R. 1999. Unanswered questions in ecology. Philosophical Transactions of the Royal Society of London B 354:1951-1959

miércoles, 5 de marzo de 2008

Will the Summer Make Good for Our Sins?

Sobre la importancia relativa del error tipo I y II en la Agroecología.

Diego Griffon B.

El error tipo I (α) se comete cuando el investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera en la población. Es equivalente a encontrar un resultado falso positivo, porque el investigador llega a la conclusión de que existe una diferencia cuando en realidad no existe.

El error tipo II (β) se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa en la población. Es equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la realidad.

La relación entre los diferentes tipos de errores no es simple, existe un compromiso entre la probabilidad de cometer un error con respecto al otro como se aprecia en la siguiente cuadro:
.
La importancia relativa de un tipo de error sobre el otro depende de las particularidades de la investigación que se este realizando. Es de destacar que según Smith (1995) existe una tendencia en los trabajos ecológicos ha sobre valorar la importancia del error tipo I sobre el tipo II, practica que puede llevar a situaciones donde se tomen dediciones desafortunadas.

Por ejemplo, en el estudio de la toxicidad de alguna molécula que se quiera utilizar como insecticida en cultivos. El error tipo I estaría definido como la probabilidad de establecer que la molécula es toxica cuando no lo es. En este caso la recomendación de los investigadores seria no utilizar el producto en campo, a pesar de que en realidad no es toxico.

El error tipo II estaría definido como la probabilidad de establecer que la molécula no es toxica cuando si lo es. En este caso la recomendación de los investigadores seria utilizar el producto en campo, ¡a pesar de que en realidad es toxico!

Se aprecia claramente que en esta caso particular el error tipo II es mucho mas peligroso que el tipo I, ya que en el primero están involucrados riesgos de salud publica y ambientales mientras que en el segundo están involucrados solo los costos relacionados al desarrollo de una molécula que no será comercializada.

La importancia de un tipo de error sobre otro depende del problema en estudio, fundamentalmente de consideraciones de índole biológica, por lo tanto es una buena practica asignarles a priori valores ad hoc (Yoccoz, 1991; Smith, 1995).

Sin embargo, según Toft y Shea (1983) rara vez se establece un β crítico. Una manera de establecer este valor es estimando la potencia de la prueba para diferentes valores de α, esto permite establecer a priori valores para los dos tipos de errores.

El error tipo II (β) esta relacionado con la potencia de la prueba, la cual es el complemento de este error (1- β). La potencia depende de tres factores: (1) depende de α, mientras menor sea su probabilidad, menor es la potencia; (2) el tamaño de la muestra, a mayor tamaño muestral mayor potencia y (3) la magnitud del efecto, a mayor magnitud mayor potencia (Toft y Shea, 1983).
.
La potencia de una prueba esta relacionada con el error tipo I de la siguiente manera:
.
.
Donde TE es el tamaño del efecto.
.
Es de destacar que se esta empezando a establecer una convención en la comunidad científica sobre que los costos de α y β deben ser 0,05 y 0,2. Esto asume implícitamente que el costo del error tipo I es cuatro veces mas importante que el error tipo II (Di Stefano, 2003).
.
Esta practica que no es conveniente ya que potencia dos prejuicios erróneos, 1.- estimula el uso universal e irracional de niveles de significación preestablecidos, sin tomar en cuenta las características biológicas del problema. 2.- estimula la creencia de que le error tipo I es mas importante que el tipo dos.
.
Una practica conveniente es establecer a priori una relación α / β constante según información del problema en estudio y calcular el tamaño de la muestra necesario para obtener esa relación (Di Stefano, 2003).
.
Bibliografía:
Di Stefano, J. 2003. Functional Ecology 17: 707-709.
Johnson D.H. 1995. Ecology 76 (6): 1998-2000.
Potvin C. and D. Roff. 1993. Ecology 74(6):1617-1628.
Smith S.M. 1995. Ecology 76(6):1997-1998.
Toft C.A and Shea, P. 1983. The American Naturalist 122:618-62
Yoccoz,N.G. 1991.Bull. Ecol.Soc.Am 72 (2):106-111.