La estadística es la ciencia que estudia los métodos científicos que permiten recoger, organizar y analizar datos referidos a un determinado colectivo (en nuestro caso una granja de vacas), así como obtener conclusiones válidas y tomar decisiones razonables basadas en el análisis de los mismos.

La epidemiología es el estudio de la distribución, los factores de riesgo y las conse-cuencias de las enfermedades en las poblaciones.

A- Medidas de incidencia de enfermedad
B- Pruebas diagnósticas
C- Análisis de variables individuales
D- Correlación
E- Análisis de causa efecto

A- Medidas de incidencia de enfermedad

Prevalencia (P) o Tasa de infección (TI):

La Prevalencia o Tasa de Infección nos indica el número de casos de una enfermedad en una población, en un momento de tiempo puntual o en un periodo de tiempo. La preva-lencia es la tasa de animales enfermos, en un momento determinado, respecto al número de animales presentes en el mismo momento (o en un periodo de tiempo puntual). Por tanto, la prevalencia es la probabilidad de que un animal haya estado enfermo en un cierto momento.

Se expresa en valores de 0 a 1.

Ejemplo: Prevalencia de mamitis subclínica mensual. En un control de células somáticas (un muestreo mensual) de una explotación de 100 vacas en lactación en el día del control, hay 30 vacas con más de 200.000 cel. /ml. (Consideramos que 200.000 cel. /ml es el límite de vaca sana). La Prevalencia ó Tasa de Infección sería de 0,3.

El objetivo en una explotación de vacuno de leche sería menos de 0,25.

Incidencia (I) o Probabilidad de infección (PI):

La incidencia describe la frecuencia de nuevos casos de enfermedad en la población durante un determinado periodo de tiempo. Es decir, es el flujo de animales que pasan de sanos a enfermos. Se conoce también como Riesgo. Es la probabilidad de que un individuo libre de enfermedad, pero susceptible a enfermar, la desarrolle en un periodo determinado.

Se expresa en valores de 0 a 1.

Ejemplo: Incidencia de mamitis subclínica mensual. En un control de células somáticas (un muestreo mensual) de una explotación de 100 vacas en lactación en el día del control, hay un total de 10 vacas que han superado las 200.000 cel. /ml. por primera vez durante la lactación en curso. Consideramos que 200.000 cel. /ml es el límite de vaca sana. La incidencia de mamitis subclínica será de un 0,1.

El objetivo en una explotación de vacuno de leche seria menos de un 0,05.

B-Pruebas diagnósticas

Para la evaluación de las pruebas diagnósticas se utilizan dos parámetros:

Sensibilidad:

Es la probabilidad de que un animal realmente enfermo sea detectado como tal. Esto se podría expresar como el número de animales realmente enfermos detectados por el test diagnóstico como enfermos, dividido por el total de animales realmente enfermos.

Especificidad:

Es la probabilidad de que un animal no enfermo sea detectado como no enfermo. Se expresa como el número de animales detectados como negativos y que están realmente sanos, dividido por el total de animales realmente sanos.

Lo veremos más claramente con un ejemplo (utilizando la conductividad en la leche de ordeño como método diagnóstico de mamitis).

En este caso la sensibilidad sería: 30/(30+15)=66%. Esto quiere decir que un 34% de los animales con mamitis no son detectados (falsos negativos).

Por el contrario la especificidad sería: 40/(10+40)=80%. Esto quiere decir que un 20% de los animales sanos son detectados como mamíticos (falsos positivos).

Normalmente estos dos parámetros tienen una relación inversa. Si queremos aumentar la sensibilidad de la prueba lo haremos a costa de descender su especificidad; es decir si queremos detectar todos los animales realmente positivos (con mamitis) tendremos que asumir que muchos de los animales detectados como positivos no lo serán (aumentarán los falsos positivos). En el ejemplo expuesto anteriormente, esto lo podríamos hacer bajando el límite de aumento de conductividad de la prueba, así nos aseguraríamos la detección de más mamitis pero también tendríamos más animales sanos detectados como positivos.

Basándonos en lo dicho anteriormente vemos que tenemos dos prevalencias:

Prevalencia Aparente:

Depende de la sensibilidad y especificidad de la prueba. Es el número de animales detectados como positivos, dividido entre el total de animales.

PA= (30+10)/(30+10+15+40)= 40%

Prevalencia Real:

Son los animales realmente positivos, divididos por el total de animales.

P= (30+15)/(30+10+15+40)= 45%

Ambas prevalencias se relacionan en la siguiente fórmula:

P= (AP+especificidad-1)/ (Especificidad +sensibilidad -1)

También podemos definir el Valor Predictivo de la prueba, así pues definiremos:

Valor Predictivo Positivo:
De aquellos animales diagnosticados como positivos, los que son realmente positivos.

VP+: 30/(30+10)= 75%

Valor Predictivo Negativo:
De aquellos animales diagnosticados como negativos, cuántos son realmente negativos.

VP-: 40/(40+15)=72%

C- Análisis de variables individuales

MEDIDAS DE CENTRALIZACIÓN: Medidas que caracterizan el valor típico de nuestros datos.

Existen varios tipos.

Moda:
El es valor más común (más repetido) de nuestros datos.

Mediana:
Es el valor central cuando todos los valores están ordenados de mayor a menor; deja tantos valores por encima como por debajo.

Media aritmética:
Es la suma de todos los valores, divididos por el número de valores.

Media geométrica:
Matemáticamente es la raíz n-ésima del producto de todos los números. Sólo es útil si todos los números son positivos. Si hay algún 0 la media será 0 y si hay un valor negativo, la media será negativa.

Lo veremos más claro con un ejemplo:

MEDIDAS DE DISPERSIÓN: nos indican a qué distancia, en torno a la medida central, están diseminados los valores.

Rango:
Es la diferencia entre el menor y el mayor valor.

Desviación estándar:
Es un promedio de la desviación de los datos respecto a la media aritmética, cuya fórmula es:

Varianza:
Es la raíz cuadrada de la desviación estándar.

Para conocer con precisión un conjunto de datos no es suficiente con el promedio, sino que hemos de conocer su distribución. Lo veremos más claro con un ejemplo de dos granjas:

Ambas granjas promedian 200 D.E.L. (días en leche o días desde la fecha de parto a la fecha de hoy) sin embargo su desviación estándar es bien distinta. La granja A es de 150 y la granja B de 14. Si nos hubiéramos quedado tan sólo con la media hubiéramos dicho que eran granjas iguales, sin embargo la desviación estándar nos indica que son distintas. La granja A tiene una gran dispersión de animales según los días en leche, y la granja B tiene todos los animales muy viejos (lactación de 305 días) en días en leche.

D- Correlación

Es la relación entre dos ó más variables. Si las dos variables crecen o decrecen de forma simultánea y proporcional, decimos que las variables están correlacionadas positivamente. Si una decrece y la otra crece en la misma proporción, se dice que están correlacionadas negativamente. La correlación se mide por el índice de correlación que varía de 1 a -1. Su fórmula matemática es:

R = covarianza(X ; Y) / (var Y * var X)

En función de este índice se puede considerar la relación de dos variables como:

1) Perfecta (R = 1)
2) Excelente (0.9 ? R < 1)
3) Buena (0.8 ? R < 0.9)
4) Regular (0.5 ?R < 0.8)
5) Mala (R < 0.5)

Para evaluar el patrón que sigue una variable respecto a otra, deberemos hacer un análisis de regresión, en el cual estudiaremos la ecuación que mejor describe la relación entre dos variables.

Ojo, una fuerte correlación entre dos variables( A y B) no tienen porque significar necesariamente que A sea la causa de B o viceversa sino que puede ser que:

- A sea la causa de B.
- B sea la causa de A.
- Tanto A como B sean causadas por C.
- A y B no tienen nada que ver la una con la otra. Su asociación en los datos analizados es una coincidencia.

E- Análisis de causa efecto

Para calcular la relación entre la presencia de un factor de riesgo y la incidencia de una enfermedad, debemos mirar cómo hemos planteado el estudio. Existen dos modelos de estudio causa-efecto:

Clinical Trial:

En esta prueba está planeada previamente la exposición al factor de riesgo. Ponemos un grupo con el factor de riesgo y otro sin el factor de riesgo y lo estudiamos. Un ejemplo sería un grupo de animales con un tipo de cama respecto otro con otro tipo de cama y estudiamos los casos de mamitis en cada grupo.

Estudios de cohorte:

Se basan en la exposición o no al factor de riesgo, pero ésta ( la exposición), no está planeada; por ejemplo cogemos dos grupos de animales unos con altos recuentos celulares al secado y otro con bajos recuentos al secado y estudiamos si está relacionado con casos de mamitis al parto.

Estudio de caso-control:

En cambio si la selección de casos se basa en la presencia de la enfermedad (animales con mamitis versus animales sin mamitis), podemos estudiar si han estado expuestos o no al factor de riesgo. Estos son estudios retrospectivos.

Ratio de riesgo o riesgo relativo (RR):

En este parámetro se utiliza en los estudios de cohorte y los clinical trial. Es el ratio obtenido al dividir la incidencia de enfermedad con el factor de riesgo/ la incidencia de enfermedad sin el factor de riesgo.

- Si RR = 1, no hay asociación entre la presencia del factor y el evento.
- Si RR> 1, es un factor de riesgo.
- Si RR< 1, es un factor protector.

Ejemplo 1:

RR = incidencia con el factor/incidencia sin el factor

- incidencia con el factor = 30/(30+10)= 0,75
- incidencia sin el factor = 15/(15+25)=0,28

RR = 0,75/0,28= 2,68

Esto significa que teniendo el factor de riesgo X tenemos 2,68 veces más de posibilidades de contraer esta enfermedad.

ODDS RATIO:

Tiene la ventaja de que sí que se puede utilizar en los estudios caso-control. Como no podemos calcular las incidencias de cada factor (lo que nos impediría calcular el Riesgo Relativo), utilizamos el Odds Ratio.

Odds Ratio y Riesgo relativo coincidirán cuando las incidencias del proceso sean bajas, en cambio cuando sean altas (frecuentes) la diferencia entre RR y OR será alta, siendo siempre el OR más alejado de 1 que el RR.

Ejemplo 2:

Odds Ratio:

- odds de casos: (factor presente/ factor ausente)30/10= 3

- odds de control(sin enfermedad): (factor presente/ factor ausente) 15/25= 0,6

OR= 3/ 0,6= 5

Proporción o porción atribuible:

Nos indica la proporción de casos que se pueden atribuir a un factor. Se necesita conocer cuál es la proporción de casos expuestos al factor de riesgo (Pt), para el cual la Fracción atribuible sería:

FAP= ((RR-1)*Pt)/RR

Volviendo al ejemplo 1, queremos averiguar cuantos casos de mamitis clínicas al parto están relacionados con secados de más de 20 litros en producción.

RR = 2,68
Pt = (30+10)/(30+10+15+25)=0,55
FAP = ((2,68-1)*0,55)/2,68=0,34

Es decir el 34% de los casos de mamitis al parto se pueden atribuir a la presencia del factor de riesgo (secados de más de 20 litros de producción).

Intervalos de confianza para la estimación del riesgo:

Hemos calculado el RR y/o la OR, pero todavía no tenemos suficiente información, ya que debemos conocer si es estadísticamente significativo o no. Esto lo sabemos mediante los intervalos de confianza ya que, sino, las conclusiones de nuestro estudio podrían no ser válidas.

Por ejemplo tenemos dos análisis:

Ambos análisis tienen un RR igual (2,68), sin embargo a simple vista, podemos otorgar al segundo análisis un margen de confianza mayor (ya que hay más datos). Esto lo calcularemos con el Intervalo de confianza. Si el intervalo de confianza no incluye al 1 podremos decir que el RR es estadísticamente significativo, es decir ,el intervalo de confianza tiene en cuenta el tamaño muestral.

El nivel de significación lo podemos calcular con un nivel de significación del 95% (p< 0,05) o del 99% (p< 0,01). Esto significa que tenemos un 5% ó 1% de probabilidad de que la variación observada sea debida al azar o dicho de otra forma tenemos un 95% ó un 99% de posibilidades de que la variación observada se deba al factor/tratamiento/ intervalo etc… que estamos estudiando.

El intervalo de confianza para un 95% = RR x exp [± 1.96 Error Estándar]

Para los dos ejemplos:
1- Error est.= 0,707; IC = 7,99- 0,500
2- Error est = 0,0707 IC = 2,29- 1,74

Como vemos, pese a tener el mismo Riesgo Relativo, en el primer ejemplo no podríamos concluir que es un factor de riesgo, mientras que en el segundo ejemplo sí.

(Para facilitar estos cálculos se adjunta hoja de Excel, modificar celdas en amarillo)

Referencias:
- Herd health and Production Management in Dairy practice A brand, JPTM Noordhuizen, YH
Schukken
- Herd Health- Otto M Radostits
- Barnyard epidemiology and Performance Assesment
- Métodos estadísticos Sixto Ríos
- http://www.fisterra.com/mbe/investiga/3f_de_riesgo/3f_de_riesgo.htm
- http://www.seh-lelha.org/oddsratio.htm
- http://www.hrc.es/bioest/Medidas_frecuencia_8.html
- http://www.uiah.fi/projects/metodi/280.htm
- http://thales.cica.es/rd/Recursos/rd97/UnidadesDidacticas/53-1-u-punt151.html