Science
7
min read

En la industria acuícola las pérdidas por enfermedades y patógenos ocurren todos los días.
A pesar de que el monitoreo está avanzando, las alternativas no son suficientes. La agricultura de precisión (sensorizada y con monitoreo constante) tiende a basarse en cámaras y modelos de computer vision. Este monitoreo permite ver cuando los salmones están lesionados o enfermos. El problema es que cuando la enfermedad se ve, ya es muy tarde para actuar.
Es por esto que con este paper buscamos desarrollar y validar dos índices de salud para los salmones que no sean invasivos. El Gut Health Score (GHS), y el Skin Health Score (SHS).
El microbioma es la clave para esto, en particular el microbioma de las branquias y de la mucosa intestinal, que son la matriz de intercambio con el exterior y el lugar encargado de la absorción de nutrientes y la regulación sistémica del pez.
Obteniendo estas muestras del microbioma podríamos establecer un índice de salud general del salmón. Un problema es que tomar muestras de las branquias requiere acceso al arco branquial. Similar es el caso de la mucosa intestinal, que requiere acceso directo a los intestinos.
Ambos muestreos son destructivos, y un muestreo destructivo no es escalable ni permite hacer experimentos longitudinales, que son a lo largo del tiempo.
Y por eso planteamos la hipótesis de que se puede usar el microbioma de la piel como proxy de las branquias, y el poro urogenital como proxy del intestino.
Esta investigación tuvo como objetivos:
Validar los proxys,
Desarrollar y comparar modelos de machine learning para medir la salud, y
Formular dos índices de salud no invasivos y prácticos para gestión acuícola.
Codebreaker no limita su I+D a condiciones controladas de laboratorio: colabora con productores, veterinarios y equipos técnicos en centros de cultivo y predios agrícolas, capturando datos reales bajo variabilidad ambiental. – Portal Agro Chile
171 salmones, 4 muestras cada uno
Para cumplir los objetivos, seleccionamos 171 salmones que fueron categorizados entre sanos (85) y lesionados (86) según signos clínicos de enfermedad.
Luego realizamos el muestreo. Seguimos los protocolos estándar y nos apegamos a regulaciones de bienestar animal para asegurar el manejo ético de los peces. En cada salmón utilizamos un hisopo estéril en los arcos branquiales, otro raspando en un lateral, un tercer hisopo para el poro urogenital y por último una muestra del intestino para la mucosa.
Extrajimos el total del ADN genómico de cada una de las muestras, lo cuantificamos y nos aseguramos de que mantenga una buena calidad. En pocas palabras, secuenciamos y perfilamos los microbiomas.
Codebreaker busca instalar el laboratorio de secuenciación más grande de Chile en Puerto Varas, fortaleciendo su presencia en la región. –Mundo Acuícola
El siguiente paso hacia una métrica específica e intuitiva era hacer un análisis de todos estos datos.
Limpiar los datos y prepararlos para la caracterización fue una de las partes más difíciles según indica Luis León, líder en el apartado de bioinformática: “Tuvimos que dedicar mucho tiempo a la etapa de filtrado y normalización para asegurar que las diferencias que estábamos viendo fueran biológicamente significativas y no simples artefactos técnicos.”
Durante el control de calidad de los datos del muestreo nos dimos cuenta de algo interesante.
A pesar de que la distribución de muestras de los cuatro sitios anatómicos estuvo balanceada, muchas muestras de piel de los peces sanos no tenían suficiente biomasa. Esto puede ser porque los peces sanos producen menos mucosa en su piel, pero es algo que debe estudiarse.
Según Agustín Piña, product manager de Micro-ID™, que se encargó del flujo campo-laboratorio, esta “es una limitación biológica que puede manejarse.” Agustín también indicó que “esto termina enriqueciendo la investigación, porque transparenta dónde el índice funciona mejor y cuáles son sus límites.”
Para mitigar los sesgos en la clasificación por la reducción de muestras de calidad en la piel sana, usamos validación cruzada estratificada y métricas con pesos. Así logramos que el modelo refleje las señales biológicas reales, y en palabras de Luis, con una robustez en los datos que permite que las conclusiones sobre la salud del microbioma sean realmente accionables para la industria.
Diversidad microbiana, una suerte de principio de Ana Karenina
“Todos los microbiomas sanos son parecidos. Cada microbioma enfermo está enfermo a su manera.”
Los análisis de diversidad se dividen en dos: alfa y beta.
El análisis de diversidad alfa mide la variedad y abundancia en el microbioma de un pez. Observamos que el estrés en el microbioma no tiene una sola forma, sino que es muy variado. Por eso decimos que sigue una suerte de principio de Ana Karenina.

Por otro lado, el análisis de diversidad beta arrojó más información. Este análisis compara la composición del microbioma entre individuos. Para esto usamos PERMANOVA, un test estadístico comúnmente utilizado para evaluar diferencias en microbioma. Con esto confirmamos que un pez enfermo reorganiza su microbioma (p = 0.006).
Una vez más apareció el principio de Ana Karenina. Los peces lesionados mostraron una variabilidad branquial mayor que los sanos (p = 0.029), confirmando un quiebre en el balance del microbioma que caracteriza la enfermedad.

Proxys: validados
Pero, por más interesantes que sean estos resultados, lo más relevante que sacamos de esta investigación fue la validación estadística de los proxys.
Usando tests estadísticos de Procrustes y test de Mantel, confirmamos que el microbioma de la piel y el de las branquias están fuertemente acoplados, al igual que el del poro urogenital y la mucosa intestinal.
Es decir, la piel es un buen proxy de las branquias y el poro urogenital un buen proxy del intestino.
Respecto a los modelos de machine learning, con los datos de los proxys, entrenamos y comparamos siete algoritmos de clasificación distintos.
“Procesamos todo mediante pipelines automatizados en la nube. Esto nos permitió manejar la carga computacional de forma elástica y asegurar que el análisis de cada muestra fuera reproducible” –Luis León, líder en bioinformática en Codebreaker
El objetivo fue predecir si un salmón está sano o no en base a su microbioma.
Después de la comparación de modelos, resultó que el óptimo es la regresión logística.
El AUC mide qué tan bien un modelo distingue entre distintos grupos y considera una puntuación de 1.0 como perfecta y 0.5 como azar. Para la piel, el modelo alcanzó un AUC de 0.967, y para el poro urogenital, se obtuvo un AUC de 0.869.
Con esto, pudimos formular los índices a los que apuntábamos.
El Skin Health Score (SHS), basado en la piel, y el Gut Health Score (GHS), basado en el poro urogenital. Ambos entregan un valor continuo entre 0 y 1, donde 0 representa un pez sano y 1 un pez lesionado.
Lo más interesante es la zona de transición: peces cuyos puntajes caen entre 0.5 y 0.8, con perfiles microbianos que ya divergieron del estado sano, pero que aún no muestran signos clínicos visibles. Esa zona es donde reside el potencial diagnóstico preventivo.
Cuando el microbioma se desvía de la línea estándar de un pez sano, podemos alertar de una posible enfermedad inminente.
Ahí está la capacidad de notificar la enfermedad antes de que ocurra.
Limitaciones del estudio
Como todo artículo científico, esta investigación tiene ciertas limitaciones que son desafíos a futuro.
Este estudio está diseñado en que la ground truth para el modelo de machine learning es en base a signos clínicos visuales. Esto significa que arroja los mismos resultados que los signos clínicos pero a través de una métrica cuantitativa estandarizada.
Esto quiere decir que nuestro modelo, técnicamente y por diseño, no puede detectar la enfermedad antes de que aparezcan los signos clínicos, sino que detecta cuando se pierde la normalidad en el microbioma.
Para conseguir detección temprana real, se tendrían que realizar estudios longitudinales con muestreos antes de una enfermedad. A pesar de esto, haber identificado una "zona de transición" en que los perfiles del microbioma divergen de la línea sana indica que existen estados intermedios y que futuras investigaciones podrían determinar si esos estados preceden la enfermedad.
En palabras de Agustín, “La pregunta grande es si el score puede detectar cambios antes de que aparezcan los signos clínicos, y para eso necesitas muestreos seriados en el tiempo.”
Por otro lado, todos los peces tienen procedencia de una misma cohorte del mismo centro. El product manager de Micro-ID™ indicó la importancia de la validación multi-centro. “Todos los peces vienen de una misma cohorte en un solo centro, y sabemos que el microbioma basal cambia según genética, agua, dieta, temperatura. Los umbrales del score probablemente necesitan calibrarse para cada contexto productivo.”
A pesar de esto, las relaciones de proxy establecidas y el rendimiento en la clasificación es una prueba de concepto muy fuerte.
Conclusión
Con este estudio logramos demostrar que los perfiles del microbioma de los salmones tienen información sobre el estado de salud y que pueden ser obtenidos con muestreos no invasivos. Además de esta información se puede traducir a puntajes cuantitativos de salud a través de machine learning.
Los dos puntajes de salud de salmón desarrollados aquí representan, a nuestro conocimiento, los primeros índices de salud del microbioma con múltiples parámetros en la industria acuícola.
A pesar de que aún se requiere validación de estudios longitudinales, los marcos de trabajo que desarrollamos sientan las bases de una transición en la industria. Pasando de reaccionar a la enfermedad a gestionar la salud a través de información del microbioma. Estos avances indican un potencial para reducir la dependencia a antibióticos y mejorar el bienestar de la producción.
For more information
Contact
+56995114707
dna@codebreaker.bio
Klenner 299, of. Patagonia hub tech, Puerto Varas


