Dinesh Thekkoot PhD, Genesus Inc

L'apprentissage machine (ML) est un mot à la mode depuis quelques années. ML est un sous-domaine de l'intelligence artificielle (IA) dédié à l'étude d'algorithmes permettant de prédire les résultats. Consciemment ou inconsciemment, nous sommes fortement dépendants du BC dans notre vie quotidienne.

Les assistants personnels virtuels comme Siri, Alexa et Google Now, les flux d’actualités personnalisés de nos médias sociaux, les suggestions d’amis figurant dans un flux Facebook, le filtrage des spams et des logiciels malveillants, les prévisions de trafic affichées sur notre GPS, etc. Certains des services / technologies que nous utilisons régulièrement sont basés sur des algorithmes ML.

Même si le BC joue un rôle très important dans notre vie quotidienne, l’application de cette technologie à la reproduction / production animale en est encore à ses balbutiements. L’évolution récente des technologies modernes telles que les systèmes d’alimentation et de pesage automatisés, l’imagerie numérique, le génotypage à grande échelle, etc. a permis aux agriculteurs, aux éleveurs et aux industries connexes de surveiller et de collecter en continu une grande quantité de données (données volumineuses) au niveau animal. un coût raisonnable.

Le nombre de lignes et de colonnes dans ces mégadonnées est souvent si grand qu'il est très difficile de visualiser cela à l'aide de programmes informatiques classiques. De plus, dans la plupart des cas, ces données ne sont pas toujours «propres», car elles peuvent contenir des valeurs manquantes, des valeurs aberrantes et des points de données indésirables.

Un autre problème est la quantité de données par animal dans le cas d'une évaluation génétique. La plupart des méthodes d'analyse des données actuelles supposent que le nombre de données par animal n'est pas important. Par exemple, supposons que si nous avons des truies 500, chaque truie aura quelques enregistrements de litière et quelques enregistrements de croissance, c'est-à-dire que nous avons des truies 500 avec des points de données 10 ou 15 pour chaque truie. Cependant, avec la technologie de collecte de données mise à jour, sur chacune de ces truies 500, nous pouvons avoir plus d'informations génériques 50,000, plusieurs milliers d'enregistrements d'ingestion de lactation et plusieurs milliers de mesures d'environnement de salle de mise bas telles que la température et l'humidité enregistrées toutes les minutes 5. Ainsi, les mêmes truies 500 auront chacune des milliers (voire des millions) de données. De nombreuses méthodes statistiques ont été développées pour résoudre ce problème, mais elles nécessitent des ressources informatiques extrêmement importantes. ML s'est avéré être une méthode efficace pour résoudre tous ces problèmes.

L'apprentissage à partir de données est le principe fondamental de l'apprentissage automatique. Il a pour objectif de choisir parmi un vaste ensemble de modèles d'analyse de données permettant de prédire les résultats avec le plus d'exactitude possible. Cette partie s'appelle le processus de formation. Il existe deux types de formation:

  1. Formation supervisée (Machine apprend des exemples existants comme les génotypes et les phénotypes correspondants) et
  2. Formation non supervisée (Aucun exemple préalable requis, comme dans le cas où nous n'avons que des génotypes).

Quelques-unes des applications de l'apprentissage automatique en zootechnie:

  • Prédiction génomique: L'une des premières tentatives de ML a été tentée dans la prédiction activée par le génome. Les premiers résultats montrent que les méthodes de ML ont donné de meilleurs résultats que les méthodes traditionnelles lorsque l'architecture génétique sous-jacente était complexe (lorsque les caractères étaient contrôlés par la dominance et / ou l'épistasie) (Li et al. (2018) Front. Genet. 9: 237).
  • Études d'association pangénomique (GWAS): Des publications ont montré que les méthodes de BC peuvent être utilisées pour réaliser des tests GWAS En outre, il a été démontré que les méthodes ML sont plus efficaces pour identifier un sous-ensemble de SNP ayant un lien direct avec des gènes candidats (Li et al. (2018) Front. Genet. 9: 237).
  • Imputation génotypique: Lors du génotypage, tous les marqueurs ne seront pas génotypés en raison de problèmes de qualité, et nous devrons prédire les génotypes de marqueurs manquants à l'aide d'un processus appelé imputation. Des études ont montré que les méthodes ML ont une plus grande précision pour imputer ces génotypes manquants (Morota et al. (2018) J. Anim. Sci. 96: 1540 – 1550).
  • Contrôle de qualité du phénotype: Les modèles ML se sont révélés efficaces pour identifier les données aberrantes dans les données et peuvent être appliqués au filtrage et à la modification des données avant l'évaluation génétique (Morota et al. (2018) J. Anim. Sci. 96: 1540 – 1550).
  • L'analyse d'image: Les méthodes ML peuvent être utilisées pour prédire le poids corporel à partir d'images de caméra plutôt que d'utiliser une échelle de poids, qui est laborieuse, prend du temps et crée du stress pour les animaux. Ces méthodes peuvent également être utilisées pour prédire la composition de la carcasse à partir d'images de caméras en ligne en temps réel.

Chez Genesus, nous générons de grandes quantités de données provenant de machines individuelles pour la consommation d'aliments, de programmes pour la qualité de la carcasse et de la viande de porc datant de plus de X ans, ainsi que du génotypage de nombreux candidats par semaine. Ces larges bandes de données peuvent être classées dans la catégorie des données volumineuses et font partie intégrante de notre programme d'évaluation génétique habituel, au même titre que nos phénotypes de croissance et de reproduction en cours.

Nous étudions actuellement des approches prédictives du BC pour analyser ces données plus efficacement. Toutes ces étapes contribueront à augmenter le taux d’amélioration génétique et profiteront finalement aux clients de Genesus.

Partagez ça ...
Partager sur LinkedIn
LinkedIn
Partager sur Facebook
Facebook
Tweet à ce sujet sur Twitter
Twitter

Catégorisé dans: ,

Cette publication a été écrite par Genesus