Dinesh Thekkoot PhD, Genesus Inc

Ang pag-aaral ng machine (ML) ay naging buzz word para sa nakaraang ilang taon. Ang ML ay isang subfield ng artificial intelligence (AI) na nakatuon sa pag-aaral ng mga algorithm upang mahulaan ang mga kinalabasan. Sa kamalayan o hindi alam namin ang nakasalalay sa ML sa aming pang-araw-araw na buhay.

Ang Virtual personal assistants tulad ng Siri, Alexa at Google Now, ang personalized feed ng balita sa aming social media, mga mungkahi ng kaibigan na nakikita namin sa isang Facebook feed, email spam at pag-filter ng malware, ang mga hula ng trapiko na nakikita namin sa aming GPS, atbp. ang ilan sa mga serbisyo / teknolohiya na ginagamit namin nang regular na batay sa mga algorithm ng ML.

Kahit na ang ML ay may napakahalagang papel sa ating pang-araw-araw na buhay, ang aplikasyon ng teknolohiyang ito sa pag-aanak / produksyon ng hayop ay pa rin sa pagkabata. Ang kamakailang mga pagpapaunlad sa mga makabagong teknolohiya tulad ng mga awtomatikong pagpapakain at pagtimbang ng mga sistema, digital imaging, malakihang genotyping, atbp. Ay nagpapagana ng mga magsasaka, mga breeder, at mga kaugnay na industriya upang patuloy na subaybayan at mangolekta ng isang malaking halaga ng data (malaking data) sa antas ng hayop sa isang makatwirang gastos.

Ang bilang ng mga hilera at hanay sa malaking data na ito ay kadalasang napakalaki na napakahirap isiping ito gamit ang mga regular na programa sa computer. Gayundin, sa karamihan ng mga kaso, ang data na ito ay hindi palaging "malinis", dahil maaari itong maglaman ng mga nawawalang halaga, outlier, at mga hindi gustong data point.

Ang isa pang isyu ay ang dami ng data sa bawat hayop sa kaso ng genetic evaluation. Ang karamihan sa kasalukuyang data na pinag-aaralan ang mga pamamaraan ay ipinapalagay na ang bilang ng mga piraso ng data sa bawat hayop ay hindi malaki. Halimbawa, ipagpalagay kung mayroon tayong mga 500 sows, ang bawat maghasik ay magkakaroon ng ilang mga talaan ng basura at ilang mga tala ng paglago, ibig sabihin, mayroon tayong mga 500 na nagbibigay ng mga puntos ng 10 o 15 para sa bawat maghasik. Gayunpaman, ang na-update na teknolohiya sa pagkolekta ng data, sa bawat isa sa mga ito ay nagbibigay ng 500 na may higit sa 50,000 na mga piraso ng impormasyon ng genotype, maraming libong lactation feed record at ilang libong farrowing room environment sinusukat tulad ng temperatura at halumigmig na naitala bawat 5 minuto. Kaya, ang parehong sows 500 ay magkakaroon ng libu-libong (o kahit milyon-milyon) ng mga piraso ng data. Maraming istatistikang pamamaraan na binuo upang matugunan ang problemang ito, ngunit nangangailangan ito ng napakalaking malaking halaga ng mga mapagkukunan ng computer. Ang ML ay napatunayang isang mahusay na paraan upang matugunan ang lahat ng mga isyung ito.

Ang pag-aaral mula sa data ay ang pangunahing prinsipyo ng pag-aaral ng machine, at nilalayon nito na pumili mula sa isang malaking pool ng mga modelo ng pagtatasa ng data, na maaaring mahuhulaan ang mga resulta nang tumpak. Ang bahaging ito ay tinatawag na proseso ng pagsasanay, at may dalawang uri ng pagsasanay:

  1. Pinangangasiwaan na pagsasanay (Machine natututo mula sa mga umiiral na mga halimbawa tulad ng genotypes at kaukulang mga phenotypes) at
  2. Unsupervised training (Walang naunang mga halimbawa ang kinakailangan, tulad ng sitwasyon kung saan mayroon lamang tayo mga genotype).

Ang ilan sa mga aplikasyon ng pag-aaral ng makina sa agham ng hayop:

  • Genomic prediction: Ang isa sa pinakamaagang pagtatangka ng ML ay sinubukan sa pinagana ng genome na hula. Ang mga paunang resulta ay nagpapakita na ang mga pamamaraan ng ML ay mas mahusay kaysa sa mga tradisyonal na pamamaraan kung ang pangkaraniwang arkitektong genetiko ay kumplikado (kapag ang mga katangian ay kinokontrol ng pangingibabaw at / o epistasis) (Li et al., 2018).
  • Genome-wide associations studies (GWAS): Ipinakikita ng mga publisher na ang mga pamamaraan ng ML ay maaaring gamitin para sa pagsasagawa ng GWAS. Gayundin, ang mga pamamaraang ML ay pinapakita na maging mas mahusay sa pagtukoy ng isang subset ng SNP na may direktang link sa mga kandidato na gene (Li et al. (2018) Front, Genet 9: 237).
  • Imputasyon ng genotype: Habang ang genotyping, hindi lahat ng mga marker ay makakakuha ng genotyped dahil sa mga isyu sa kalidad, at kailangan nating hulaan ang nawawalang mga genotype ng marker gamit ang proseso na tinatawag na imputasyon. Ipinakita ng mga pag-aaral na ang mga pamamaraan ng ML ay may mas mataas na katumpakan para sa pagpapalagay ng mga nawawalang mga genotype na ito (Morota et al. (2018) J. Anim na Sci 96: 1540-1550).
  • Suriin ang kalidad ng phenotype: Ang mga modelo ng ML ay pinapakita na maging matagumpay sa pagtukoy ng mga outliers sa data at maaaring ilapat sa filter at i-edit ang data bago ang genetic na pagsusuri (Morota et al (2018) J. Anim Sci.96: 1540-1550).
  • Pag-aaral ng larawan: Ang mga pamamaraan ng ML ay maaaring gamitin para sa predicting timbang ng katawan mula sa mga imahe ng kamera sa halip na gamit ang isang timbang na sukat, na kung saan ay laborious, oras-ubos at nagiging sanhi ng stress sa mga hayop. Gayundin, ang mga pamamaraan na ito ay maaaring gamitin upang mahulaan ang komposisyon ng bangkay mula sa on-line na mga larawan ng camera sa real time.

Sa Genesus, nagmumula kami ng maraming data mula sa mga indibidwal na mga feed intake machine, carcass, at mga programa sa kalidad ng baboy na nagsisimula sa higit sa 20 na taon, at mula sa pag-genotype ng maraming kandidato sa pagpili sa bawat linggo. Ang mga malalaking swaths ng data ay maaaring mauri sa ilalim ng malaking kategorya ng data at naging mahalagang bahagi ng aming regular na genetic evaluation program, kasama ang aming regular na paglago at reproductive phenotypes.

Sa kasalukuyan, kami ay nasa proseso ng pagsisiyasat ng mga predictive ML approach para sa pagsusuri ng mga data na ito nang mas mahusay. Ang lahat ng mga hakbang na ito ay makakatulong upang madagdagan ang rate ng pagpapabuti ng genetic at sa katapusan ay makikinabang sa mga customer ng Genesus.

Nakategorya sa: ,

Ang post na ito ay isinulat ni Genesus