一小部分奶牛在产犊时会遇到问题,饲养员想知道哪些奶牛处于危险之中。利用荷兰养牛公司CRV的庞大数据集,格罗宁根大学的计算机科学家使用人工智能开发了一个预测模型,理论上可以将产犊问题的数量减半。他们在《预防兽医学》上发表了他们的研究结果。

在授精前预测产犊问题

养牛是数据科学。育种公司提供公牛的精液并记录其后代的成功。奶牛的产奶量和许多其他特征的数据与所有动物的遗传数据一起被收集并存储在一个巨大的数据库中。这使得公司可以为动物赋予“估计的育种价值”,并找到最佳育种的匹配项。

育种的一个方面是小牛的出生。在所有病例中,约有3.3%会在分娩过程中发生某种并发症,称为难产。“这可能包括需要拉小牛到需要兽医干预,”AhmadAlsahaf解释说。“有一些模型可以预测难产的风险,但这些模型仅适用于受精后可用的数据。我们想制作一个可以在受精前预测风险的模型。”

Alsahaf现在是格罗宁根大学医学中心细胞与系统生物医学科学系的博士后研究员,但他在攻读博士学位期间曾研究过难产的预测模型。荷兰格罗宁根大学伯努利数学、计算机科学和人工智能研究所智能系统研究小组的项目。

“我们被要求为养牛公司CRV创建这个模型,他们给了我们一个包含奶牛和公牛信息的大型数据集,”Alsahaf说。“我们首先使用机器学习系统来分析数据并创建一个临时模型。然后,我们检查了最重要的风险因素是否有意义。他们这样做了,因此,我们着手构建一个完整的模型。”

有两个主要挑战:第一个是清理和编译可用数据。第二个是只有3.3%的怀孕母牛经历过难产。“这意味着我们的数据集存在巨大的不平衡,”Alsahaf解释说。为了解决这个问题,他创建了大量具有平衡数据的子集,并将这些子集聚合起来以训练预测模型。“随后,我们在未用于训练的数据子集上测试了该模型,并研究了结果。”事实证明,该模型的表现明显好于偶然。

“我们的一位同事计算出,在理想情况下,我们的模型可以将难产的风险大致降低一半。但这需要公牛和母牛的理想组合,这并不总是可能的。”尽管如此,该模型可以帮助农民和育种公司在授精前评估特定交配的风险。“这很重要,因为到目前为止,所有其他模型都需要在授精后收集信息,这意味着你并没有真正预防并发症。”