一组研究人员开发了一种机器学习模型,该模型利用新闻文章的内容来有效预测面临粮食不安全风险的地点。该模型可用于帮助优先分配脆弱地区的紧急粮食援助,标志着对现有测量的改进。

您可以使用的新闻更好地预测粮食危机的爆发

纽约大学 Courant 研究所客座研究员 Samuel Fraiberger 说:“我们的方法可以使用实时新闻流和易于解释的预测模型,大大提高对粮食危机爆发提前 12 个月的预测。”数学科学博士,世界银行的数据科学家,以及该研究的作者,该研究发表在《科学进展》杂志上。

“传统的粮食不安全风险因素衡量标准,例如冲突严重程度指数或食品价格变化,通常是不完整的、延迟的或过时的,”Courant 研究所教授、该论文的作者之一 Lakshminarayanan Subramanian 补充道。“我们的方法利用了这样一个事实,即在用传统测量方法观察到之前,新闻中提到了引发粮食危机的风险因素。”

粮食不安全威胁着全世界数亿人的生命。根据联合国粮食及农业组织的数据,营养不良人数从 2014 年的 6.24 亿人增加到 2019 年的 6.88 亿人。该论文的作者指出,自那时以来,由于 Covid-19 大流行、气候变化,情况已经恶化和武装冲突——2021 年,全球有 702 至 8.28 亿人面临饥饿。此外,到 2021 年,全球和每个地区的严重粮食不安全状况都有所增加。

尽管这种痛苦具有严重和广泛的性质,但目前检测未来粮食危机的方法依赖于不充分的风险措施,阻碍了解决这些危机的努力。

在努力开发更好的模型时,该论文的作者(其中还包括 Courant 博士毕业生 Ananth Balashankar)考虑了这样一种可能性,即提供当地发展的实时、实地报道的新闻报道可以作为一种可能性即将发生的粮食危机的预警系统。

研究人员从 1980 年至 2020 年间发表的超过 1100 万篇新闻文章中收集了文本,重点关注近 40 个粮食不安全国家。然后他们开发了一种方法来提取这些文章中与粮食不安全相关的特定短语,并以捕捉新闻评估的方式非常详细。具体来说,该工具考虑了近 170 个文本特征,以便正确衡量与粮食不安全有关的短语的语义,并在文章出现时进行标记。以下是南苏丹的一个例子,它概述了地点和风险因素:“饥荒可能会在该国的一些地区再次出现,皮博尔县东部,那里的洪水和害虫肆虐庄稼,风险特别大。”

然后,他们考虑了一系列粮食不安全风险因素的数据——例如冲突死亡人数、降雨量、植被和粮食价格变化——以确定这些因素的新闻提及与其在研究国家和地区的发生之间是否存在相关性地区。在这里,他们发现报道的性质与这些因素的实际发生率之间存在高度相关性,表明新闻报道是所研究条件的准确指标。

但要确定新闻文章是否真的能很好地预测随后的粮食危机,团队需要知道报道的性质是否是未来危机的可行指标,以及这些报道是否比传统测量方法更准确。研究人员使用较小的一组新闻报道发现,从 2009 年到 2020 年,在 21 个粮食不安全国家,新闻报道对当地粮食不安全水平的预测比以往更准确——而且最多提前 12 个月——不包括新闻故事文本的传统测量。值得注意的是,他们还发现补充结合新闻报道的传统预测措施进一步提高了粮食危机预测的准确性,表明“混合”模型的价值。

研究人员还看到了他们工作的潜在更大用途。

“新闻指标可以扩展到预测疾病爆发和气候变化的未来影响,”Balashankar 观察到。