IBM使用大数据来预测登革热和疟疾的爆发
IBM与大学研究人员合作,使用大数据和分析来预测登革热和疟疾等致命疾病的爆发。
加利福尼亚州三濑议院IBM Almaden研究中心IBM研究中心的公共卫生经理James Kaufman表示,该研究旨在了解实时疾病的传播,以便更好地部署公共卫生资源。
但不仅仅是预测IBM,Johns Hopkin大学的研究人员和旧金山的加州大学的研究人员正在将分析从大型数据集应用,看看降雨,温度,甚至土壤酸度的变化如何大大影响携带疾病的野生动物和昆虫的群体。他们还将该信息与其他数据(如机场和公路交通)合并,以进一步了解爆发。
为此,IBM创建了一个开源建模应用程序,被称为Spatio Temporal流行病学建模仪(Stew),允许使用任何类型的数据与疾病数据快速组合和相关。由于蚊子的蔓延,这项研究对于了解登革热,这对德克萨斯州和佛罗里达州的地点来说很重要。该疾病曾经被认为是仅限于热带或发展中国家的疾病,但它在世界各地出现。部分原因是全球运输,贸易和气候变化的兴起。登革热蔓延到100多个国家,疟疾仍然负责每年百万死亡。
分析已被用来预测您在亚马逊上的旁边购买的内容,或者您是否在Farmville等游戏中支付的物品。但它在公共卫生和疾病研究等领域也很有用。现实世界中的一些相似之处:沃尔玛使用其商店中的销售数据来预测流感季节何时开始,何时在货架上放置更多药物。谷歌能够根据人们对流感症状进行的搜索来预测流感。
“我们希望让人们更轻松地收集和使用与开源工具进行研究的数据,”Kaufman表示。“使对疾病预测的能力产生最大的差异是您数据的质量。但大多数情况通常在您可以访问的数据中有一个限制。“
在过去,它经常花年收集疾病监测数据。Kaufman表示,随着美国在全国各地的电子健康记录中实现了电子健康记录,越来越容易访问数据。现在,数据可以在云或网络连接的数据中心攻击,并快速分析。用茎,科学家使用人口分析,疾病途径算法,以及强大的计算,建立这些传染病的现实和可访问的模型。
“公共卫生官员不能在流行病中进行猜测。他们需要准确,及时地访问数据,看看疾病的潜在差异可能在一段时间内为特定地理区域提供什么,“Kaufman说。
与疟疾,研究人员使用来自世界卫生组织的模型和数据。他们能够了解当地气候和温度如何影响疾病的传播。现在,他们可以将该数据用于下一个爆发的位置。茎是免费的,对任何选择以开放方式建立在其基础的科学家上开放。Stew 2.0将于10月15日通过Eclipse Foundation提供。
“那里有很多默契假设关于气候变化会影响疟疾等疾病的分布。这项工作表明事情可能不是那么简单。在一个地方的疟疾传播产生巨大影响可能不会在别的地方那么重要,“Johns Hopkins Bloomberg公共卫生学院Justin Lastl说。“关于开源项目的一个很好的事情,如Step,现在谁想要下载模型并开始调整它,看看他们自己的数据或假设是否从根本上改变了结果。”
“重要的是要认识到理论和计算科学家,疾病专家和公共卫生官员的协同努力,这对我们对抗传染病有多迅速和有效的差异,”UC旧金山的生物工程和治疗科学的Simone Bianco表示。“我们必须准备好戴着帽子,通过全球疾病监测系统的不同数据,进行计算激烈的研究,并将我们的知识转移给公共卫生官员,以帮助他们可视化人口健康,检测爆发,开发新型模型,并评估政策的有效性。“
该研究发表于同行评审期刊疟疾和理论生物学。