type
status
date
slug
summary
tags
category
icon
password
URL
关于大数据让世界变得更美好的话题有很多,理解这一点的最好例子就是分析大数据在医疗保健行业的使用。医疗保健中的大数据用于降低成本开销、治疗疾病、提高利润、预测流行病以及通过预防死亡来提高人类生活质量。科学研究实验室、医院和其他医疗机构正在利用大数据分析,通过改变治疗提供模式来降低医疗成本。这里开始医疗保健大数据之旅,重点介绍大数据在医疗保健行业的重要应用。
医疗健康行业大数据
总部位于纽约的研究和咨询公司健康技术转型研究所估计,2011 年,美国医疗保健行业产生了 1500 亿千兆字节(150 艾字节)的数据。这些数据主要是由各种监管要求、记录保存、合规性和患者护理生成的。从那时起,数据呈指数级增长,导致医疗保健行业的医疗保健数据解决方案支出达 1.2 万亿美元。麦肯锡预计,在医疗保健领域使用大数据可以减少 3000 亿至 5000 亿美元的医疗数据管理费用。
医疗保健中的大数据源于大型电子健康数据集——这些数据集很难用传统的硬件和软件来管理。使用遗留数据管理方法和工具也使得不可能有效地利用所有这些数据。医疗保健中的大数据是一个压倒性的概念,不仅因为数据量大,还因为数据类型不同以及医疗保健数据管理需要管理的速度。与患者及其健康相关的数据总和构成了医疗保健行业的“大数据”问题。大数据分析实际上也已成为医疗保健信息学中一个正在兴起的关键问题。医疗信息学还通过在数据知识表示、数据库设计、数据查询和临床决策支持方面提出新的挑战,为大数据分析技术的发展做出贡献。
尽管医疗保健领域的大部分数据都以印刷形式存储,但最近的趋势是这些数据快速数字化。医疗保健行业的大数据有望支持多种医疗保健数据管理功能,例如人口健康管理、临床决策支持和疾病监测。医疗保健行业在大数据的大规模集成和分析方面仍处于起步阶段。
由于 80% 的医疗保健数据是非结构化的,医疗保健行业如何理解所有这些数据并将其有效地用于临床操作、医学研究和治疗课程是一项挑战。
医疗保健领域的大数据量预计在未来几年将增长,医疗保健行业预计将随着医疗保健报销模式的变化而增长,从而对医疗保健环境构成严峻挑战。尽管利润并不是唯一的动机,但对于大数据医疗保健公司来说,利用一流的技术和工具来有效利用医疗保健中的大数据是极其重要的。否则,这些大数据医疗保健公司在产生盈利收入方面可能会如履薄冰。
大数据在医疗健康行业的应用
下面列出了医疗保健行业大数据分析的顶级示例:
- 预测分析
- 实时患者监护
- 临床决策支持
- 公共卫生管理
- 健康监测和可穿戴设备
- 欺诈检测和预防
- 运营效率
- 实时疾病监测
- 供应链优化
- 健康保险分析
- 患者参与和个性化护理
- 患者安全和质量改进
医疗保健数据解决方案对 Hadoop 的需求
UCI 信息解决方案架构师 Charles Boicey 表示:“Hadoop 是唯一允许医疗保健以其本机形式存储数据的技术。如果 Hadoop 不存在,我们仍然必须决定什么可以进入我们的数据仓库或电子病历(以及什么不能进入)。现在我们可以将所有内容引入Hadoop,无论数据格式或摄取速度如何。如果我找到新的数据源,我可以在了解它的当天开始存储它。我们不会留下任何数据。”
到2016年底,数百万人的健康记录数量可能会增加到数百亿。因此,计算技术和基础设施必须能够以经济有效的方式实现:
- 不受约束的并行数据处理。
- 为数十亿和数万亿的非结构化数据集提供存储。
- 系统的容错性和高可用性。
Hadoop 技术成功地应对了医疗保健行业面临的上述挑战,因为 MapReduce 引擎和 HDFS 具有处理数千 TB 数据的能力。Hadoop 利用廉价的商品硬件,使其成为医疗保健行业的一项口袋友好的投资。
以下是大数据和 Hadoop 的 5 种医疗数据解决方案:
1. Hadoop技术在癌症治疗和基因组学中的应用
Amazon Web Services 首席产品经理 Deepak Singh 表示:“我们确实看到了生命科学界采用 Hadoop 的趋势,主要针对下一代测序和简单的读映射,因为开发人员发现,的生物信息学问题可以很好地转移到 Hadoop,尤其是在规模上。”
行业报告显示,人类DNA大约有30亿个碱基对,如果我们要对抗癌症,就需要有效地组织如此大量的数据。癌症尚未治愈的最大原因是癌症会根据个体的基因组成以不同的模式突变并以不同的方式反应。因此,肿瘤学研究人员提出了一个解决方案:为了治愈癌症,患者需要根据个体患者的遗传组成的癌症类型进行个性化治疗。利用 Hadoop 技术将为并行化提供强大支持,并有助于使用 MapReduce程序映射 30 亿个 DNA 碱基对。
英特尔健康与生命科学全球总监 Ketan Paranjape 在讨论医疗保健分析的现状和未来方向时,谈到了他在这些投资的基础上所做的努力。Paranjape 表示,在医疗保健领域使用 Hadoop 的目标是收集和分析数据,这些数据可以用于从评估数百万人地区的公共卫生趋势到为一名癌症患者确定治疗方案等各种用途。
英国首相戴维·卡梅伦于 2014 年 8 月宣布政府拨款 3 亿英镑,用于为期 4 年的项目,目标是与美国生物技术公司 Illumina 和 Genomics England 合作,到 2017 年底绘制 100,000 个人类基因组图谱。该项目的主要目标是利用医疗保健中的大数据为癌症患者开发个性化药物。
CASI pr 亚利桑那州立大学的复杂自适应系统计划正在开发一个基因组数据湖,其中包含有关个人和治疗的 PB 级遗传数据,可能有助于识别癌症基因,并为通过大数据分析开发挽救生命的癌症治疗方法提供基础。
让我们看看基因组数据有多大、有多复杂以及 Hadoop 如何解决这个问题。我们将考虑一种治疗癌症的药物,该药物已被宣布对对抗这种致命疾病有 40% 的效果。这可能意味着很多事情。这可能意味着对于具有某种遗传特征或区域的患者——该药物是100%有效的。但这也可能意味着不具有合适的遗传特征或来自不利于健康的环境的患者对该药物根本没有反应。对于他们来说,药物将显示出0%的有效率。
医疗保健数据之所以如此复杂,是因为人类的单个基因组有 20,000 个不同的基因。现在假设我们将这些数据存储在传统数据库中,并将每个基因组与 100 万个可变 DNA 结合起来,那么这意味着 - 对于每个人来说,将有 200 亿行数据。传统系统无法处理这种大数据的准确性。
2. Hadoop技术在患者生命体征监测中的应用
世界各地有多家医院使用 Hadoop 来帮助医院工作人员利用大数据高效工作。如果没有 Hadoop,大多数患者护理系统甚至无法想象使用非结构化数据进行分析。
图片来源: slideshare.net
亚特兰大儿童医疗中心的 ICU 病房治疗了 6,200 多名儿童。平均而言,儿科 ICU 的住院时间从一个月到一年不等。亚特兰大儿童医疗中心在床边使用了一个传感器,帮助他们持续跟踪患者的体征,如血压、心跳和呼吸频率。这些传感器产生大量数据,使用旧系统无法将这些数据存储超过 3 天进行分析。亚特兰大儿童医疗中心的主要动机是存储和分析生命体征。如果模式发生任何变化,医院希望向医生和助理团队发出警报。所有这一切都是使用Hadoop 生态系统组件(Hive、Flume、Sqoop、Spark和 Impala)成功实现的。
3. Hadoop技术在医院网络中的应用
克利夫兰诊所的一家衍生公司 Explorys 正在医疗保健领域利用大数据来提供最佳的临床支持、降低护理测量成本并管理高危患者群体。据报道,Explorys 借助 Hadoop 构建了医疗保健行业最大的数据库,拥有超过千亿个数据点。
Explorys 使用 Hadoop 技术帮助其医疗专家实时分析来自不同来源的数据轰炸,例如财务数据、工资数据和电子健康记录。
Explorys 开发的分析工具用于数据挖掘,帮助临床医生确定患者之间的偏差以及治疗对其健康的影响。这些见解有助于医生和医疗保健提供者为一组患者群体或单个患者找出最佳治疗计划。
4. 医疗智能中的Hadoop技术
医疗保险业务的运作方式是整理相关成本(风险)并将其除以风险组的成员数量。在这种情况下,数据和结果总是动态且变化的。在医疗保健智能应用程序中使用 Hadoop 技术可以帮助医院、付款人和医疗保健机构通过设计智能业务解决方案来提高竞争优势。
例如,假设一家医疗保险公司有兴趣查找特定地区的年龄,其中低于该年龄的个人不会患某些疾病。这些数据将帮助保险公司计算保单成本。为了收集所需的年龄,保险公司将必须处理庞大的数据集,以提取有意义的信息,例如药物、疾病、症状、意见、地理区域详细信息等。在这种情况下,使用 Hadoop 的 Pig、 Hive 和 MapReduce 是处理此类信息的最佳解决方案大型数据集。
DignityHealth 的 IT 总监 Sunil Kakre 在最近的 Hadoop 峰会上谈到了他们将医疗保健分析迁移到 Hadoop 的历程。DignityHealth 是美国领先的医疗保健提供商之一。他们在一年前开始了迁移到 Hadoop 的旅程。随着 Hadoop 不断发展并变得更加成熟,它正在帮助消除医疗保健行业在使用遗留系统时所面临的挑战。医疗保健行业的数据多种多样且不可预测。业务面临着巨大的压力 - 因为许多事情都在不断变化,例如政策、法规等。需要一个强大的工具,该工具具有分析能力来分析这些不断变化的数据。这就是 Hadoop 应用程序的用武之地。
让我们举个例子。在美国,超过一百万人受到败血症的影响。近 28 - 50% 受此病影响的人死亡。这个数字高于死于前列腺癌、乳腺癌和艾滋病的总人数。之所以采用这个例子,是因为情况对时间敏感。您分析和反应越早,您可以挽救的生命就越多。想象一下,如果您可以分析有多少人因这种情况住院以及有多少人因此而死亡,那么这种情况导致的死亡和治愈的时间间隔是多少。想象一下,如果您可以围绕脓毒症状况进行分析,并构建一个探索性或智能工具来预测仍然可以治愈的脓毒症患者数量,您就可以挽救生命。
DignityHealth 处理来自 40 多家医院和多个医疗保健系统的约 30 多 TB 数据。但数据存储在筒仓中。我们需要将这些数据集中到一个地方,以便可以对其进行分析以解决一种常见的疾病。这是Hadoop应用程序真正发挥作用的 绝佳机会。
5. Hadoop技术在欺诈预防和检测中的应用
至少 10% 的医疗保险付款归因于欺诈性索赔。在全世界范围内,这估计是一个价值数十亿美元的问题。欺诈性索赔并不是一个新问题,但保险欺诈的复杂性似乎呈指数级增长,使得医疗保险公司难以应对。
大数据分析帮助医疗保险公司找到不同的方法来早期识别和预防欺诈。保险公司利用 Hadoop 技术,利用医疗索赔的实时和历史数据、天气数据、工资、录音、人口统计、律师费用和呼叫中心记录,成功开发了预测模型来识别欺诈者。Hadoop 能够在 NoSQL 数据库中存储大型非结构化数据集并使用 MapReduce 分析这些数据,有助于分析和检测欺诈检测领域的模式。
医疗保健行业大数据的增长得益于存储成本的下降。早在 5 年前,具有永久软件许可证的可扩展关系数据库的成本为每 TB 100,000 美元,此外每年还需要 20,000 美元的支持和维护成本。现在,随着 Hadoop 在大数据分析领域的出现,只需每年 1,200 美元的订阅费用就可以存储、管理和分析相同数量的数据。在医疗保健领域使用 Hadoop 技术的需求不断增长,这将消除医疗保健行业中“一刀切”的药物和治疗概念。未来几年,医疗保健行业将以可控的成本提供个性化的患者药物。
医疗保健大数据常见问题解答
医疗保健领域有哪些大数据项目?
医疗保健领域一些著名的大数据项目包括精准医学计划、癌症基因组图谱 (TCGA) 以及在电子健康记录 (EHR) 中利用大数据分析来改善临床决策和患者治疗结果。
列出一些医疗保健领域的大数据示例?
以下是医疗保健大数据的一些示例:
- 电子健康记录 (EHR)
- 医学影像分析
- 药物发现和临床试验
- 健康保险索赔分析
- 公共卫生监测
- 作者:AI新闻和思维
- 链接:https://ainio.fun/article/fb0d598e-ff49-4b96-a0b0-e1fc4a263ee7
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。