logo软云

首页 > 公司资讯 > 资讯详情

Elsevier称:医药研发是时候理清数据管理战略了

来源:36大数据 时间:2015-11-27 浏览量:3116

新兴技术的出现对生命科学和药物开发研究领域的数据能力和利用率有着显著的影响。随着便携式设备和移动健康应用的日益普及,社交媒体的广泛使用,更多的数据流可供研究人员提取有价值的信息。


随着像苹果和谷歌这样拥有直接面向消费者的产品, 服务和伙伴关系(如23andMeresearchkit)的公司直接或合作进入生命科学市场,大量收集数据的潜力进一步增长。虽然这些丰富的数据为科学家提供了更多了解病人个体层面的机会,但同时也带来了一个严峻的数据管理挑战。


一个关键的因素是,不管数据是来自科学杂志,电子病历(EMR),社交媒体或是便携设备,我们只能有效地分析这些数据是否被组织好了。


然而,拥有如此多信息的意义是什么呢,如果你不能理解它?这是下一代信息学解决方案的来源。从这片数据海洋中获取可操作的信息,生命科学和制药公司需要一个明确的数据管理策略,以协调数据,支持这一关键需求。


作者Tim Hoctor


大数据——实时同步


在制药和生命科学的研发领域,大数据被更多关注的只是今天的数据。除了上文提到的较新的数据源,生命科学和制药公司只考虑一些典型的数据流,如电子病历,基因组学和筛选数据,临床试验数据,移动诊断和监测数据。信息的复合增长将促使人们认识到,数据是从从实事实时转换,因为数据可直接从个体中得以应用。


我们在数据的多样性和质量方面面临着挑战。数据被捕获具有不同程度的细节,缺乏协调和标准。随着不完整的,未经证实的,过期或收回的信息经常被发现,信息的信任级别也各不相同。这种一致性的缺乏给我们带来巨大的挑战。


如何利用数据有效而迅速地做出可靠的临床药物研发决策,或精确地预测研究和治疗的成效呢?


新战略需要——协调数据


鉴于获得单一药物对市场的平均成本超过20亿美元,且需要长达15年的时间,研究人员必须能够从数据中获得可靠的意见,从而最大限度地降低风险。


制药和生命科学公司需要一个新的思维模式,和不断地进行新的数据分析,以使数据在整个企业中协调一致。这种集体和一致的方法可能会对研究决策提供参考,但当研究处于信息孤岛时,这种方法也没什么用。


许多组织依赖人工管理数据,个别科学家和研究机构在不同的时间,用不同的方式在数据中寻找答案。因此,协调数据可以让研究人员跨越不同的平台,使用类似的算法搜索不同的数据源,并使看似无关的信息产生联系。


这种数据的协调应该在收集数据的时候就开始,保留数据的背景至关重要。只有这样,才能为研究人员提取一些有用的信息。


生命科学和技术——灰色地带


新技术增加了信息泛滥,数据的协调不仅适用于多源和内部的数据,也适用于外部,第三方和商业数据。我们已经看到制药公司在使用技术方面取得了很大的进步,例如罗氏公司在帕金森临床试验上使用智能手机连续收集患者数据。


然而,随着像谷歌和苹果这样的公司开始进入传统的生活科学领域,制药公司面临着巨大的挑战。制药公司不想成为科技公司,但苹果和谷歌已经提高了公众对科技快速发展的期望。制药公司面临的挑战是如何利用现有数据来产生并行数据。


公众的理解是就像他们的智能手表,可以发送患有特殊疾病和药物治疗患者的关键数据。这些数据可以随时被捕获和查看,同样也可以进行实时利用。公众在谷歌时代,对数据可用和数据可操作的区分比较模糊。


随着数据多样性的发展以及相关人口原因,数据开始呈现复杂性成倍增长的态势。谷歌和苹果已经开始采取基因分型和表型的方法,加快DNA排序和筛选的商品化进程。但对于制药公司而言,真正具有巨大意义的是,辅助数据集正在生成。


把数据交到科学家手中


最后,所有这些收集数据的新技术和新方法,需要科学的专业知识并结合相关的系统组织信息,以便研究人员顺利获取。一旦数据收集和数据协调的工作完成,通过语义组织分析和准确的文本挖掘,研究者将有效获取潜藏在信息海洋中的相关数据,而这也是获取数据的关键举措。


为了成功地组织信息,使其可以通过新一代信息技术解决方案显现出来,数据必须由专业设计的分类法和本体来支配。通过详细的分类,将数据进行解析和索引,研究人员才能在不同的数据集之间探索出新的关联和趋势。


通过下一代信息学解决方案来提取有意义的答案,使得研究人员能够做出可靠的、具有数据驱动的决策。


通过增强数据的实用性,研究人员可以从中获取有效意见,此类意见的可操作性也大大增强,从而对企业的关键性决策产生重大影响,并进一步惊醒企业,在企业对所做决定进行重新评估时。


生命科学研究者手中数据的潜在力量是巨大的,只要有合适的工具,研究人员就可以利用这些数据,在提高生产效率的同时也为新的发现奠定坚实的基础。