研究机构可以大大减少数据量,分析有价值的科学观点|滔搏电竞

产品中心 | 2020-11-01
本文摘要:目前基因组学正处于这样一个拐点:人类基因组测序的成本已经超过1000美元,预计以后还会上升(2003年为30亿美元)。随着测序成本的降低,基因检测变得更加广泛,合适的基因组数据大大减少。随着测序技术的发展,研究人员面临着如何管理和分析这些海量和非结构化基因组数据的挑战。

基因组

如今,海量数据以一种令人印象深刻的方式影响着基因组学和其他生命科学领域的科学家和研究人员。原因有二。第一,随着更多数据源的重新录入,研究人员无法管理收集到的雪崩般的数据;其次,研究者缺乏缓慢计算数据,将数据转化为有价值的科学观点的能力。

目前基因组学正处于这样一个拐点:人类基因组测序的成本已经超过1000美元,预计以后还会上升(2003年为30亿美元)。随着测序成本的降低,基因检测变得更加广泛,合适的基因组数据大大减少。

科学

仅仅一个人的基因组“操作”不会产生0.5 TB (1 TB=1024 GB)的原始数据图像文件。这些文件非常简单,包括集中式和非结构化的科学数据,无法管理和分析。随着测序技术的发展,研究人员面临着如何管理和分析这些海量和非结构化基因组数据的挑战。

一般来说,这些数据都是从世界各地的学术研究、临床试验和药物研究中产生的。如今,许多组织必须分析和管理更先进的数据,并将其应用于药物研发、疾病基因检测,并在临床应用中创造个性化的化疗。而基因组测序是一个简单的多步骤过程,也包括DNA序列加载、基因组序列拼接、可变区序列分析和轻测序。现实是:在过去的十年里,我们使用的技术太强,无法分析这些关键数据。

这项技术有望在未来被新技术取代,因为随着基因测序公司的不断创新和发展,他们对数据分析的市场需求增长更加缓慢和快速。同时,人们对基因组测序的市场需求更低。

研究

所以技术专家要做的就是让这些数据可以通过简单的高性能计算(HPC)或者超级计算机和大数据技术进行分析,让基因组数据的管理和分析更加方便有效。大数据自身的问题在个性化医疗中持续存在,同时爆炸式的数据增长迅速,因为医生和研究人员期望通过基因测序的方式,根据患者的疾病表现和耐药性,对不同的患者进行最佳的个性化化疗。

科学

同时,随着基因组学研究经费的大幅减少,基因测序更加商业化,进一步推动了个性化医学的发展。涉及的案例是凯泽佩尔曼恩特收集了美国多达21万名患者的DNA样本和病历,然后创建了世界上第二个唯一也是最全面准确的医学数据库。在此基础上,研究人员希望找到影响各种遗传病的特定基因,从而提高临床、化疗和疾病预防在临床上的应用。当然,为了顺利区分这些简单、易学、非结构化的科学数据,研究人员必须能够高速、大批量地计算分析数据,拥有灵活的计算系统,但传统的计算系统跟不上数据市场需求的发展。

仍然相信,随着现代超级计算技术的实施,研究机构可以大大减少数据量,分析有价值的科学观点。


本文关键词:个性化,基因测序,分析,基因组测序,人员,滔搏电竞

本文来源:滔搏电竞-www.suburban-homes.com