■本报记者 姜澎
全球首张人类表型组导航图初步绘就,科学家就表型数据共享原则达成共识。这是在北京时间11月19日晚,国际人类表型组研究协作组(IHPC)第三次理事会传来的消息。同时,已有来自六大洲20个国家、23家机构的学者加入国际人类表型组研究协作组,人类表型组国际大科学计划的国际科技合作与协同创新得到进一步优化。
“导航图”绘制基于上海核心队列
人类表型组被国际科学界认为是继基因组之后生命科学的又一个战略制高点和原始创新源。
人类基因与包括生活方式在内的环境共同决定了人类生命体的生物特征——表型。表型组则是指生物体从分子层面的微观组成到宏观、从胚胎发育到衰老死亡全过程所有表型的集合。人类表型组计划就是解析基因—表型—环境之间以及宏观—微观表型之间的关联,并通过这些关联探究人类健康与疾病的奥秘。
人类表型组计划首要目标是为未来生命科学研究绘制“导航图”。中科院院士、复旦大学校长、上海国际人类表型组研究院院长金力介绍,这张“导航图”展示的是几万种甚至十万种不同人类表型之间的关联,“科学家们按图索骥,可以大大提高生命科学的创新效率,提高对生命现象认知的能力”。
据悉,作为上海市市级重大专项“国际人类表型组计划(一期)”的核心任务之一,依托在张江复旦国际创新中心建成的世界首个跨尺度、多维度人类表型精密测量平台和自主研发的全过程、自动化表型组大数据平台,中国科学家从2020年起开展了“上海自然人群健康表型核心队列研究”。
截至2021年11月19日,已有超过730位常住上海的20-60岁志愿者完成了在张江平台2天1夜、每人测量超3万个指标的全景表型测量,科学家首次获得了自然人群样本贯通宏观至微观尺度的海量表型基线大数据,数据总量超过了3PB。
多学科团队协同攻关,发现不同表型间超过150万个强关联,其中约39%为跨尺度关联,且大部分关联是科学界首次看到。通过这些强关联形成的网络,中国科学家初步绘制基于上海核心队列的全球首张人类表型组参比导航图。
各国科学家就科研数据跨境共享达成共识
根据构想,人类表型组国际大科学计划最终将在全球各大洲代表性人群中进行5万人、每人10万个以上表型指标的全景测量和超过50万人的特定表型应用示范测量。要实现这一宏大目标,需要实现科研数据的跨境共享与开放。
在此次理事会上,经过各国科学家的充分探讨与协商,IHPC理事会就人类表型组大科学计划下科研数据跨境共享与开放的基本原则,在兼顾安全和开放的前提下达成了六点共识,包括采纳“FAIR”原则,即“寻获性,可及性,互用性和复用性”;安全合规;数据标准化原则,IHPC将致力于研究和建立国际人类表型组科研数据标准化体系;不同类型、级别的数据适用不同的分享与开放;多模式分场景共享;鼓励各国科研团队通过科研实践探索国际科研合作与数据跨境共享的最佳实践。