俗称“碳水化合物”的糖质,是与核酸(DNA、RNA)、蛋白质、脂质一起构成生命的四大基本生物大分子,也是地球上已知生物量最高的生物大分子,其重要性不言而喻。然而,由于其太过复杂、缺乏有效的研究手段,一直以来科学界连它们有哪些、长啥样都不知道,导致糖质研究困难重重、严重滞后于蛋白质。
如今,深圳医学科学院/深圳湾实验室/清华大学颜宁团队与合作者另辟蹊径、利用“酷寻”策略,终于逐步揭开了这一“生命暗物质”的神秘面纱。
特别是,在《科学》杂志发表的最新成果中,颜宁团队获得了最高分辨率达到0.18纳米的天然糖质复合物超高分辨率三维结构,实现了在原子分辨率的“可视化”研究,打开了糖质生物学研究的“天眼”。

冷冻电镜分析揭示金藻管状微绒毛表面存在的大量复杂糖质及其近原子分辨率三维结构。A.金藻表面的管状微绒毛。上图:金藻卡通示意图,以及其长鞭毛(橙色粗线)表面覆盖的微绒毛(浅绿色细线)。中图:冷冻电镜拍摄到的管状微绒毛的原始照片。下图:图像初步处理过的二维分类。B.管状微绒毛的冷冻电镜三维重构图。C.根据冷冻电镜密度图搭建的微绒毛结构模型。D.微绒毛表面覆盖大量复杂糖质(以红白球示意)。深圳医学科学院供图
糖质:熟悉而又陌生的“生命暗物质”
“你可能经常听见身边的朋友说‘碳水使我快乐’或者‘少吃碳水’,这都说明糖质与我们的生活息息相关。”颜宁在接受记者采访时说,“糖质不仅给我们提供能量,还在细胞识别、信号转导、免疫调控和结构支撑等多种生理过程中发挥着关键作用。”
“糖质的分子结构复杂,种类繁多。”颜宁说,它既包括单糖(葡萄糖、果糖、半乳糖等)、双糖(蔗糖、乳糖、麦芽糖等)、多糖(淀粉、糖原等)、纤维素等膳食纤维,还包括糖肽分子等与多糖耦合的各种生物大分子。“我们的研究表明,在自然界中还有许多未被人类发现甚至想象过的糖质,其功能和作用更有许多未解之谜。”
与蛋白质、核酸一样,对糖质的研究可追溯至19世纪。但是,迄今为止,人类对于糖质的了解远不如核酸和蛋白质,称其为“生命暗物质”并不为过。
“研究滞后的根本原因之一是糖质研究中存在一个巨大的瓶颈——科学家看不清它的内部结构。”颜宁解释说,“在生命科学领域,结构决定功能。这里的‘结构’,既包括长宽高外形这些几何形式,也包括所用的材料等物理化学性质。就像家里面,不同的结构、材料决定了这个地方是厨房、那个地方是卫生间一样,生物大分子的结构不同,所具有的功能和作用也各不相同。”
为什么糖质的结构难以解析?
“一是因为糖质太过复杂。它们一般都由多种多样数量不明的单糖通过复杂的糖苷键化学连接,具有高度柔软灵活的‘身段’,因为一直缺乏好的研究系统,所以过去即便用最强大的冷冻电子显微镜也很难‘看清’复杂糖质的内部构造。”颜宁告诉记者,另一个重要原因,DNA、RNA、蛋白质可以依赖模板生成,从基因组序列就可以直接推测出它们的组成,但细胞合成糖质没有模板,导致科学家很难搞清楚糖质的成分。
她进一步解释:通过人类基因组计划,人们发明了高通量测序技术,可以很容易获得某个研究对象的DNA、RNA序列,而DNA、RNA的序列又与蛋白质序列存在确定的对应关系;另一方面,几十年的研究也基本确立了蛋白质序列与其三维结构的相对准确的对应关系,这就是AlphaFold可以预测蛋白结构的基础。你给人工智能工具AlphaFold一串氨基酸序列,它就可以预测出其中大部分相对准确的结构,当然也有很多预测不准确的情况。“但我们研究的糖质许多是压根都不知道其存在与否的复杂生物大分子,像AlphaFold这种人工智能工具连研究对象都没有,所以压根无能为力。”
颜宁指出,高分辨率结构信息的长期缺失,在很大程度上阻碍了人类对糖质在多种生理和病理过程中作用机制的深入理解,导致糖质生物学的发展远远滞后于核酸和蛋白质。
采用酷寻策略,探索(创建)结构生物学研究新范式
自2022年回国后,此前在蛋白质结构研究领域成绩斐然的颜宁,开始转向自己的第二战场——糖质生物学。
然而,面对既不知道其内部“长什么样”、更不知有多少未知“新物种”的“生命暗物质”,如何才能找到突破的入口?
颜宁团队另辟蹊径,创造性地提出酷寻(CryoSeek)研究策略——“结构先行”的生物发现新范式。
颜宁介绍说,传统结构生物学长期遵循“从分子到结构”的经典研究范式:先确定某个已知其功能的目标分子,然后解析它的结构,进而深入研究它如何发挥功能。“我们提出的CryoSeek研究策略的核心,是把冷冻电镜这一传统的结构解析工具变为发现未知生物大分子的‘放大镜’:不依赖作为先验知识的序列或功能信息,直接从自然水体、环境样品特别是临床样本和动物组织中提取研究对象,通过解析高分辨率结构来发现此前未知的生物大分子,再据此深入研究它们的生理功能和作用机制。”
为此,颜宁团队与深圳医学科学院的胡名旭团队合作开发了高通量的电镜图像处理算法,大幅提升了结构解析效率。然而,随着CryoSeek策略在多种环境样本中的广泛使用,所解析结构的数量与复杂度迅速增加,传统的数据管理与分析方法已难以适应高通量发现的需求。
为推动数据共享与科研协作,并使CryoSeek策略真正成为服务全球生命科学研究的公共工具,他们又依托深圳医学科学院运行的深圳国家基因库建立了CryoSeek数据库(cryoseek.org.cn)。
CryoSeek数据平台首页。深圳医学科学院供图据介绍,CryoSeek数据库除了具备传统数据库的查阅、检索、上传、下载功能外,还将集成全球社区、实用工具、教学训练等多种功能。
“作为CryoSeek从方法创新走向系统化、规模化与社区化的重要载体,该数据平台将为糖结构生物学及相关结构领域的前沿发现提供持续动力。”颜宁表示,期待通过这一开放平台,与全球科学家共同绘制“生命暗物质”新世界的航海图。
从发现“新物种”到确定“新功能”,复杂糖质的“庐山真面目”日渐清晰
采用“酷寻”策略,颜宁团队小试牛刀,于2024年、2025年在《美国科学院院刊》相继发表论文,报道了在清华大学荷塘的水样中发现的全新蛋白丝和第一次被揭开面纱的糖纤维TLP-4。
今年4月20日,颜宁团队在《细胞》子刊《细胞—化学生物学》发表的论文中,又报道了来自同一荷塘水样中另外5 种新型糖纤维——TLP-0、TLP-2、TLP-3、TLP-4b、TLP-IPT,解析出的结构分辨率在 0.3纳米左右,构建了糖纤维从“蛋白质为主”到“无蛋白纯糖”的连续结构谱系。纯糖纤维TLP-0的发现尤其令人激动,“这表明,糖类本身就具备形成复杂、有序的高阶结构的能力,颠覆了‘蛋白质是生物结构主要载体’的传统认知,为糖生物学(Glycobiology)开辟了新的研究方向。”颜宁说。
今年4月24日,发表在《科学》上的最新研究进展中,颜宁团队以年轻的博士生黄隽豪为主力、与清华大学闫创业团队合作,取得了更令人振奋的成果:获得了整体糖质分辨率约0.2纳米(一根头发丝的40万分之一)、核心局部最高达0.18纳米的超高分辨率三维电镜密度图,不仅清晰实现了对天然糖质从化学组成到空间构象的直接观测,提出了“糖质缝合”、“糖质桥”和“糖质岛”等系列新型糖质组装元件,发现了诸多在糖环上的修饰并阐明这些修饰与水分子、金属离子协同帮助糖质折叠的基础。
在《科学》发表的论文截图。深圳医学科学院供图颜宁告诉记者:“在这项研究中,我们系统揭示了糖质在生物大分子高级组装中的结构性作用,为复杂糖质及其高级结构的发现、鉴定、计算化学、工程化利用提供了新的方法学框架,标志着糖质结构生物学正进入原子分辨率解析的新阶段。”
与此同时,由颜宁实验室博士后陈晟开发的AI自动建模工具EModelG,把糖质结构建模的效率从传统手动建模的几星期提升到自动建模的半小时。这一工具推动冷冻电镜糖质结构建模从高度依赖人工经验向自动化、标准化和高通量方向发展,为天然糖质的大规模结构研究提供了方法学支撑,并降低了复杂的专业门槛,可以令不同学术背景的更多研究者有效参与进来。
协同创新,力争早日实现从基础研究到应用开发的跨越
值得一提的是,在该论文于国际期刊正式发表之前,颜宁团队提前几个月将成果公开发布在由深圳医学科学院联合深圳湾实验室、清华大学、西湖大学建设的 “浪淘沙”预印本平台(Langtaosha.org.cn),第一时间与国内外同行分享研究的核心发现、技术方法与原始数据,以加快推进相关研究。
“浪淘沙”预印本平台网页。深圳医学科学院供图一花独放不是春,百花齐放春满园。颜宁表示,与核酸、蛋白质相比,糖质生物学的研究还是“万里长征第一步”,前面是更为广阔的星辰大海,需要国内外同行携手努力。
基础发现将指引应用前沿。据悉,颜宁正在与国内相关团队合作,探讨多种潜在的开发图景:找到合成这些糖质的新型生物酶,把这些生物酶变为有用的工具酶,助推合成生物学研究和相关产业发展;开发分子仿生学新方法,探索新型高分子材料的设计、合成与应用;通过生物学手段探索更加高效的固碳新路径,助力环境治理……
“我们希望能够早日解开糖质的折叠密码。”展望未来,颜宁说,“期待有一天能像研究蛋白质那样揭示糖质序列与结构的对应关系,并据此设计具有各种功能的复杂多糖,深化对生命的理解,并开辟新药研发等产业应用的新赛道。”
(原标题:专访颜宁:揭开“生命暗物质”的神秘面纱)
<!-- 非定向300*250按钮 17/09 wenjing begin -->
<!-- 非定向300*250按钮 end -->
</div>