潜在位点难预测人工智能来帮忙

2021-08-24 15:08     来源:     作者:李建通

潜在位点难预测人工智能来帮忙(图1)

  正常生长条件和45度热激处理36小时的水稻苗期表型 中国农科院生物所供图

  基因组包括两类遗传信息——DNA序列遗传信息及表观遗传学信息。后者涉及何时、何地以何种方式去应用遗传学信息,是作物农艺性状多样性的基础。

  近年来,表观遗传学成为生命科学热点领域,检测技术和高通量测序的发展推动了作物表观组学的研究。然而,受到多种因素制约,仍有大量表观修饰位点没有得到发掘和研究。

  近日,中国农业科学院生物技术研究所谷晓峰课题组、田健课题组和普莉课题组在《新植物学家》(New Phytologist)上发表了最新研究成果。他们构建了植物表观遗传修饰智能预测在线工具SMEP。

  该项工作利用人工智能,深度学习植物DNA甲基化、RNA甲基化、组蛋白修饰等序列信息,系统实现了水稻、玉米等物种中表观修饰位点的预测,为作物功能基因组研究和智能设计育种提供工具和数据支撑。

  真核生物基因转录的主要驱动力

  谷晓峰告诉《中国科学报》,表观遗传修饰是指在基因的DNA序列没有发生改变的情况下,基因功能发生了可遗传的变化,并最终导致了表型的变化。这些可遗传的表观修饰包括DNA甲基化修饰、RNA甲基化修饰、组蛋白修饰、非编码RNA、染色质重塑等。

  “表观遗传修饰是调控真核生物基因转录、RNA代谢以及其他生物过程的主要驱动因素。”谷晓峰说,植物、动物等真核生物细胞正常功能的维持是DNA序列遗传、表观遗传这两种信息互相作用、保持平衡的结果。“如果这两种因素的任何一种表达失衡,都有可能导致不正常的基因表达,不能形成正常的生长发育过程。”

  表观遗传在调控基因表达、RNA稳定性、蛋白质翻译等方面起着关键作用,参与作物产量、品质、抗逆等多个重要的生物学过程。

  普莉介绍,作为主要表观修饰类型之一,甲基化可以发生在DNA、RNA或组蛋白尾部序列上,且甲基化类型具有多样性,不同位置、不同类型的甲基化修饰对基因的表达具有激活或抑制作用。

  目前,以表观遗传学理论和技术为中心的精准表观育种打开了培育农作物全新路径的可能性。普莉解释说,表观遗传修饰位点是指在DNA、RNA或者组蛋白序列上的甲基化、乙酰化等修饰位点。

  “解析作物的品质产量、广适应性和耐逆性等重要农艺性状的调控网络,鉴定重要的表观修饰位点,尤其是新的未知的修饰位点,可以为高产优质的作物新品种提供表观遗传基因资源、修饰位点等理论支持和技术支持。”谷晓峰说。

  然而,“由于表观遗传修饰在不同发育时期、不同生长环境等条件下具有动态可逆的调控特性,受到检测技术、实验成本、取材组织的限制,目前仍有大量重要的参与调控基因表达、生长发育等的表观修饰位点没有得到发掘和研究。因此,如何利用现有表观遗传组学数据深入探索潜在的表观修饰位点是表观遗传研究面临的关键问题。”田健说。

  人工智能生物技术成为关键

  目前,科学家已经获得了一些作物的表观遗传组学大数据。该用什么方法解析这些数据呢?

  谷晓峰团队将目光投向了人工智能等信息科学的创新和应用。人工智能驱动基因编辑、合成生物、全基因组选择等前沿生物技术快速发展,催生了人工智能和生物技术的深度融合。这种深度融合产生的人工智能生物技术(AIbiotechnology)成为生物农业领域的关键技术。

  在此背景下,以深度学习为核心的人工智能技术在处理大数据(包括图像数据、多组学数据)方面具有显著优势。

  “考虑到人工智能在处理大数据方面的优势,以及表观遗传动态可逆的特点,应用人工智能的技术预测修饰位点可以弥补由于检测技术、实验成本、取材组织造成的表观修饰位点鉴定数量不足的问题。利用深度学习算法和模型优势,我们可以训练AI分析表观遗传多组学大数据,从而获得有重要应用价值的潜在表观修饰位点。”谷晓峰说。

  谷晓峰介绍,通过深度学习和训练,该团队基于卷积神经网络(CNN)方法,利用课题组前期绘制的粳稻日本晴的多种表观修饰图谱,构建得到了具有高准确度的智能预测模型(SMEP)。

  “人工智能首先通过收集与整理已发表的重要表观遗传组学数据和修饰位点,然后利用深度学习的算法从中进行特征序列提取、特征序列学习训练、构建智能预测模型,然后再对基因组序列进行扫描,发现潜在的表观修饰位点。”田健解释道。

  普莉介绍,为了验证该模型的预测是否成功,他们采用多个准确率评估指标来评估预测准确率;利用两个不同水稻品种(籼稻和粳稻)的表观数据进行相互验证;将预测结果与已发表的传统机器学习方法进行比较,进一步验证该方法的准确率;利用表观遗传检测手段,验证预测位点的表观修饰水平变化。

  经过参数优化、交叉验证以及实验验证,SMEP模型在预测DNA甲基化、RNA甲基化和组蛋白修饰等表观遗传修饰位点中具有高可信度。

  免费在线智能预测

  “这个模型从数据库中预测到了水稻、玉米等作物中大量潜在的表观修饰位点,这些修饰位点是常规技术尚未检测到的,参与了调控基因表达、环境胁迫响应等重要过程。”谷晓峰说。

  水稻、玉米等是重要的粮食作物,其产量和品质受到全球变暖和极端高温的严重威胁而显著降低。研究显示,平均气温每上升1摄氏度,水稻产量就可能下降10%,玉米产量下降5.8%以上。

  谷晓峰说,应对挑战的关键是系统阐明作物响应高温胁迫的生物学基础,鉴定和优化响应高温胁迫的关键基因和调控位点,培育抵抗高温胁迫的新品种。

  他们研究发现,水稻中DNA腺嘌呤甲基化能够影响基因表达,从而响应高温胁迫的环境信号。在热胁迫响应中,主要通过动态调节DNA腺嘌呤甲基化水平和影响热胁迫响应基因的表达两种方式发挥作用。

  为了验证预测位点的准确性,他们利用水稻幼苗期经高温胁迫(45℃)处理36小时的材料,进行DNA腺嘌呤甲基化特异抗体实验。他们选取三个热响应转录调节基因作为候选基因,根据预测的潜在的表观修饰位点所在区域设计引物。#p#分页标题#e#

  “结果表明,预测位点和实验结果吻合度很高,显示了智能预测位点的准确性和实用性。”普莉说,预测的表观遗传修饰位点可以为水稻、玉米的耐高温育种提供有用的基因资源和位点,加速培育耐高温的作物新品种。

  基因组数据非常庞大,其中还有更多表观遗传修饰位点待发现。为了让更多科学家关注和参与相关研究,该团队构建了SMEP在线智能预测工具,可向用户免费提供检索表观遗传修饰位点和基因表达数据的可视化界面。

  “科研人员可以快速、准确地查询水稻、玉米等作物基因组任何区域或任何基因已知的和潜在的表观修饰位点,为作物功能基因组研究、重要基因克隆和功能分析、作物设计育种提供数据支撑。”田健说,他们还分享了所有数据和代码,从事人工智能研究的工作者也可以应用这些代码和模型。(李晨)

  相关论文信息:https://doi.org/10.1111/nph.17630

  SMEP网址:http://www.elabcaas.cn/smep/index.html

上一篇:朱振才:闪亮“星星”背后的“最美”科学家

下一篇:母乳糖类有助治疗和预防新生儿感染

*免责声明: 凡本网注明“来源:XXX(非神州瞭望网)”的作品,均转载其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。若内容涉及投资建议,仅供参考勿作为投资依据。本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。


推荐阅读
  • 我国深空探测计划 瞄准“两个100”目标

    ​天问一号火星探测器成功发射,实现火星环绕、着陆,祝融号火星车开展巡视探测,在火星上首次留下中国人的印迹,中国航天实现从地月系到行星际探测的跨越。 下一步,中国的行星探测工

    2022-03-24


  • 太阳极轨探测:为研究太阳带来新契机

    ​在太阳活动周、高速太阳风起源等方向的研究上,我国具有一定优势;同时,我国已具备实施太阳极轨探测的技术条件,建议以太阳极轨探测卫星作为切入点,尽快推动太阳立体探测重大工程

    2022-03-24


  • 电子自旋的声学操纵能改善量子控制

    ​近日,德俄科学家合作研发一种自旋量子位的声学操控方法,展示了表面声波的应变场与碳化硅中硅空位的激发态自旋之间的相互作用。新方法有望改善电子自旋的量子控制,并为微型量子设

    2021-11-05


  • 福建农林大团队攻克植物生长素研究难题

    ​播种面积没有增加,还能促进农业增产?能培育像苹果一样大、甘美多汁的葡萄吗?这幅未来农业的图景,如今加速向我们走来,这源于植物细胞生长调控研究的突破性进展。 1日,记者从福建

    2021-11-02


  • 类太阳恒星锂丰度与活动密切相关

    ​记者1日从中国科学院云南天文台获悉,该台丽江天文观测站研究人员近日在类太阳活动恒星锂丰度和恒星活动关系研究方面取得进展。相关研究成果发表在国际天文领域重要期刊《天文和天体

    2021-11-02


  • 吉林一号高分02F卫星成功发射

    ​10月27日14时19分,我国在酒泉卫星发射中心用快舟一号甲运载火箭,成功将吉林一号高分02F卫星发射升空。 新华社发(汪江波摄) 记者从长光卫星技术有限公司获悉,北京时间2021年10月27日,

    2021-10-28


  • 三幕式寒武纪大爆发假说有了新证据

    ​苔藓动物起源于何时?三幕式寒武纪大爆发假说有了新证据? 来自西北大学等单位的研究人员通过对陕南镇巴小洋剖面灯影组发现的微体化石进行研究发现,苔藓动物起源于5.3亿年前的寒武纪

    2021-10-28


  • 绘制“菌根共生”调控网络 为减少磷肥施用提供新方案

    ​记者10月26日获悉,中国科学院分子植物科学卓越创新中心王二涛研究团队近日在国际学术期刊《细胞》上发表论文称,他们首次绘制了水稻丛枝菌根共生的转录调控网络,该网络能同时调控植

    2021-10-27


  • 遥感技术揭示跨两千年古迹布局

    ​据英国《自然人类行为》杂志25日发表的一项研究,美国科学家利用遥感技术对跨度两千年时间里的463个古迹,覆盖84516平方公里的建筑和遗址布局进行了可视化。 此前有研究显示,被称为奥尔

    2021-10-27


  • 活大肠杆菌迄今最清晰结构图发布

    ​活大肠杆菌的显微镜图像,揭示了其保护性外膜的斑块性质。图片来源:英国伦敦大学学院本恩等人 许多细菌的外膜是抵抗抗生素的强大屏障,是细菌对药物产生抗药性的重要因素。据25日发

    2021-10-26