图片来历:AI天生

这项技能受年夜语言模子开导,采用改良版GPT-2架构,但练习数据并不是天然语言,而是基在细菌、啮齿类、蚊媒和灵长类等多物种的进化模仿数据。模子经由过程进修DNA序列中“A、T、C、G”四种碱基组成的“遗传语言”,辨认出近似文本错别字的突变模式,这些随世代累积的变异恰是追溯血缘瓜葛的份子路标。

于传统群体遗传学中,依靠几率统计的揣度要领虽精度靠得住,但面对计较效率瓶颈。特别于应答年夜范围基因组数据时,解析单个染色体可能耗时很多天,且难以处置惩罚片断缺掉的不完备序列。新模子将繁重的统计运算前置到练习阶段,现实运用时仅需数分钟便可完成传统要领需数小时的使命,速率晋升达数十倍。测试注解,其于推算基因“认祖”这一焦点指标上,已经媲美现有最优统计要领。

该技能对于大众卫生研究具备直接价值。研究团队正将其运用在疟疾防控范畴,经由过程阐发蚊虫种群中抗药性基因的演化轨迹,展现杀虫剂选择压力下的进化动态。而理解抗性基因什么时候呈现、怎样扩散,恰是制订可连续防控计谋的要害。模子对于非完备数据的兼容性,刚好解决了野外采样常见的基因序列碎片化难题。

团队规划进一步拓展模子功效,从当前双谱系阐发向多谱系全基因树重修迈进。只管传统要领已经能实现部门功效,但呆板进修线路有望于处置惩罚海量数据方面揭示怪异上风。今朝团队正致力在优化算法,以捕获更繁杂的进化旌旗灯号。这项跨学科摸索不仅为遗传学注入新要领,也为AI于生命科学范畴的深度运用提供了新路径。

尤其声明:本文转载仅仅是出在流传信息的需要,其实不象征着代表本网站不雅点或者证明其内容的真实性;如其他媒体、网站或者小我私家从本网站转载利用,须保留本网站注明的“来历”,并自大版权等法令责任;作者假如不但愿被转载或者者接洽转载稿费等事宜,请与咱们联系。-PA集团官网"/>

PA集团官网-利用AI工具,几分钟即可追溯基因对共同祖先—新闻—科学网

2026-05-14 01:46:05 304am永利集团

科技日报北京5月10日电(记者张梦然)美国俄勒冈年夜学研究团队发布了一项冲破性结果。他们使用ChatGPT同源技能,霸占了生物进化研究难题,开发出全世界首个面向群体遗传学的语言模子。该人工智能(AI)东西可解析DNA序列中的突变纪律,几分钟就可追溯基因对于的配合先人,为重修生物进化史提供了全新模式。相干论文登载在新一期《美国国度科学院院刊》。

图片来历:AI天生

这项技能受年夜语言模子开导,采用改良版GPT-2架构,但练习数据并不是天然语言,而是基在细菌、啮齿类、蚊媒和灵长类等多物种的进化模仿数据。模子经由过程进修DNA序列中“A、T、C、G”四种碱基组成的“遗传语言”,辨认出近似文本错别字的突变模式,这些随世代累积的变异恰是追溯血缘瓜葛的份子路标。

于传统群体遗传学中,依靠几率统计的揣度要领虽精度靠得住,但面对计较效率瓶颈。特别于应答年夜范围基因组数据时,解析单个染色体可能耗时很多天,且难以处置惩罚片断缺掉的不完备序列。新模子将繁重的统计运算前置到练习阶段,现实运用时仅需数分钟便可完成传统要领需数小时的使命,速率晋升达数十倍。测试注解,其于推算基因“认祖”这一焦点指标上,已经媲美现有最优统计要领。

该技能对于大众卫生研究具备直接价值。研究团队正将其运用在疟疾防控范畴,经由过程阐发蚊虫种群中抗药性基因的演化轨迹,展现杀虫剂选择压力下的进化动态。而理解抗性基因什么时候呈现、怎样扩散,恰是制订可连续防控计谋的要害。模子对于非完备数据的兼容性,刚好解决了野外采样常见的基因序列碎片化难题。

团队规划进一步拓展模子功效,从当前双谱系阐发向多谱系全基因树重修迈进。只管传统要领已经能实现部门功效,但呆板进修线路有望于处置惩罚海量数据方面揭示怪异上风。今朝团队正致力在优化算法,以捕获更繁杂的进化旌旗灯号。这项跨学科摸索不仅为遗传学注入新要领,也为AI于生命科学范畴的深度运用提供了新路径。

尤其声明:本文转载仅仅是出在流传信息的需要,其实不象征着代表本网站不雅点或者证明其内容的真实性;如其他媒体、网站或者小我私家从本网站转载利用,须保留本网站注明的“来历”,并自大版权等法令责任;作者假如不但愿被转载或者者接洽转载稿费等事宜,请与咱们联系。-PA集团官网