首页
科学家利用深度学习来确定对生命至关重要的代谢产物
返回

科学家利用深度学习来确定对生命至关重要的代谢产物

2022-12-19 科技信息 By:佚名
最佳答案想象一下,您的Facebook feed构成了一个令人着迷的难题。您会看到一些关于某个人的片段-眼睛的颜色,头发的颜色,年龄和身高-并且只有一分钟的时间可以从数百个个人资料中选择该人的姓名和身份。如果这样做,您将赢得1亿美元。但是您只知道其中10个人的名字。对于其他人,您只有很少的数据可以使用...

想象一下,您的Facebook feed构成了一个令人着迷的难题。您会看到一些关于某个人的片段-眼睛的颜色,头发的颜色,年龄和身高-并且只有一分钟的时间可以从数百个个人资料中选择该人的姓名和身份。如果这样做,您将赢得1亿美元。

但是您只知道其中10个人的名字。对于其他人,您只有很少的数据可以使用。有些还很年轻,有些还不那么年轻。有些是金发的,有些是黑发的。他们的一些名字听起来很熟悉,但是您无法确切地知道他们是怎么知道的。

蒂莫西·霍兰德的插图| 太平洋西北国家实验室

PNNL研究人员在研究代谢组学的过程中遇到了这种情况-这似乎是一项不可能的任务,将带来巨大的回报。那是对小分子的研究,这些小分子是我们生活各个方面的基础,并为我们的生活提供了信息,包括能源生产,地球的命运以及我们的健康。

科学家估计只有不到1%的小分子是已知的。一个典型的市售代谢组学文库可能包含5,000种化合物,但科学家们知道还有数十亿种化合物。

他们如何“识别”他们所知甚少的东西?这就像要求伽利略(Galileo)识别深空中的恒星,当他使用400多年前的第一批望远镜之一时,这些恒星是无法检测到的。

进入DarkChem,这是一个由PNNL的“深度学习”科学探索敏捷投资资助的研究项目 。 由瑞恩·伦斯洛(Ryan Renslow)领导的团队正在将人工智能带到餐桌上,以解决像庞培(Tom Metz)这样的魔鬼研究人员所领导的广阔而未知的局面,他是PNNL代谢组学研究的负责人。

梅斯说:“目前,我们只是在掠夺潜在的已知信息,并与非常有趣的数据说再见,因为我们无法识别出我们技术所检测到的绝大多数代谢产物 。” “深度学习提供了解决难题的新方法。”

Renslow 及其同事 Sean Colby 和 Jamie Nunez 采用了通常用于语言翻译等应用程序的深度学习原理,并将其应用于分子世界的这一暗物质。

早期结果值得关注:与运行PNNL旗舰量子化学软件NWChem的超级计算机上运行40个小时相比,该团队的DarkChem网络可以在几毫秒内计算出一个分子的关键特征,并且错误减少了13%。

“我们对DarkChem的出色表现感到震惊,” Renslow说。

网络不只是处理数据以编译结果。相反,网络利用人工智能。开发DarkChem的目的是,它可以发现人类仍然未知的新事物。

足球与碰撞的横截面

在这种情况下,团队对程序进行了培训,以了解和预测被称为碰撞截面(CCS)的化学性质。尽管CCS掩盖了令人生畏的科学缩写,但任何观看过足球比赛的人都看到了CCS这样的东西在起作用。

想象一下一个运球车砸向对面的球员。较小的玩家可能会遇到较少的碰撞,但是 当它们与对手碰撞时, 其效果不同于像绿巨人般的Marshawn Lynch 进入野兽模式 并摆脱几次碰撞的效果。

通过观看足球运动员相互撞撞,您可以学到很多有关足球运动员的知识。

同样,通过在充满气体分子的实验室仪器中移动的代谢物离子之间的碰撞跟踪,可以告诉科学家很多有关代谢物离子结构的信息,包括其大小,质量和其他特征。CCS是该作用的数学度量,并且是解锁分子的气相化学结构(真正的“鉴定”)的关键。

Renslow和他的团队训练DarkChem计算化学结构的CCS,然后将其放宽以进行超过5000万种化合物的计算-这是PubChem库的一部分 。该程序很快解决了该任务。

尽管这是向前迈出的令人鼓舞的一步,但该团队对所有尚未发现的小分子的含义感到更加兴奋。

该网络既可以向前也可以向后运行,也就是说,它可以解决分子的CCS并预测其他特性,但是它也可以根据人们正在寻找的特性生成新的化学结构。例如,伦斯洛(Renslow)的研究小组利用DarkChem提出了几种新颖的化学结构,这些结构可能会影响NMDA受体,而NMDA受体与记忆和其他重要的脑功能有关。

网络不仅仅是在存储数据。实际上,该团队有意将一些数字模糊性添加到网络面临的挑战中,以使其无法记住。

伦斯洛说:“这就像在教计算机识别狗一样。” “它可以简单地记住图片,但是您希望网络能够识别各种各样的狗,因此您可以将图片上下颠倒,拉伸一点,改变其颜色。您干扰了图像,因此该程序被迫泛化并依靠它所学到的知识和规则。”

教网络学习

为了创建网络,该团队使用了一种称为转移学习的人工智能形式,其中网络从一个数据集学习,然后将其知识应用于另一个数据集。培训主要包括三个步骤:

该程序仔细研究了PubChem中的5000万个已知分子,学习了化学的基础知识以及如何用数学方法表示化学结构。但是数据库缺乏有关CCS的信息,CCS是了解代谢物的关键指标。

然后,研究小组将DarkChem暴露给PNNL开发的一组计算CCS数据,约700,000个分子。这帮助培训了该程序有关如何将已学到的有关化学结构的一般信息链接到CCS的程序。

最后,该团队使用约1000种化学结构的小型,强大的数据集对网络进行了微调,这些化学结构的CCS测量值是通过实验室的艰辛工作确定的。

计算未知分子(仅存在提示可能是质谱实验中的一条细线的分子)的CCS的功能增加了一项重要功能,可帮助科学家将一种代谢物与另一种代谢物区分开。在黑暗的分子物质上发光。

Colby说:“您添加的每个尺寸都具有更好的分辨能力,” Colby协助寻找DarkChem分析的其他可能分子特征,例如红外光谱,碎片图和溶剂可及的表面数据。

这类似于提高我们在Facebook上识别数千个熟人的能力。

伦斯洛说:“你可以说某人是男性,戴着眼镜。” “但是,如果您可以补充说他已经54岁并且开着一辆红色梅赛德斯,那您就可以限制候选人了。

“代谢产物没有太大区别。我们不断增加可以测量的特征,最终宇宙中只有一个分子适合这种数据组合。”他补充说。

猜你喜欢
财务报告ppt示范(财务ppt模板)

财务报告ppt示范(财务ppt模板)

12-18 0 阅读
谷歌拥有的导航应用Waze正在推出一项全球安全功能

谷歌拥有的导航应用Waze正在推出一项全球安全功能

12-18 0 阅读
机器学习可以教会我们如何使材料制造更清洁更可持续

机器学习可以教会我们如何使材料制造更清洁更可持续

12-19 0 阅读
移动积分怎么兑换礼品(移动积分怎么兑换)

移动积分怎么兑换礼品(移动积分怎么兑换)

12-18 0 阅读
iphone5 cpu(iphone5 掉漆)

iphone5 cpu(iphone5 掉漆)

12-18 0 阅读
厂房风水怎么看(厂房风水)

厂房风水怎么看(厂房风水)

12-18 0 阅读
热门推荐
微信更新最新版本点哪(微信系统维护要到什么时候结束)

微信更新最新版本点哪(微信系统维护要到什么时候结束)

12-19 0 阅读
爱在西元前歌词谁写的(爱在西元前歌词)

爱在西元前歌词谁写的(爱在西元前歌词)

12-18 0 阅读
金线莲的功效与作用及用法(金线莲的功效)

金线莲的功效与作用及用法(金线莲的功效)

12-18 0 阅读
计算利润总额的公式是(利润总额计算公式是什么)

计算利润总额的公式是(利润总额计算公式是什么)

12-18 0 阅读
太原市房地局(山西太原房地局官网)

太原市房地局(山西太原房地局官网)

12-19 0 阅读
越南文化风俗(越南文)

越南文化风俗(越南文)

12-19 0 阅读
情侣空间是什么时候出的(情侣空间是什么)

情侣空间是什么时候出的(情侣空间是什么)

11-09 0 阅读
女孩子回复昂(女生回复昂什么意思)

女孩子回复昂(女生回复昂什么意思)

08-08 0 阅读
诸葛孔明纵横异界(关于诸葛孔明纵横异界的介绍)

诸葛孔明纵横异界(关于诸葛孔明纵横异界的介绍)

12-18 0 阅读
Zoom topia 2020活动分享了将在其平台上展示的创新技术

Zoom topia 2020活动分享了将在其平台上展示的创新技术

12-18 0 阅读