化学和计算机的碰撞 计算化学和化学信息学
化学和计算机的碰撞 计算化学和化学信息学
实验室常驻人员
耳边还回响着中学老师在通常在解释不清楚化学题原因时,对我们说的那句“化学是门实验科学”。
但是,随着计算机算法的优化和算力的提升,化学和计算机碰撞出越来越多的火花,如果,有一天你推开了大学里一家实验室,看到了师兄师姐是在做下面的工作,也不要惊讶。
敲代码使我快乐
今天,就来给大家介绍把计算机用的得心应手的两个化学分支—计算化学与化学信息学。
01 计算化学
我们都知道对于化学反应,过渡态是解析机理非常重要的一个环节,它影响着反应的进程和能量等诸多参数,科学家也一直渴望着能把一些重要的反应的过渡态捕捉到,但是过渡态的存在时间非非非非常短,实验手段要求严苛,目前捕捉到过渡态的报道中也是使用了原子力显微镜和超亮、超快的脉冲射线这种昂贵且得不到普及的装置。
那么,对于探究反应机理就没有办法了吗?当然不是,实验手段遇阻,理论与计算出身的计算化学就派上了用场。
计算化学(computational chemistry)作为理论化学的一个分支,主要目的是利用有效的数学物理方法以及和其配套的电脑程序计算分子的性质,例如总能量、偶极矩、四极矩、振动频率、反应活性等,并用以解释一些具体的化学问题。
当然这里的数学物理方法主要还是求解万能的薛定谔方程啦
它主要是应用已有的电脑程序和方法对特定的化学问题进行研究。而算法和电脑程序的开发则由理论化学家和理论物理学家完成,常侧重于解决以下两个方面的问题:
为合成实验预测起始条件
研究化学反应机理、解释反应现象
基于此,计算化学在以下方向大放异彩:
1.原子和分子的计算机表述
2.研究化学结构与性质之间的关系
3.根据对作用力模拟对化学结构进行理论阐释
4.计算机辅助化合物合成
5.计算机辅助特性分子设计
当然每个分支都有各自的局限性,不过也因为这样才会有各种各样的分支不断涌现。
对于计算化学,理论上讲,对任何分子都可以采用相当精确的理论方法进行计算。很多计算软件中也已经包括了这些精确的方法,但由于这些方法的计算量随电子数的增加成指数或更快的速度增长,所以他们只能应用于很小的分子。对更大的体系,往往需要采取其他一些更大程度近似的方法,以在计算量和结果的精确度之间寻求平衡。不过好消息是随着量子计算机等新型的计算机的研究,算力能实现指数级提升,在不久的未来,计算化学家一定可以摆脱算力的问题,比如谷歌在《Nature》期刊上发表了文章称,他们开发了一个 54 量子比特的计算机——「Sycamore」,在 200 秒内完成了,根据实验测量,世界上最快的超级计算机需要 1 万年才能输出结果的程序。
谷歌 Sycamore 量子处理器
如果你着迷于事物的本质,想通过一行行代码,将探究不到的粒子重现到眼前,计算化学不错的方向。
02 化学信息学
19 世6 0年代的化学积累了数十种元素和上万种化合物 的数据 , 门捷列夫把这些元 素按原子量的大小次序排列 , 发现它们的化合物的性质有周期性变化 , 因而在1 86 9 年提出元素周期律 , 为以后发现新元素和玻耳建立原子模型指明了方向 . 20世纪3 0年代 , 积累了10 0多万种化合物的数据 , 结合量子化学的发展 , 导致鲍林提出共价 、电价和氧 化值的定义 , 以及 α键 、 β键 、杂化轨道 、电负性 共振结构等新概念 , 总结出化学键理论 , 发表 《论化学键本质》这本经典著作 , 对 2 0世纪化学的发展起了 非常重要的作用 . 而今天的分子 、 化合物和物相的数目比鲍林总结化学键理论时扩大了十倍 以上,充分利用这一化学文献宝库来总结规律,被我国的化学泰斗称之为世纪之交的难得机遇 , 不可失之交臂。那这也是我们的主角化学信息学主要研究内容之一啦。
找规律小能手--门捷列夫
美国印第安纳大学的Greg Paris教授提出 :化学信息学是应该包括化学信息的设计、建立、组织、管理、检索、分析、判别、可视化及使用。
它的工作主要包括以下几个方面
01 化学信息的组织、管理、检索和使用。
化学信息化学信息可分为与传媒有关的信息(如文献、图书资料、网络信息等) 及与物质有关的信息(各种实验数据 ,包括化学反应有关数据 ,谱学数据 ,X 射线晶体学数据 ,化学与物理性质数据 ,毒性及生物活性数据 ,与环境有关的数据等)。化学信息学家的工作就是如何组织数据形式来进行快速有效的检索和推理。
SciFinder 和 Reaxys 是化学数据库里的佼佼者
02分子结构的编码、描述、三维结构的构建
巨大数目分子结构编码及三维结构模型的构建及各种形式的结构表达 ,并能快速连接到合成路线 ,谱学数据 ,纯化技术等是化学信息学的基础工作。SMLIES和InChI是常用的编码方式。
03 化学信息的加工、处理及深化
化学信息的加工处理包括数据的预处理 ,回归分析 ,主成分分析 ,偏最小二乘 ,信号分析 ,模式识别 ,神经网络 ,遗传算法 ,模糊及随机算法等。它们可以帮助化学家正确分析、评价、利用现有的化学信息并从中获取最大量的有用结果 ,实现从数据到信息 ,从信息到知识的转换。
大数据已经渗透到了各种地方
04 化学体系中信息的交换及传递
诺贝尔奖金获得者 Lehn 在 1987 年诺贝尔获奖演说中提出信息化学 (Semiochemistry) 的概念。他认为化学信息寓于分子中 ,在分子间相互作用时读出化学信息 ,这些化学信息对于化学反应及性能起着调控的作用。这方面的研究涉及分子识别、超分子建筑、分子构造学、晶体工程、分子器件等方面的内容
化学信息学是紧跟着计算机发展的一门学科,在计算机领域新兴的大数据和人工智能这两个词已经深深的刻入到我们的脑海里,像上文提到的,化学信息学的研究正是庞大的数据,人工智能也成为化学家挖掘数据的利器。
比如,上海大学的Mark Waller教授和德国明斯特大学的Marwin Segler博士等人在Nature 杂志报道了一款可以通过自主学习有机反应来设计分子合成路线的AI工具。它不需要化学家输入任何规则,只是基于已经报道的单步反应即可自行学习化学转化规则,并进行快速、高效的逆合成分析。当该AI工具被要求为目标分子设计一条合成路线时,它会像人类一样进行选择和判断,根据它自学到的设计规则选出最有前景的前体分子,然后再进行合成可行性的评估,直到找到最佳的合成路线。另外还有韩国蔚山国家科学技术学院(UNIST)的Bartosz Grzybowski教授开发的Chematica的合成软件等等。
Marwin Segler博士(左)和Mark Waller教授(右)。图片来源:University of Münster / 上海大学
如果你喜欢在浩如烟海的数据中寻找到他人忽略的规律,喜欢计算机带来的自动化体验,不妨多学习些化学信息学的知识。
计算机技术的突飞猛进是新世纪不可忽略的科技的发展,化学是非常重要的基石学科,两者的相辅相成,正不断为科学研究带来不一样的动力。进行化学学习的我们,也紧跟着时代潮流,毕竟在历次科技革命中,最终受益的都是敢于创新和拥抱变革的人嘛。
参考文献:
[1]徐光宪.21世纪化学的内涵、四大难题和突破口[J].科学通报,2001(24):2086-2091.
[2]徐筱杰.化学信息学的涵义及教育[J].大学化学,2002(01):38-41.
[3] Planning chemical syntheses with deep neural networks and symbolic AI. Nature, 2018,555, 604, DOI: 10.1038/nature25978
[4] Efficient syntheses of p>
[5] Neural-symbolic machine learning for retrosynthesis and reaction prediction. Chem. Eur. J., 2017, 23, 5966, DOI: 10.1002/chem.201605499
[6] Probing the transition state region in catalytic CO oxidation on Ru
[7]
文案:死鱼君
配图:淡去
以上就是(化学和计算机的碰撞 计算化学和化学信息学)全部内容,收藏起来下次访问不迷路!