本文来自微信公众号:SF 中文 (ID:kexuejiaodian),作者:SF
机器学习是研究怎样使用计算机模拟或实现人类学习活动的科学,是人工智能的核心领域。科学家利用大量的人类经验对机器学习模型进行训练,目的是为了让模型可以在某一方面超越人类,去完成人类难以完成或不能完成的事情。最近,科学家就研发成功了一款超越人眼的机器学习模型。
文 | 闻静
你有没有这样的经历,把糖当食盐或者把食盐当糖,加错了调料导致食物味道很古怪。同时,还会受妈妈一顿嘲讽。等你反应过来,凑近了去观察两种调料,又发现两者确实不同,甚至可以看出来,由于一直用一个勺子去取调料,勺子上既粘了糖又粘了盐。
妈妈也没有在放调料之前尝一下,为什么就不会犯这样的错?吃了一次亏之后,为什么你就能凭借肉眼区分这两种调料了呢?下面我们要讲的内容或许可以解答你的这些困惑。
人眼的识别能力
为确定固体混合物的成分,我们可以采用核磁共振、高分辨率的质谱仪和光谱仪等。这些方法可以得到相当准确的定量分析结果。但是,肉眼观察依旧是化学实验中的一个重要方法,可以得到初步的评价结果,并且具有快速、无损的优点。在历史上,法国著名的微生物学家、化学家路易斯・巴斯德就是通过对晶体进行仔细的肉眼观察,分辨出了酒石酸盐。以这项突破性的发现为起点,科学家建立并发展了分子手性的相关理论,现在分子手性已经广泛应用于药物开发领域。
对于固体混合物来说,肉眼观察主要是根据其颜色、质地、粒度、透明度来判断其含有哪些成分,以及各成分所占的大致比例。但是,受经验和直觉的影响,不同的研究人员可能会得出不同的结果,这就让肉眼观察的结果包含了相当大的不确定性。
人工智能的图像识别功能便是模仿人类的肉眼观察能力。因此,科学家想到利用机器学习技术,让模型学会人类用肉眼分析固体混合物成分的方法(特别是要学习一些有丰富知识储备和经验的人),并获得超越经验最丰富的化学家的准确率。
超越人眼的识别能力
近日,发表于学术期刊《工业与工程化学研究》(Industrial & Engineering Chemistry Research)的一篇文章显示,研究人员成功开发了一种机器学习模型,该模型可以仅仅通过照片就知道固体混合物的组成比例。
在一开始,研究人员利用糖和食盐混合物的照片来训练机器学习模型。虽然原始照片只有 300 张,但研究人员利用随机裁剪、翻转、旋转等手段对原始照片进行处理,以创建更多的子图像用于训练和测试。测试的结果显示,机器学习模型识别这些照片的准确度是研究团队中肉眼观察准确率最高的人的两倍。
研究人员还将该模型应用于不同固体混合物的评估,特别是该模型还成功地区分了不同的多晶型和对映异构体。同一种物质以两种或两种以上晶体结构的形式存在,它们彼此之间就叫做多晶型;而互为对映异构体的物质虽然具有相同的分子量、原子组成,但原子的排列具有细微差异,其实是两种物质。这两种差异在制药行业很重要,区分这些差异通常需要耗费大量的时间和精力。
另外,研究人员还利用该模型分析了更复杂的情况 —— 具有 4 种组分的混合物。
实时分析动态过程
机器学习模型可以快速识别混合物组分,因此,相对于传统的分析方法,它更适合用于实时分析一些动态过程。利用这种模型,我们可以及时发现问题,并在隐患酝酿出事故之前,尽早地介入生产或实验的过程,减少损失。
例如,氨基水杨酸(PAS)是一种用于结核病药物治疗的抗生素,固态的氨基水杨酸可以发生热脱羧反应形成 m-氨基酚(MAP)。随着反应的进行,由反应物和生成物组成的混合物的物理外观会不断变化。通过让机器学习模型分析相关图片,研究人员就能准确地知道反应进度以及各阶段的反应产率。
研究人员还对模型进行了补充训练,让其可以分析清晰度一般的照片,这样我们可以很方便地利用手机进行分析。
研究人员表示,该模型未来可以用于持续快速评估,例如,监测化工厂和实验室的各种化学反应。此外,该模型还可以帮助视力受损者观察外界情况。
参考文献:
Machine Learning-Based Analysis of Molar and Enantiomeric Ratios and Reaction Yields Using Images of Solid Mixtures | Industrial & Engineering Chemistry Research (acs.org)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/718/183.htm]