- · 《计算机产品与流通》栏[06/28]
- · 《计算机产品与流通》收[06/28]
- · 《计算机产品与流通》投[06/28]
- · 《计算机产品与流通》征[06/28]
- · 《计算机产品与流通》刊[06/28]
第四讲化学结构信息的计算机表述方法
作者:网站采编关键词:
摘要:据文献记载,自公元330年起,人们就开始研究物质的组成、运动、生长或脱去。美国化学文摘社(CAS,Chemical Abstracts Service)统计的数据显示,截至目前,己知的化合物近1.5亿,已报道的
据文献记载,自公元330年起,人们就开始研究物质的组成、运动、生长或脱去。美国化学文摘社(CAS,Chemical Abstracts Service)统计的数据显示,截至目前,己知的化合物近1.5亿,已报道的化学反应已超过9000万条[1]。
为了记录和交流化学知识,必须用一种语言(术语)来描述这些化合物,即所谓的化合物命名。早在十八世纪末,瑞典化学家Bergman和法国化学家Laviosier首先建议将当时杂乱的术语统一起来。虽然他们的体系没能得到普及,但是这一思想却孕育了现代化学广泛使用着的系统命名法。
随着人们对化学结构认识的不断深化,逐渐形成了近代化学结构理论,特别是Kekule在1865年首次使用了由单短线和双短线交替组成的正六边形来表示苯的结构以后,结构式已成为化学家最通用的语言和化学知识的载体。
化学结构作为化学家最普遍使用的语言,在化学知识的记录、传播和交流中起着十分重要的作用。随着计算机的普及,广大化学工作者都希望能用计算机来帮助处理化学结构。
然而,化学结构式也有记录与处理困难的缺点,随着计算机的普及,化学家希望能借助于它来处理化学结构。因此,自计算机诞生起,用计算机处理化学结构的理论和技术就得到了广泛的重视与深入的研究。早在20世纪50年代,美国国家标准化办公室数据处理系统部门的工作人员Ray和Kirsch就在《Science》上发表了题为“Finding chemical records by digital computers”的文章[2]。
在此,将介绍几种化学结构的表述方法:系统命名法、线形码、碎片码、拓扑码和连接表。
1 系统命名
在早期的化学文献中,化合物命名大多使用简短的习惯命名法。习惯命名的无规律性造成了使用的不方便,因此,化学家希望建立一套大家公认的规则,根据这套规则,每个化合物都能得到一个标准的命名,这就是系统命名法。系统命名法,特别是它遵循的原则是其他一切化学结构表述方法的基础。目前,被化学家接受的系统命名法主要为IUPAC系统命名法[3]和CA 索引名(CA index name)[4]。
由于IUPAC系统命名的某些不足,美国化学文摘社根据IUPAC规则设计了专用的系统命名规则(即CA索引名),并生成算法[5]。
2 化学结构的机器表述
化学结构的自动处理最早是基于打字机的化学结构表示法,提出者为 Richards[6],Dyson[7]和Frear[8]等。
他们试图用数字和字母组成的直线形式来表述结构式。之后,还有许多人提出了各种各样的化学结构表述方法。20世纪60年代后期以来,人们开展了完善表述化学结构的方法和计算机表述化学结构方法的工作。目前,在计算机上得到实际应用的结构表述方法有线形码、碎片码、拓扑码和连接表文件等等。化合物4-(2-乙胺基)-1,2-苯二酚的化学结构如图1所示。
图1 化合物4-(2-乙胺基)-1,2-苯二酚的化学结构
4-(2-乙胺基)-1,2-苯二酚对应的命名、线形码和连接文件显示如下:
系统命名 (英文):4-(2-ethylaminyl)-1,2-diphenole
系统命名(中文):4-(2-乙胺基)-1,2-苯二酚
习惯名:Dopamine
SMILES 码a:OC1=C(O)C=C(CCN)C=C1
SLN 码a:OHC[1]=C(OH)C=C(CH2CH2NH2)C=C@1
InChI码a:1/C8H11NO2/c9-4-3-6-1-2-7(10)8(11)5-6/h1-2,5,10-11H,3-4,9H2
连接文件b:
-ISIS- D
11 11 0 0 0 0 0 0 0 0999 V2000
1.6236 1.0292 0.0000 C 0 0 0 0 0 0 0 0 0 0 0 0
1.6224 -1.3648 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0
3.6956 -2.5610 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0
5.7870 -1.3519 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0
5.7841 1.0203 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0
3.6938 2.2253 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0
-0.4750 2.2500 0.0000O 0 0 0 0 0 0 0 0 0 0 0 0
- 0.0000O 0 0 0 0 0 0 0 0 0 0 0 0
7.9000 -2.5292 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0
7.9375 -4.9458 0.0000C 0 0 0 0 0 0 0 0 0 0 0 0
12.1042 -6.9458 0.0000N 0 0 0 0 0 0 0 0 0 0 0 0
5 6 2 0 0 0 0
6 1 1 0 0 0 0
1 2 2 0 0 0 0
1 7 1 0 0 0 0
3 4 2 0 0 0 0
2 8 1 0 0 0 0
4 9 1 0 0 0 0
4 5 1 0 0 0 0
9 10 1 0 0 0 0
2 3 1 0 0 0 0
10 11 1 0 0 0 0 MEND
文章来源:《计算机产品与流通》 网址: http://www.jsjcpylt.cn/qikandaodu/2021/0320/991.html
上一篇:计算机技术在数学建模中的应用研究
下一篇:高职计算机网络技术教学现状与改革