工欲善其事,必先利其器。
我们都知道,化学数据库是化学研究和工业应用中不可或缺的工具,它们提供了大量的化学物质信息、反应数据、文献资料等,对于科研人员、教师和学生都具有重要价值。通过化学数据库,用户可以获取到丰富的化学信息和数据,从而支持化学研究和教育工作。这些数据库不仅涵盖了化学结构和反应数据,还包括了物化性质、生物活性、药物信息等多方面的内容,是化学领域不可或缺的宝贵资源。
下面为大家详细盘点一下2024年主流化学数据库
最著名的Reaxys、SciFinder在此便不一一赘述。
下面来介绍一些其他的
1、PubChem
官网://pubchem.ncbi.nlm.nih.gov
PubChem 检索可得到的结果包含了分子式、SMILES、2D和3D结构、InChI和InChIKey、相对分子质量、脂水分配系数、氢键受体和供体数目、可旋转键数目、互变异构体数目等基本的结构信息和物化性质,除此以外,还有该化合物作为药物的剂型和商品信息、药理性质、毒性、生物活性检测等信息,并通过文献分类副标题可以查看相关文献。
PubChem数据库于2004年正式对方开放使用,这是一个可以免费获取使用的数据库,其中包含了很多与有机小分子化学结构及其生物活性相关的信息。它包含了结构、命名和计算物理化学数据,并与NIH PubMed/ Entrez信息链接。
PubChem的数据信息被划分成三个相互关联的数据库,即PubChem Substance、PubChem Compound和PubChem BioAssay,这三个数据库都隶属于NCBI的Entrez信息检索系统。
2、MolAid化合物检索及智能一体化数字合成平台
官网:https://rxn.molaid.com/
MolAid是由碳氢数科精心研发的一款针对化学家设计的化合物检索及智能一体化数字合成平台。收录全球数以亿计的化学品数据,提供精准数据信息,包括物化性质、毒理性、反应、文献、晶体、谱图、安全等信息数据。支持查询化合物、了解物质性质、寻找购买信息、查询反应条件、设计反应路线、谱图查询、预测性质及谱图等,实现合成实验全场景覆盖。
MolAid提供众多化合物数据信息,涵盖七个数据库。收录1.6亿个化合物、4100万个化学反应、全面的收录化合物物化性质信息、约20万个真实实验谱图、100万个晶体数据、180万个化合物安全信息、740万个商品信息。
该数据库提供以下查询方式:支持多种化合物标识符检索,结构式、子结构、相似性检索。物质的CAS号、中文名称/别名、英文名称/别名、SMILES中的单个或多个字段组合、化学式等。搜索结果包括:概况、分类、物化性质、计算性质、反应信息、谱图信息、晶体信息、安全信息、SDS、商品信息、上下游信息。
其中,3D晶体结构与结构式检索是MolAid的特色功能
3D晶体结构
MolAid的3D 展示界面可以任意拖动晶体、调节大小。而且其支持分子3D 结构的保存与下载,操作简洁,省时省力,毫不费心。
结构式检索
MolAid采用全新开发的结构编辑器,具备所有基本绘制功能体验丝滑顺畅。自研结构式检索算法,检索速度国内领先!默认选项为精确检索,同时支持子结构、相似性检索,助力分子设计!
3、ChemSpider
官网://www.chemspider.com/
ChemSpider是一个隶属于英国皇家化学会的汇总数据库,包含了来自不同资源提供的五千五百多个化合物信息。现在,该数据库含有的信息包括海洋天然产物数据、ACD实验室化学数据库、EPA的DSSTox数据库以及来自不同供应商的一系列化学物质信息。数据库拥有多种搜索工具,而且大多数化合物都有计算物理化学性质值。
数据库提供以下查询方式:标准查询方式包括系统名称、商业名称和同义词、登记号查询;高级查询方式提供互动式搜索,通过化合物结构、化合物子结构,分子式以及分子量、CAS编号、供应商等进行高级搜索。还可以对搜索得到的结果进行进一进步的筛选以限定更小的搜寻范围;ChemSpider还提供以iOS软件应用(iPhone/iPod/iPad)为平台的移动设备搜索。同时也支持安卓系统。
4、ZINC
官网:http://zinc.docking.org
包含2000多万个化合物分子,适用于虚拟筛选。通过ZINCID、SMILES格式等进行检索,检索结果中给出了化合物的结构,一些化合物的重要性质,包括xlogP,溶解度,氢键给体和受体数目等,以及二维和三维结构,供应商信息。用户可以自行绘制或输入分子的SMILES字符串来上传待检索的分子,同时,还可以限定净电荷量、xLogP、可旋转键数、氢键供体和受体数等参数范围。库中的分子结构均可被免费下载,支持SMILES、mol2、3DSDF和DOCK flexibase格式,并且化合物的相关信息可以以表格形式下载,便于用户使用。
5、DrugBank
官网:http://www.drugbank.ca
该数据库是一个独特的生物信息学和化学信息资源相结合的药物和药物靶标数据库。该数据库包括8206个药物条目,包括1991个FDA批准的小分子药物,207个FDA批准的生物技术(蛋白/肽)的药物,93个营养品和6000的实验药物。另外,4333个非冗余蛋白质(即药物靶标/酶/转运体/)序列被链接到这些药物条目上。
药物信息包括了该药物的CAS号、商品名、分子式、分子量、SMILES、2D和3D结构、logP、logS、pKa、熔点、吸收性、Caco-2细胞穿透性、药物类别和临床使用、性质描述、剂型与给药途径、半衰期、体内的生物转化、毒性、作用于哪些生物体、食物对服用的影响、与其它药物的相互作用、作用机理、代谢途径、药理学特征、与蛋白质的结合情况、溶解度、物质形态、同义词、关于合成的相关文献等,还与ChEBI、GenBank、PubChem等外部数据库有链接。
6、Toxnet
官网:http://toxnet.nlm.nih.gov/
Toxnet是美国国家医学图书馆(nlm)的化合物毒性相关数据库,包括药品毒理学、危险化学品和其它相关领域的信息,从Toxnet可对下列子数据库进行检索:
HSDB (危险化合物数据库):内含4500种毒性(或可能具有毒性的)化学药品,以及其毒性、对环境的影响、化学安全性、废弃物处置等相关领域的信息。
TOXLINE® :包括药物和其它化学物质的生物化学、药理学、生理学、毒理学的文献数据库。其中有300万条引文、几乎都有摘要和/或检索条、以及CA登录号。
ChemIDplus :对NLM数据库中的化学物质提供结构式和专业信息。
7、Drug future
官网:http://www.drugfuture.com/toxic/
RTECS主要包括以下六大类化学物质的毒性数据:直接刺激性(Primary irritation);致突变性(Mutagenic effects);对生殖的影响(Reproductive effects,即致畸性);致肿瘤性(Tumorigenic effects);急性毒性(Acute toxicity);其他多剂量毒性。
其中记录有该化学物质的数值毒性值,如半数致死量(LD50或LC50),最低中毒剂量(TDLo),最低中毒浓度(TCLo)等,以及实验所使用的物种和给药途径。除此之外,所有的数据也都列出了其文献来源,然而并没有对其有任何的评估。
该数据库中数据大部分都较为久远,一些较新的化合物不被列入;此外,此数据库查询时会有一些bug,如需查询一个化合物,最好通过不同方式如CAS号,通用名多次查询,因为有些化合物可能通用名查不到,CAS号却能查到。
8、ChemBlink
官网:http://www.chemblink.com/
首页检索(该数据库检索与Drug future-化学物质毒性数据库类似,需通过CAS号和化学名等多次检索,有时候CAS号搜不出来,化学名可以,如下面CAS号搜索没有结果,但是用化学名Tetrabutylammonium bromide就可以得到结果):提供化合物的安全技术说明书(MSDS),说明书中毒性一栏(Toxicological Information)会提供化合物的一些毒性数据。
9、Chemical Book
官网:http://www.chemicalbook.com/
ChemicalBook是一家致力于为化学行业用户提供最有价值信息的资源平台,平台可以使用使用中文名称,CAS号,英文名称,分子式,分子量,MDL号,EINECS号,结构式等多种方式检索,提供供化合物的安全技术说明书(MSDS),说明书中毒性一栏(Toxicological Information)会提供化合物的一些毒性数据。