这些超级哇塞的植物研究实用数据库!赶紧收藏起来
植物在经历过寒冬贮藏,惊蛰萌动后,终于温暖的3-4月开始萌发新叶、着色花瓣、抽穗生长,勾勒出万物盛放的”最美人间四月天“景色。而这盛放的背后,植物衍生的次生代谢物具有重要的调控作用,其广泛参与调节各类农艺性状形成过程。精准检测并解析这些物质对品种遗传改良、农艺性状遗传位点、生长抗胁迫等研究极为重要。
除检测外,获得植物次生代谢物生物功能也极为重要。除常见的NCBI、GO、KEGG、MetaCyc等综合多种生物体数据库外,还有针对植物研究开发的专有数据库,本期,小编将为大家介绍植物领域常用到的各类型数据库:
1
PMhub
PMhub整合了来自实验研究、文献和公共数据库的188837种植物代谢物数据,并整合了部分代谢物相应正离子模式和负离子模式的标准HRMS/MS谱图便于研究者比对,重新注释未知代谢物。同时,数据库自带10种典型植物物种(拟南芥、水稻、小麦、玉米、甘蓝型油菜、甘氨酸、石松、毛棉、花椒、人参)的144366种代谢物信息,便于研究者比较这些物种中目标代谢物的相对含量。网站中代谢物遗传分析,可帮助研究者挖掘不同物种中任何遗传位点的mGWAS结果。

网页链接:https://pmhub.org.cn/#/
2
PCMD
Plant comparative metabolome database收录530种植物的代谢网络,并预测植物的代谢物和反应式。可直接输入植物学名、俗名或缩写获取其代谢物特征信息、比较物种间代谢物差异、上传指定的代谢物列表,探究代谢物主要在哪些物种中富集,助力植物代谢产物多样性研究。

网页链接:https://yanglab.hzau.edu.cn/PCMD
3
Plant Reactome
Plant Reactome整合了植物通路、小分子、代谢物、基因产物和大分子相互作用信息,构建植物代谢调控网络。网站以人工整理的水稻(Oryza sativa)中的代谢相关途径为基础,通过基因直系同源映射将通路扩展到82种植物,涵盖320个植物代谢参考通路,涉及激素信号、运输、遗传调控、植物器官发育和分化以及生物和非生物胁迫反应。除代谢通路的浏览和搜索外,还提供分析工具用于功能富集分析。

网页链接:https://plantreactome.gramene.org
4
PMN
PMN(Plant Metabolic Network)旨在整合植物代谢途径的基因、酶、代谢物及反应数据,支持代谢功能和功能基因组学研究,是植物代谢研究的核心数据库之一。特色在于其整合基因组、转录组、蛋白质组及代谢组数据库,通过生信分析(如路径预测算法)构建标准化代谢模型,确保跨物种数据可比性。同时,支持500+种植物中存在共有和特有代谢通路的在线查询。

网页链接:https://plantcyc.org/
5
CMAUP
CMAUP涵盖60222种代谢物、7865种功能性植物(4694种药用植物)的代谢物信息、758个靶标、1399种疾病和238种KEGG人类代谢通路。输入植物名称可直接查询已报道的该物种中有哪些天然化合物。输入天然化合物名称或结构可反向检索潜在靶点。

网页链接:https://www.bidd.group/CMAUP/
6
RefMetaPlant
RefMetaPlant(The Reference Metabolome Database for Plants)是通过LC-MS平台对五个主要植物门中收集的150+种植物进行非靶代谢组检测,并结合自主开发的生信方案为153种植物构建的植物参考代谢组数据库。包含参考代谢组、用于注释的代谢物标准品质谱库,以及用于搜索和分析植物代谢组和代谢物鉴定的分析工具,类似于基因组研究中的参考基因组。

网页链接:https://www.biosino.org/RefMetaDB/
7
TPPT
TPPT(Toxic Plants–PhytoToxins)数据库主要收录参与植物防御功能的有毒植物次生代谢物,包含了与844种植物有关的1586种植物毒性次生代谢物。将毒性植物次生代谢物—植物—物种关系与详细的生物和化学信息相结合。
8
AromaDb
AromaDb聚焦于植物化学和治疗,有助于研究者剖析与芳香化合物和精油相关的代谢物信息。收录166种商用植物,涵盖1321种香气分子化学结构、GC-MS质谱数据及理化性质。同时标注了芳香分子的抗菌、抗癌、神经保护等17类生物活性,关联其治疗潜力(如抗衰老、抗病毒等)。输入芳香分子,可了解其3D结构,或与其存在相互作用的人类治疗基因、蛋白质信息,以及这些基因或蛋白质参与调节的生物途径,助力研究者揭示芳香分子的潜在作用机制和治疗潜力。

网页链接:https://aromadb.cimapbioinfo.in/
1
植物转录因子数据库
PlantTFDB包含115个物种的基因注释和启动子序列。可查询研究物种中已报道的转录因子信息,转录因子结合的motif。输入基因名称,可查询基因的注释信息,获得完整的启动子序列,还可得到转录因子结合位点保守的非编码元素串联重复序列CpG岛,根据预测结果判断是否进行后续的酵母单杂、双荧光素酶以及ChIP-seq/qPCR验证实验。还可输入启动子序列,预测哪些转录因子与该序列结合。若输入一组基因信息,可分析这组基因间的调控信息和具体的转录因子结合位点。

网页链接:https://planttfdb.gao-lab.org/
2
植物抗病基因数据库
植物抗病基因(R-genes)在识别病原体特异性无毒(Avr)基因表达的蛋白质中起关键作用。抗性基因编码的蛋白质存在模块化结构域结构,其中一些结构域与Avr相互作用,形成激活先天免疫反应的信号复合物,从而阻止入侵病原体的增值。识别R-genes是挖掘植物抗病机制的重点。PRGdb数据库给出每个物种中已报道的R-genes和推测的R-genes,或者输入潜在R-genes,查询该基因是否在其它物种中有过报道,也可输入病菌/病毒名称查看对应的表型特征。

网页链接:http://prgdb.org/prgdb4/genes
3
植物与病原体互作数据库
PHI是一个专门收集和整理植物与病原体相互作用的数据库,整合经实验验证的基因数据,覆盖真菌、细菌等病原体与动植物、昆虫等宿主的互作信息。包含致病基因(如毒力因子)、效应蛋白基因、抗真菌化合物靶基因等。旨在从病原菌入手,寻找病毒侵染过程的关键基因,为植物病害防治提供理论依据。

网页链接:http://www.phi-base.org/aboutUs.htm
4
植物次生代谢物生物合成基因簇数据库
植物次生代谢物生物合成基因簇(Biosynthetic Gene Clusters, BGCs)是植物基因组中成簇排列、协同编码特定次生代谢途径的基因集合。如植物BGCs参与萜类、生物碱、苯丙烷类等化合物。plantiSMASH基于pHMMs模型和动态检测规则,自动扫描植物基因组中的候选基因簇,覆盖萜类、生物碱、苯丙烷类等次生代谢物合成路径。导入RNA-seq数据,通过基因共表达分析验证BGCs的功能活性。

网页链接:https://plantismash.bioinformatics.nl/
1
作物研究数据库
CropMetabolome数据库集成了自生成的原始质谱数据和公共来源数据集,构建了59种作物物种的参考代谢组,其功能与基因组研究中参考组的功能相似。同时还包含“标准品化合物质谱库”、“类黄酮库”、“农药库”和分析工具,支持基于参考代谢组的代谢分析、新代谢物的注释和鉴定、推断新型类黄酮衍生物的结构以及检测作物样品中可能的残留农药。

网页链接:https://www.cropmetabolome.com/
2
耐盐植物数据库
eHALOPH是一个专注于耐盐植物(盐生植物)数据库,收录全球范围内耐受约80mM以上氯化钠浓度的盐生植物,以及有关植物类型、生活方式、耐盐度最大盐度、盐腺存在与否、光合途径、抗氧化剂、次生代谢物、相容性溶质(如脯氨酸、甜菜碱)、微生物相互作用等,旨在为盐碱地农业开发,生态修复及科研提供数据支持。

网页链接:https://ehaloph.uc.pt/
3
大豆特有代谢途径数据库
SoyBase包含大豆的基因组序列、基因注释、基因表达数据、基因功能注释等。数据库整合了大豆的遗传图谱和超过4800个双亲QTL定量性状基因座信息,并提供大豆突变体的详细信息。同时还包括代谢途径、转录组数据、甲基化数据以及与其它豆类物种的比较信息。

网页链接:https://www.soybase.org/
4
药用植物多组学整合数据库
MPOD包含已发表的154个基因组、200个转录组、85种代谢生物合成途径(含:黄酮类、萜类、生物碱类等)中的代谢物、分子量、分子式、在哪些植物中存在、合成类型、下游基因等。同时,可进行不同物种基因家族同源性比较、代谢物分布与基因表达相关性分析等功能。

网页链接:http://medicinalplants.ynau.edu.cn/
5
棉花多组学数据库
CottonMD包含25个棉花基因组、76个组织样本的转录组、5个物种的表观基因组数据和来自4个组织的768个代谢物数据,以及4180个棉花种质的遗传变异、性状和转录组数据集。
直接输入基因名称,查询该基因在棉花的不同组织和群体或不同处理条件下的表达模式以及基因的共表达网络。通过Dotplot浏览全局基因组比对,通过GBrowse浏览局部比对分析结构变异。数据库还进行了多组学数据整合,将变异与性状和基因表达相关联,便于理解等位基因和基因功能效应,不同位点之间的相互作用和剖析复杂性状的遗传基础。

网页链接:https://yanglab.hzau.edu.cn/CottonMD
6
生菜多组学数据库
LettuceGDB数据库包含2个生菜品种的基因组信息和详细的基因组注释、1048个生菜品种的重测序数据、1300多个种质、关键性状的批量表型数据、256个RNA测序数据集、主要基于小RNA-seq和PARE-seq注释的完整miRNA组、全基因组染色质可及性数据,代谢组信息,以及近10年生菜研究论文。

网页链接:https://www.lettucegdb.com/