黄精为百合科植物黄精、多花黄精、滇黄精的干燥根茎[1],药用历史悠久,始载于《名医别录》[2],具有补气养阴、健脾益肾、润肺之功效,用于脾胃阴虚、肺虚燥咳、精血不足等证[3],在全国多地均有种植,由于其喜湿好阴的习性,主要分布于长江流域一带及长江以南等地区[4-7]。主要化学成分有多糖、萜类、黄酮类、酚类、苯丙素类[8]及氨基酸[9]等,现代药理学研究表明黄精具有抗骨质疏松[10]、降血糖[11]、调节脂质代谢[12]、抗氧化[13]等作用。湖北黄精(Polygonatum zanlanscianense)作为民间常用中药,分布广泛[14],资源量大,在部分地区能作为黄精的替代品或混淆品使用[15],然而目前对于湖北黄精相关研究较少,朱巧等[16]对包括湖北黄精在内的6种黄精属植物进行了简单重复序列标记(SSR)遗传变异分析,龙炳宏等[17]使用DNA条形码(DNAbarcode)技术对湖北黄精等6种黄精属植物进行了物种鉴定和遗传多样性分析,但湖北黄精的转录组学研究尚属空白。转录组学是研究细胞中基因转录的情况及调控规律的学科,转录组测序技术作为转录组学研究中最重要的手段,已经广泛应用于植物学各领域的研究之中[18],用于新基因的发掘、标记基因的开发、转录图谱的绘制和生物代谢途径的确定等[19]。随着测序技术的更迭,转录组学研究在黄精中的应用逐渐增多,目前已有国内外学者对多花黄精、滇黄精、黄精的多糖、皂苷、黄酮类化合物代谢通路进行相关基因的发掘,也进行了部分候选基因的鉴定和验证[20-25],但对于湖北黄精的相关研究未见报道,显著影响不同品种黄精多糖含量差异的关键酶尚不清楚,本文通过湖北黄精、多花黄精、滇黄精根茎的转录组学分析,填补了湖北黄精转录组学研究的空白,探索显著影响不同品种黄精多糖含量差异的关键酶,对关键酶基因的氨基酸序列进行了深入分析,为黄精属植物多糖合成机制和转录组学深入研究提供了重要参考。1 材料1.1 药材所有黄精样品均采集自四川省成都市农林科学院黄精培育基地,采集时间2021年7月14日。样品清洗擦干表面水分后将迅速放入-80 ℃冰箱保存,所有样品生长周期为3年,长势良好形态相近且无病虫害现象,采用完全相同的培育条件,所采集样品经成都中医药大学龙飞教授鉴定。黄精样品分为3组,分别为S1(3批湖北黄精,P1~P3),S2(3批多花黄精,P4~P6),S3(3批滇黄精,P7~P9)。1.2 仪器及试剂UV-3100PC型紫外分光光度计(上海美谱达公司);QuantStudioTM 1 Plus实时荧光定量聚合酶链式反应(Real-time PCR)仪(美国ABI公司);A300型PCR仪(杭州朗基科学仪器有限公司);Centrifuge 5428 R型离心机、移液器(德国Eppendorf公司);Minip-2500型板式离心机(杭州米欧);MC-15K型手掌离心机(北京擎科生物科技有限公司);JY600C型电泳仪、JY04S-3C型凝胶成像仪(北京君意公司);V6RTAX-5型螺旋震荡仪(海门市其林贝尔仪器制造有限公司);Epoch型微量核酸定量仪(美国BioTek公司);HiPure Universal RNA Kit通用型RNA小提试剂盒(广州美基生物科技有限公司,批号RIK30-01),TIANSeq mRNA捕获试剂盒(天根生化科技优先公司,批号X0701);多糖多酚植物总RNA提取试剂盒、Real-time PCR酶、Goldenstar RT6 cDNA Synthesis Mix逆转录酶(北京擎科生物科技有限公司,批号分别为TSP412、TSE202、TSK314S);浓硫酸、蒽酮、无水乙醇、三氯甲烷、异丙醇等为分析纯级别国药试剂。2 方法2.1 RNA的提取和浓度检测采用通用型RNA小提试剂盒提取新鲜黄精根茎的RNA,利用QubitTM 4 Fluorometer测量RNA浓度并筛选合格样品,再采用TIANSeq mRNA捕获试剂盒捕获样品的mRNA进行后续处理。2.2 转录组测序组装基于边合成边测序(SBS)技术,使用Illumina NovaSeq高通量测序平台对cDNA文库进行测序,对Raw Data进行数据过滤,去除其中的接头序列及低质量Reads获得高质量的Clean Data,使用Trinity软件进行序列组装。2.3 Unigene的功能注释及差异表达基因的筛选与分析使用DIAMOND软件将拼接后的Unigene序列与Nr、Swiss-Prot、COG、KOG、eggNOG、京都基因与基因组百科(KEGG)等数据库比对,再用KOBAS得到Unigene在KEGG中的KEGG Orthology结果,InterProScan利用InterPro整合的数据库分析新基因的基因本体(GO)Orthology结果,预测完Unigene的氨基酸序列之后使用HMMER软件与Pfam数据库比对。对于有生物学重复的样本根据各样本Unigene表达量矩阵采用DEseq2[26]进行差异表达分析,采用了公认有效的Benjamini-Hochberg方法对原有假设检验得到的显著性P值(Pvalue)进行校正,并最终采用校正后的P值,即错误发现率(FDR)作为差异表达基因筛选的关键指标,以降低对大量基因的表达值进行独立的统计假设检验带来的假阳性。在筛选过程中,将FDR0.01且差异倍数(FC)≥2作为筛选标准。其中,FC表示两样品(组)间表达量的比值,对差异表达基因进行模式聚类、功能注释及富集性分析。2.4 多糖代谢关键酶基因的筛选和表达量分析从多糖代谢相关通路中筛选出与多糖生物合成相关的关键酶基因进行样本间的差异统计,依据基因表达量绘制聚类热图,聚类方法为系统聚类法,距离指标选择Euclidean,标准化方向选择row,分析样本间的差异性,同时绘制标准化方向为column的热图,其他指标不变,以此来分析样本内不同关键酶基因的表达情况,并根据表达同种关键酶的差异表达基因表达量进行不同样本中总表达量的统计数据,绘制峰峦图。2.5 多糖含量测定及与多糖代谢关键酶的相关性分析采用紫外分光光度法按2020年版《中华人民共和国药典》(简称《中国药典》)[1]中黄精多糖测定方法对黄精根茎进行测定。首先进行标准曲线建立,精密称取无水葡萄糖对照品33 mg溶于100 mL量瓶,配制成0.33 g·L-1的葡萄糖对照品溶液。分别取0.2、0.3、0.4、0.5、0.6、0.7、0.8 mL对照品溶液于10 mL具塞试管中,加蒸馏水至2 mL,摇匀,试管置于冰水浴中,加入质量分数为0.2%蒽酮-硫酸溶液8 mL,摇匀,放冷后于100 ℃沸水中保温10 min,取出放入冰水浴中10 min,取出后恢复至室温,于582 nm波长下测定吸光度。以对照品溶液的质量浓度为横坐标,吸光度为纵坐标,绘制标准曲线,然后按2020年版《中国药典》通则进行方法学考察。得到样品多糖含量后使用SPSS软件结合多糖代谢关键酶表达量进行相关性分析。2.6 多糖代谢关键酶基因的Real-time PCR验证筛选出表达量差异较大的多糖代谢关键酶基因,根据转录组测序获得的基因序列设计扩增引物,以18S rRNA为内参基因[27],进行Real-time PCR验证,引物由擎科生物有限公司进行设计与合成,见表1。采用多糖多酚植物总RNA提取试剂盒提取样品RNA,纯度测定后以逆转录试剂盒进行逆转录扩增,扩增得到的cDNA产物4倍稀释后作为Real-time PCR模板,以擎科2×T5 Fast Real-time PCR Mix(SYBR Green I)进行扩增,扩增体系各组分为2×T5 Fast Real-time PCR Mix(SYBR Green Ⅰ)10 μL、10 μmol·L-1 Primer F 1 μL、10 μmol·L-1 Primer R 1 μL、Template(cDNA)1 μL、ddH2O 7 μL,扩增程序为95 ℃预变性2 min、循环数1;温度95 ℃变性15 s;60 ℃退火20 s;温度72 ℃延伸20 s、循环数40;熔解阶段:温度95 ℃变性时间15 s、循环数1。相对定量结果计算采用2-ΔΔCt法。10.13422/j.cnki.syfjx.20230414.T001表1引物序列Table 1Primer sequenceID名称5'-3'长度/bp内参18SrRNA上游AACGGCTACCACATCCAAGG下游ACCAGACTTGCCCTCCAATGc242090.graph_c0HK上游AAGCCTGAATCCTGGTGAGC998下游TGCATGGAAGACACAACAGGTc255269.graph_c0scrK上游AGGAGCCTGCGTTAAGTTGG1 577下游AGCACAGTGAAGCGAACACTc248696.graph_c0sacA上游CATACCTCAGCCCGATTCCC1 437下游GTCCCTTAATCGGTCAGGGCc165359.graph_c0sacA上游CGGCCAAGAGTGTGAAGACA376下游GCAACAGGGCAAATCAAAGCc243229.graph_c1sacA上游TACACGCGAGAAATGGTGCT799下游AGGTCATCAAGGGCCAATCGc232351.graph_c2USP上游CTTGTCAGAGATGCCTTGGAGA460下游CACCTTTGGCGATTCAGCTTc220186.graph_c0UGE上游GCTGGGAGTGAAGGCAAAGA601下游GAACTTTCTGAGGCCGGTGGc252538.graph_c0MPI上游TGTGCGAGCTGGACTTACTC1 811下游CCGAAGGTAGCAAGCAGTGT2.7 关键酶基因的氨基酸序列特征分析将筛选验证后得到的关键基因结合转录组测序结果,通过美国国家生物技术信息中心(NCBI,https://www.ncbi.nlm.nih.gov/orffinder/)在线工具预测开放阅读框并挑选长度1 000 bp的基因进行氨基酸序列比对,筛选下载同源基因使用MEGA11软件采用邻接法构建系统进化树分析亲缘演化关系,使用MEME(http://meme-suite.org/tools/meme)网站工具预测氨基酸序列motif,使用NCBI在线CDD(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)工具进行氨基酸序列保守结构域预测,使用TBtools软件对结果进行整合,绘制三图合一的氨基酸序列特征图。使用Protparam(https://web.expasy.org/protparam/)在线软件预测蛋白序列等电点和相对分子质量,使用DNAman软件对氨基酸序列进行比对分析,再使用SWISS-MODEL(https://www.swissmodel.expasy.org/)进行三维蛋白结构构建,分析蛋白结构差异。3 结果与分析3.1 转录组测序及差异表达基因注释结果共完成14个样品的转录组测序,共获得121.59 Gb Clean Data,各样品Clean Data均达到3.75 Gb,Q30碱基百分比在88.91%及以上,组装共得到100 195条Unigene,获得39 860条Unigene的注释结果,其中长度在1 kb以上的Unigene有27 647条,Unigene的N50为1 260条,组装完整性较高,Unigene在各数据库中的注释结果见表2,从中筛选出需要进行后续分析的样品共9个,涉及3个黄精品种,其差异表达基因在不同数据库中注释到的基因数量见表3。10.13422/j.cnki.syfjx.20230414.T002表2不同数据库注释的Unigene数量Table 2Number of Unigene annotated in different databases数据库注释数字300=长度1000长度=1000COG8 5352 2665 441GO30 02111 47414 538KEGG23 5378 43512 399KOG18 6846 55510 101Pfam22 3557 01313 603Swissprot20 6016 81611 674TrEMBL36 93014 54317 526eggNOG29 86411 17615 221nr38 36915 45617 666All39 86016 21317 927条10.13422/j.cnki.syfjx.20230414.T003表3不同数据库注释的差异表达基因数量Table 3Number of differentially expressed genes annotated in different databases数据库S1与S2比较S1与S3比较S2与S3比较COG878984666GO3 4533 5872 868KEGG2 8482 9292 345KOG2 1402 2671 689Pfam2 6922 8832 182Swissprot2 4622 6661 989TrEMBL4 3754 4783 675eggNOG3 6363 7183 032Nr4 4064 4903 699All4 5694 6163 835个3.2 Nr数据库物种分布统计在Nr数据库中,大部分匹配到的Unigene与芦笋(54.49%)的同源性最接近,油棕(5.89%)和海枣(5.06%)次之,同时与芭蕉科类的植物也具有一定同源性,见表4和增强出版附加材料。10.13422/j.cnki.syfjx.20230414.T004表4基因同源性对照Table 4Gene homology control物种名称同源性比例/%芦笋(Asparagus officinalis)54.49油棕(Elaeis guineensis)5.89海枣(Phoenix dactylifera)5.06外瓶霉属(Exophiala aquamarina)1.39菠萝(Ananas comosus)1.25小果野蕉(Musa acuminata)1.22铁皮石斛(Dendrobium catenatum)1.11象腿蕉属(Ensete ventricosum)0.99葡萄(Vitis vinifera)0.98野蕉(Musa balbisiana)0.85other(其他)26.783.3 差异表达基因统计分析筛选出S1与S2差异表达基因共有4 569个,上调基因2 387个(52.24%),下调基因2 182个(47.76%),S1与S3差异表达基因共有4 616个,上调基因2 714个(58.80%),下调基因1 902个(41.20%),S2与S3差异表达基因共有3 835个,上调基因2 226个(58.04%)下调基因1 609个(41.96 %),3种黄精差异表达基因的差异分布情况,见增强出版附加材料。3.4 差异表达基因GO分类及富集分析根据Unigene在GO数据库中的比对结果,S1与S2、S1与S3、S2与S3分别有3 453、3 587、2 868个差异表达基因注释到生物过程、细胞组分、分子功能3个GO分类的60个亚类之中,选择各样本组差异表达基因数目排名前20的GO功能绘制气泡图,共涉及到22个GO功能见图1,以结合功能、催化活性、代谢过程和细胞组分差异最显著。10.13422/j.cnki.syfjx.20230414.F001图1差异表达基因GO功能分类统计Fig.1GO functional classification statistics of differentially expressed genes注:GO功能分别为结合(binding)、催化活性(catalytic activity)、转运蛋白活性(transporter activity)、核酸结合转录因子活性(nucleic acid binding transcription factor activity)、代谢过程(metabolic process)、细胞过程(cellular process)、单一生物体过程(single-organism process)、生物调控(biological regulation)、应激性(response to stimulus)、定位(localization)、细胞成分组织或生物发生(cellular component organization or biogenesis)、多细胞生物体过程(multicellular organismal process)、发育过程(developmental process)、信号(signaling)、细胞(cell)、细胞部分(cell part)、膜(membrane)、细胞器(organelle)、膜部分(membrane part)、细胞器部分(organelle part)、大分子复合体(macromolecular complex)、膜封闭腔体(membrane-enclosed lumen)3.5 KEGG通路统计分析S1与S2共有1 425个差异表达基因被注释到了KEGG的129条通路中,其余为S1与S3(1 428个,128条),S2与S3(1 175个,127条)。主要有细胞过程(cellular process)、环境信息处理(environmental information processing)、遗传信息处理(genetic information processing)、代谢(metabolism)、有机系统(organic system)5大类,差异基因数目及比例见表5,不同品种间在新陈代谢相关的通路差异基因数目最多。10.13422/j.cnki.syfjx.20230414.T005表5差异表达基因KEGG通路统计Table 5Statistics of differentially expressed gene in KEGG pathway通路名称S1与S2S1与S3S2与S3数目/条比例/%数目/条比例/%数目/条比例/%细胞过程603.92573.81423.24环境信息处理926.01865.75876.72遗传信息处理44529.0738225.5334526.64新陈代谢80352.4583455.7567952.43有机系统1318.561379.1614210.973.6 KEGG通路富集分析对样品组差异表达基因进行KEGG通路富集,选择富集到的前20条通路进行分析,见增强出版附加材料。从各样品组差异表达基因富集的前20条通路来看,S1与S2比较与多糖代谢有关的通路为淀粉与蔗糖代谢通路,S2与S3比较为淀粉与蔗糖代谢通路与半乳糖代谢通路。以上结果说明,这3种黄精多糖代谢在这两条通路上差异性最显著,在后续多糖代谢的研究中可作为主要研究通路。3.7 多糖代谢关键酶差异表达基因分析黄精中含有果糖、葡萄糖、甘露糖、半乳糖、阿拉伯糖、鼠李糖[28-29]等单糖,这些单糖经过糖基转移酶等一系列酶合成黄精多糖,本次研究结果表明3种黄精在多糖代谢途径基因表达上有较大差异,在淀粉与蔗糖代谢途径(ko00500)、氨基糖和核苷酸糖代谢途径(ko00520)、果糖和甘露糖代谢途径(ko00051)、半乳糖代谢途径(ko00052)中共鉴定出以下与多糖合成相关的关键酶,UDP-葡萄糖脱氢酶(UGDH)、己糖激酶(HK)、果糖激酶(scrK)、β-果糖苷酶(sacA)、磷酸甘露糖异构酶(PMM)、蔗糖磷酸合成酶(SPS)、UDP糖焦磷酸化酶(USP)、UTP-葡萄糖-1-磷酸尿苷转移酶(UGP)、UDP-葡萄糖醛酸4-外聚酶(UGE)、甘露糖-6-磷酸异构酶(MPI)、蔗糖合成酶(SUS)、GDP-甘露糖焦磷酸化酶(GMPP)、GDP甘露糖4,6-脱水酶(GMDS)、UDP-鼠李糖合成酶(RHM)[30-32]。根据DEseq2处理后的基因表达量数据绘制聚类热图,见图2,结果显示3种黄精之间差异显著,可根据这些关键酶基因的表达量差异将黄精进行初步分类,而同种黄精之间差异并不显著,多花黄精UGDH、PMM、SPS、sacA、RHM、GMDS的基因表达量显著高于湖北黄精与滇黄精,滇黄精MPI、UGP、SUS、UGE、GMPP的基因表达量显著高于多花黄精与湖北黄精,图3表明在同一样品内sacA基因c249389.graph_c0、c248696.graph_c0、c243299.graph_c0的表达量显著高于大部分酶基因,热图结果均为相对表达量情况,根据图4总表达量结果综合分析推测出不管是种间还是种内,sacA均可能是影响黄精多糖含量最主要的酶类。10.13422/j.cnki.syfjx.20230414.F002图2多糖代谢关键酶基因表达量聚类热图Fig.2Clustering Heat map of gene expression of key enzymes for polysaccharide metabolism注:绝对值越大表示差异性越大,0表示无差异性,红色代表高于平均表达量,蓝色代表低于平均表达量(图3同)10.13422/j.cnki.syfjx.20230414.F003图3多糖代谢关键酶基因表达量聚类热图Fig.3Clustering Heat map of gene expression of key enzymes for polysaccharide metabolism10.13422/j.cnki.syfjx.20230414.F004图4总表达量峰峦Fig.4Total expression peaks map3.8 多糖含量测定结果与多糖代谢关键酶的分析由吸光度数据计算得到线性回归方程为Y=0.031 7X+0.050 3(R2=0.999 1)线性范围(0.003 3~0.036 3 g·L-1),方法学考察结果,精密度、稳定性、重复性、加样回收率、平均加样回收率分别为0.19%、0.39%、0.75%、2.95%、104.62%。P1~P9得到多糖质量分数测定结果分别为9.76%、8.65%、9.01%、19.63%、17.94%、19.45%、12.63%、11.28%、13.66%,其中多花黄精含量最高,滇黄精含量次之,湖北黄精含量最低。使用SPSS软件将各样品多糖代谢关键酶表达量与多糖含量进行相关性分析,结果表明UGDH、sacA、PMM、SPS、scrK、USP、GMPP的表达量与样本多糖含量成显著正相关,见表6。10.13422/j.cnki.syfjx.20230414.T006表6多糖含量与酶表达量相关性数据Table 6Correlation data between polysaccharide content and enzyme expression相关性多糖含量UGDHHKscrKsacAPMMSPSUSPUGP2UGEMPISUSGMPPGMDSRHM多糖含量10.8962)0.1040.6961)0.9572)0.9222)0.9082)0.6961)0.011-0.075-0.039-0.1730.7411)-0.5440.638UGDH0.8962)1-0.1420.8232)0.8812)0.8342)0.8332)0.8932)-0.082-0.102-0.040-0.1450.626-0.5830.638HK0.104-0.14210.1570.0610.1030.176-0.2960.2540.3730.0970.3100.082-0.080-0.014scrK0.6961)0.8232)0.15710.5810.7181)0.7071)0.7381)0.1710.3520.1500.3550.389-0.2850.300sacA0.9572)0.8812)0.0610.58110.8012)0.8862)0.6921)-0.224-0.317-0.210-0.4000.7901)-0.7411)0.7901)PMM0.9222)0.8342)0.1030.7181)0.8012)10.7931)0.6580.3340.1800.2300.0410.575-0.2530.401SPS0.9082)0.8332)0.1760.7071)0.8862)0.7931)10.7591)-0.153-0.190-0.233-0.2700.8852)-0.6030.7691)USP0.6961)0.8932)-0.2960.7381)0.6921)0.6580.7591)1-0.116-0.191-0.134-0.2180.580-0.5280.6851)UGP20.011-0.0820.2540.171-0.2240.334-0.153-0.11610.8602)0.8582)0.7181)-0.4540.577-0.570UGE-0.075-0.1020.3730.352-0.3170.180-0.190-0.1910.8602)10.7901)0.9612)-0.5320.579-0.6931)MPI-0.039-0.0400.0970.150-0.2100.230-0.233-0.1340.8582)0.7901)10.640-0.5670.411-0.612SUS-0.173-0.1450.3100.355-0.4000.041-0.270-0.2180.7181)0.9612)0.641-0.5780.603-0.7241)GMPP0.7411)0.6260.0820.3890.7901)0.5750.8852)0.580-0.454-0.532-0.567-0.5781-0.5700.8322)GMDS-0.544-0.583-0.080-0.285-0.7411)-0.253-0.603-0.5280.5770.5790.4110.603-0.5701-0.8642)RHM0.6380.638-0.0140.3000.7901)0.4010.7691)0.6851)-0.570-0.6931)-0.612-0.7241)0.8322)-0.8642)1注:1)P0.05,2)P0.013.9 Real-time PCR验证结果以18SrRNA为内参基因,对8个筛选出的多糖代谢关键酶基因进行Real-time PCR验证,分析目的基因在不同品种中的表达差异,与转录组测序结果进行比较,验证实验结果可靠性。结果显示sacA、MPI在不同品种中的基因表达量差异与测序结果具有一致性,而在相关性分析中并未发现MPI与多糖含量存在显著相关性,无法推测出MPI对黄精多糖含量有显著影响,故未作进一步的研究分析。见图5。10.13422/j.cnki.syfjx.20230414.F005图58个关键酶基因表达量与Real-time PCR相对表达量对比Fig.5Expression of 8 key enzyme genes compared with Real-time PCR relative expression注:柱形图代表目的基因的FPKM值,折线表示目的基因的Real-ime PCR相对表达量3.10 scaA及其同源基因序列分析根据前文中得到的研究结果进一步从黄精转录组的sacA基因中筛选出6个开放阅读框长度1 000 bp的关键基因进行深入分析,对其同源基因构建系统进化树,并预测其motif区段和保守结构域,结果见图6,主要将这些基因归属于4个家族,依据亲缘关系主要分为2大类,与motif预测结果具有一致性。其中c230588.graph_c0、c256418.graph_c0、c244654.graph_c0同属于DUF247家族,与深圳拟兰Apostasia shenzhenica、黄连Coptis chinensis、杨柳Populus deltoides、独叶草Kingdonia uniflora等植物有较近的亲缘关系,c234960.graph_c0、c249389.graph_c0、c248696.graph_c0同属于糖苷水解酶家族(包括GH32_Fruct1-like、Glyco_32),并具有糖苷水解酶家族的功能结构域,与芦笋Asparagus officinalis、太匮龙舌兰Agave tequilana、洋葱Allium cepa、小麦Triticum aestivum、冰草Agropyron cristatum、芦荟Aloe vera等植物有较近的亲缘关系,并且比对结果显示c249389.graph_c0、c248696.graph_c0的氨基酸序列分别与果糖1-果糖基转移酶XP_020240888.1(芦笋)、6(G)-果糖基转移酶ABS72186.1(太匮龙舌兰)有较高匹配率(85%),c234960.graph_c0与β-果糖苷酶蛋白KAH7668350.1(参薯)有较高匹配率(69%)。对6个关键基因蛋白序列进行理化性质预测,见表7。结果显示DUF247家族的3个基因不稳定系数在41.38以上,属于不稳定型蛋白,而糖基转移酶家族的3个基因属于稳定型蛋白,DNAman比对结果表明这3个基因氨基酸序列与芦笋和太匮龙舌兰的同源序列一致性为64.6%,中间有多段保守序列(黑色标注部分),对这3个基因进行同源建模进一步分析蛋白结构,见图7。虽然这3个基因表现出氨基酸序列多样性,但其蛋白质空间结构仍然保守,具有相似的结构和功能,均有4~5个α螺旋,而c248696.graph_c0相较于其他2个基因在左半边缺少一部分β折叠结构,3个基因的螺旋结构图见增强出版附加材料。10.13422/j.cnki.syfjx.20230414.F006图6关键基因的氨基酸序列分析Fig.6Amino acid sequence analysis of key genes10.13422/j.cnki.syfjx.20230414.T007表7关键基因蛋白序列理化性质Table 7Physicochemical properties of key gene protein sequences基因ID等电点相对分子质量/Da不稳定系数带正电荷的残基总数/个带负电荷的残基总数/个c248696.graph_c05.3750 091.4634.383952c234960.graph_c08.2263 861.5730.907168c249389.graph_c05.1569 809.0334.204770c256418.graph_c05.9641 520.0341.384047c244654.graph_c05.3849 165.0252.034961c230588.graph_c07.0757 396.8742.08616210.13422/j.cnki.syfjx.20230414.F007图7DNAman比对结果Fig.7DNAman matching results4 讨论多糖作为黄精的主要药效成分,具有抗疲劳、抗氧化、降血糖等重要功效,2020年版《中国药典》规定其含量不低于7%[1],由于不同品种黄精多糖含量差异较大,同时环境差异也会造成相应影响[33-34],为了控制环境变量对实验结果的影响,本文采集相同产地同等培育条件下的3种黄精进行实验,探究影响不同品种黄精多糖含量的关键酶,对湖北黄精、滇黄精、多花黄精的根茎转录组数据进行系统分析,并对测序结果进行质量评估,确保了后续数据分析的可靠性,主要结合了Nr、GO、KEGG 3大数据库对基因进行注释及分析。Nr数据库分析结果表明黄精与芦笋等植物的基因同源性较高,经GO与KEGG富集分析、文献研究筛选、热图分析与Real-time PCR验证实验结合差异基因的数目和表达量分析推测出sacA是影响湖北黄精、多花黄精、滇黄精多糖含量的主要关键酶,经KEGG代谢通路图发现在4条与多糖代谢相关的通路中仅在淀粉与蔗糖代谢通路(ko00500)与半乳糖代谢通路(ko00052)中发现该种酶,同时富集分析结果也显示3种黄精在这2条通路上差异性显著,也可证明该结论的可靠性,而相关性分析结果表明UGDH、PMM、SPS、scrK、USP、GMPP这几种酶对多糖含量也有显著影响,但是Real-time PCR验证实验结果并未证明这个结论准确性,同时从其表达量来看也远低于sacA,所以本文对sacA基因进行了更深入地研究分析。对sacA基因氨基酸序列进行同源基因系统进化树构建、motif区段与保守结构域预测,进一步证明黄精中的3个sacA基因与果糖基转移酶的结构与功能极其相似。ZHANG等[35]从多花黄精中分离得到了2种多糖,分别为果聚糖DP1和半乳聚糖PP1,理化性质和结构鉴定表明DP1组成为果糖和葡萄糖,峰面积百分比分别为96.29%与3.71%,表明DP1主要由大量果糖通过不同类型的糖苷键连接而成,而PP1主要由半乳糖通过糖苷键连接而成,从分离纯化得率来看DP1(11.40%)含量远高于PP1(0.89%)。ZHAO等[36]的研究结果也表明黄精中的多糖主要由果糖及半乳糖组成,果聚糖含量显著高于其他类型多糖,由于聚糖不是像蛋白质和核酸那样从基因组编码的模板直接合成的,其保真度取决于糖基转移酶的特异性,这些糖基转移酶通过一次添加一个糖来合成复杂的聚糖,为了形成新的糖苷键,糖基转移酶与受体底物结合,并定向一个特定的羟基,通常是许多羟基中的一个,以攻击供体糖的异构碳。最近几个具有结合受体底物的糖基转移酶的晶体结构显示,这些酶具有共同的核心结构,作为支架的功能,在其上插入可变环,以赋予底物特异性并正确引导亲核羟基,受体结合位点组装的不同方法表明,这些环状区域的持续进化为生物学中观察到的各种糖结构的组装提供了模板[37]。宋春丽等[38]以pET28a为载体实现了黑曲霉来源的果糖基转移酶基因fru在大肠埃希菌BL21(DE3)中的异源表达,并研究分析了纯化后重组果糖基转移酶的酶学性质,大幅度提高果糖基转移酶的产量,且酶活力也有所提高,有利于扩大工业上低聚果糖生产规模,提高产量。结合2个相关代谢通路中sacA的上游及下游化合物来看,推测黄精的sacA基因也可将蔗糖与棉子糖等作为底物催化生成更为复杂的果聚糖。转录组学研究可以从基因的转录调控及表达对品种差异做出合理的阐释,本文通过sacA高表达基因的结构与功能分析推测出sacA是不同品种黄精多糖含量差异的主要原因,同时揭示了sacA是黄精多糖主要为果聚糖的关键影响因素,可进一步根据sacA高表达基因序列设计引物进行质粒构建,通过异源表达[39]验证其合成果聚糖的功能,为黄精多糖合成机制的深入研究奠定基础,也为黄精属植物的遗传改良和质量评价提供了重要参考。
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览