紫苏(Perilla frutescens)是唇形科紫苏属的一年生直立草本植物,是国家原卫生部食品卫生监督检验所首批颁布的61种(1种重叠)药食同源的药材之一;其入药历史悠久,紫苏子、紫苏叶、紫苏梗在历版《中华人民共和药典》(以下简称《中国药典》)均有收录,在医药、食品、美妆、畜牧等领域应用广泛,通常作为中药材、油料作物、蔬菜等广泛栽培。作为一味传统的中药材,挥发油是紫苏主要的药效成分和特异香气来源,2020年版《中国药典》记载紫苏叶含挥发油不得少于0.40%(mL·g-1)[1]。紫苏叶油是藿香正气系列产品中的原料药,特征性单萜成分是紫苏叶油的主要活性成分[2]。根据紫苏挥发油中所含主要成分不同,将紫苏分成了紫苏酮(PK型)、紫苏醛(PA型)、香薷酮(EK型)、反式柠檬醛(C型)、苯丙素(PP型)、紫苏烯(PL型)、β-石竹烯、肉豆蔻碱(MT型)、柠檬烯和胡椒烯酮(PT型)等几种化学型[3]。现代药理研究表明,紫苏具有抗哮喘、抗糖尿病、抗抑郁、抗癌、抗菌、抗氧化、心脏保护、神经保护、保肝等多种药理作用[4],紫苏挥发油所具有的药理作用在其中占据举足轻重的地位,而其中的特征性单萜成分是紫苏独特药用价值的基础。紫苏酮、紫苏醛是紫苏挥发油中的特征性成分[5],紫苏醛也是紫苏香气质量评价的关键指标。紫苏醛、紫苏酮、紫苏醇等明显抑制肿瘤细胞的增值、侵袭和转移,并且能够诱导癌细胞凋亡[6],紫苏醛还能通过蛋白激酶B(Akt)/c-Jun氨基末端激酶(JNK)通路调节炎症反应,抑制大鼠脑缺血再灌注诱导的神经细胞凋亡,起到神经保护的作用[7]。紫苏精油不仅对不同的昆虫表现出较强的杀虫和趋避活性,也显示出很强的光谱抗菌特性,这些萜类化合物对引起登革热的蚊子、埃及伊蚊具有很强的杀幼虫活性;对植物病原真菌黄曲霉、黑曲霉、米根霉等也显示出较强的抗真菌活性[8];虽然紫苏对人体无不良反应,但是其对实验动物和牲畜显示出了一些不良反应,在没有任何肺动脉或左心房压力改变的情况下,向绵羊单次输注紫苏酮会导致绵羊肺液和溶质交换显著增加,导致内皮损伤、间质和肺泡内水肿,引起绵羊非心源性肺水肿[9];紫苏酮和紫苏粗提物对实验动物均显示出强烈的肺损伤情况,并且与来自甘薯的肺损伤异丙醇有很强的化学相似性[10]。因此深入研究紫苏单萜类化合物的转录调控机制,对于培育出不含紫苏酮的紫苏品系、降低紫苏叶油系列中成药的用药风险具有重大意义。紫苏单萜类化合物的生物合成受到显性基因G的控制[11],在基因G存在的情况下,经过甲羟戊酸途径合成单萜类物质,若缺少关键基因G,则通过莽草酸途径合成芳香族类化合物。紫苏单萜类化合物的初始反应步骤是由香叶醇或者柠檬烯合酶催化的香叶基二磷酸(GDP)的去磷酸化,由柠檬烯在C7位羟基化形成紫苏醇再氧化成紫苏醛;由香叶醇经过催化形成紫苏烯、白苏烯酮和紫苏酮;由此可见紫苏精油中几乎所有的单萜类化合物都是由GDP的无环化合物经过环化、氧化或者还原形成的[12]。而这些化合物的氧化、还原步骤通常由细胞色素P450(CYP450)催化,在薄荷、长春花的研究中表明紫苏精油中的柠檬烯、香叶醇就作为CYP450的底物[13-14]。CYP450是一种含血红素的单加氧酶,可以催化氧化、羟基化、环氧化和脱烷基化等多种反应,其在植物中主要参与解毒途径或者多种次生代谢产物包括萜类、黄酮类、生物碱类、脂肪酸等的生物合成。CYP450是最大最古老的基因超家族之一,根据其氨基酸序列间的相似性和进化关系分为家族(至少40%的序列统一性)和亚家族(至少55%的序列统一性)[15]。CYP71家族是CYP71簇(71clan)中的其中一个家族,而大多数与萜类化合物相关的CYP450都是CYP71clan中的成员,比如主要来自CYP71A和CYP71D亚家族的基因与不同植物中单萜或者倍半萜的氧化有关,薄荷、留兰香和紫苏都表达柠檬烯羟化酶,在C3(CYP71D13和CYP71D15)、C6(CYP71D18)、C7(CYP71D174)位上特异性羟基化柠檬烯形成紫苏醇、香芹酚和异胡椒烯醇的混合物[16],从成熟鳄梨果实的中果皮中分离出的第一个植物CYP450 CYP71A1能够使单萜橙花醇和香叶醇羟基化[17]。目前也有文献报道柠檬烯经过CYP71D15催化得到紫苏醇,紫苏醇再经过CYP71AT146催化脱氢得到紫苏醛[18],由此可见紫苏单萜类物质的生物合成与CYP71家族密不可分。相比于费时费力、造价昂贵并且效率不高的化学合成,具有高度特异性和专一性的生物合成尤其受欢迎,在紫苏精油所含的化合物中,柠檬烯、柠檬醛、紫苏醛的生物转化已经有所报道,但还有其他许多组分尚未报道,研究CYP71家族对紫苏单萜类物质的生物合成有关键作用。栽培紫苏为AABB型异源四倍体,ZHANG等[19]完成了一套四倍体紫苏和两套AA型二倍体亲本紫苏的染色体水平高质量基因组,进而揭示了在最近1万年内,多倍体化导致碱基突变加速的现象。此研究以二倍体紫苏PC99的基因组为对象,采用生物信息学的方法对紫苏CYP71家族的成员进行系统化分析,包括序列特征、基因结构、系统发育、保守基序和共线性关系等,为后期CYP71基因家族功能研究和紫苏单萜类化合物的生物合成提供数据支持,并为紫苏优良定向品种的培育提供参考。1 材料与方法1.1 二倍体紫苏CYP71家族成员的鉴定和理化性质分析二倍体紫苏(GCA_004303085.2)的全基因组和注释文件从NCBI(https://www.ncbi.nlm.nih.gov/)获取,品种是PC99。拟南芥CYP71家族(包括CYP71A和CYP71B)蛋白序列从TAIR(https://www.arabidopsis.org/)获取。利用TBtools[20]软件提取二倍体紫苏的蛋白序列,并与拟南芥CYP71家族蛋白序列进行双向Blast比对,获得初步的二倍体紫苏CYP71家族成员。将这些初筛过的蛋白序列通过NCBI的Protein Blast板块进行二次Blast比对,并使用CD-Search工具对蛋白的保守结构域进行分析,去除冗余,保留含有CYP71-like结构域的蛋白序列,即为二倍体紫苏CYP71家族成员。重命名后通过ExPASy网站(https://web.expasy.org/protparam/)分析二倍体紫苏CYP71家族成员的氨基酸长度、等电点、蛋白质相对分子质量、亲水性指数等;通过CELLO v2.5网站(http://cello.life.nctu.edu.tw/)预测二倍体紫苏CYP71家族成员的亚细胞定位。1.2 二倍体紫苏CYP71基因家族系统发育分析通过使用MEGA-X软件的MUSCLE算法对拟南芥和二倍体紫苏CYP71家族基因进行多序列比对,采用邻接法(NJ)构建系统发育树,将bootstrap值设置为1 000次,并使用Figtree软件对进化树进行美化。1.3 二倍体紫苏CYP71家族的基因结构和保守基序分析及富集分析通过MEME网站(https://meme-suite.org/meme/doc/meme.html)对二倍体紫苏CYP71家族蛋白序列的保守基序(motif)进行预测,并将目标保守基序的数量设置为10。利用TBtools软件对二倍体紫苏的基因组注释文件进行解析,并对二倍体紫苏的CYP71家族的基因结构和保守基序进行整合和可视化分析。在EGGNOG-mapper(http://eggnog-mapper.embl.de/)网站上对二倍体紫苏CYP71基因家族的蛋白序列进行功能注释,通过TBtools软件从注释文件中比对、鉴定和筛选出二倍体紫苏CYP71基因家族成员,并对筛选出的CYP71家族成员进行京都基因与基因组百科全书(KEGG)数据库和基因本体(GO)论数据库富集分析及可视化作图。1.4 二倍体紫苏CYP71家族成员的染色体定位和共线性分析利用TBtools软件根据二倍体紫苏的基因组注释文件确定CYP71基因家族成员在染色体上的位置信息,并将染色体分布进行可视化。接着通过TBtools软件中的One Step MCScanX程序来分析二倍体紫苏和拟南芥之间的CYP71基因家族的共线性关系,并将其可视化。1.5 二倍体紫苏CYP71基因家族顺式作用元件预测使用TBtools软件从二倍体紫苏基因组序列和注释文件中提取CYP71基因上游2 000 bp的启动子序列,通过PlantCare网站(https://www.plantcare.co.uk/)对其进行顺式作用元件的预测,利用TBtools工具进行可视化。1.6 二倍体紫苏CYP71基因互作网络分析基于二倍体紫苏和拟南芥CYP71的同源蛋白序列,通过STRING(https://cn.string-db.org/)网站研究同源蛋白的互作网络,利用Cytoscape软件优化互作网络并进行可视化分析。2 结果与分析2.1 二倍体紫苏CYP71基因家族成员的鉴定和理化性质分析通过双向及二次Blast比对,去除重复序列并通过NCBI-CDD验证结构域后,最终获得68个CYP71基因家族成员,将其依次命名为Pf1CYP71-1~Pf1CYP71-68,见表1。利用TBtools软件根据二倍体紫苏的基因组及注释文件获得Pf1CYP71的蛋白序列,并进行理化性质分析。这些Pf1CYP71蛋白的氨基酸长度在481~530个氨基酸之间,平均长度为502个氨基酸,蛋白质相对分子质量在54 217.07~60 031.79 Da,等电点在5.70~9.03。根据这些蛋白的不稳定系数可以看出大约有一半的蛋白40,提示蛋白可能不稳定,根据这些蛋白的总平均亲水性可以看出,除了PfCYP71-21和PfCYP71-54之外其他蛋白的总平均亲水性均为负值,均是亲水性蛋白。亚细胞定位预测结果显示,有17个PfCYP71蛋白定位在细胞质中,有19个PfCYP71蛋白定位在细胞膜中,有19个PfCYP71蛋白定位在线粒体中,有12个PfCYP71蛋白定位在叶绿体中,只有一个PfCYP71蛋白定位在细胞核。10.13422/j.cnki.syfjx.20230315.T001表1二倍体紫苏CYP71基因家族基本信息Table 1Basic information of CYP71 gene family of diploid perilla frutescens基因名称基因号氨基酸数目/个等电点相对分子质量/Da不稳定系数总平均亲水性亚细胞定位Pf1CYP71-1rna-gnl|WGS:SDAM|PC99_00088_00201294_00204085.mrna15098.0458 600.7838.48-0.241细胞质Pf1CYP71-2rna-gnl|WGS:SDAM|PC99_00088_00007673_00009299.mrna15057.6557 218.1647.20-0.132细胞膜Pf1CYP71-3rna-gnl|WGS:SDAM|PC99_00873_00140403_00141978.mrna14966.6156 579.5634.58-0.138线粒体Pf1CYP71-4rna-gnl|WGS:SDAM|PC99_00873_00293285_00294907.mrna14947.1156 198.5234.14-0.040线粒体Pf1CYP71-5rna-gnl|WGS:SDAM|PC99_00873_00287764_00289337.mrna14927.8055 986.4933.98-0.048线粒体Pf1CYP71-6rna-gnl|WGS:SDAM|PC99_00873_00275214_00276805.mrna14946.9056 554.7332.51-0.141线粒体Pf1CYP71-7rna-gnl|WGS:SDAM|PC99_00953_00476203_00477781.mrna15018.8656 573.8240.40-0.148线粒体Pf1CYP71-8rna-gnl|WGS:SDAM|PC99_00953_00466825_00473077.mrna15038.8456 678.0942.93-0.088细胞膜Pf1CYP71-9rna-gnl|WGS:SDAM|PC99_00403_00228801_00232627.mrna15268.6959 827.3838.60-0.168细胞膜Pf1CYP71-10rna-gnl|WGS:SDAM|PC99_00084_00149221_00150813.mrna15038.6457 041.3842.67-0.188叶绿体Pf1CYP71-11rna-gnl|WGS:SDAM|PC99_00085_00585895_00587491.mrna15068.8257 412.3831.75-0.116线粒体Pf1CYP71-12rna-gnl|WGS:SDAM|PC99_00085_00527297_00528913.mrna15088.4557 450.3037.44-0.146线粒体Pf1CYP71-13rna-gnl|WGS:SDAM|PC99_00085_00691809_00693472.mrna15096.4957 993.5343.40-0.048细胞膜Pf1CYP71-14rna-gnl|WGS:SDAM|PC99_00228_00925133_00926727.mrna14986.9956 869.3035.64-0.137细胞质Pf1CYP71-15rna-gnl|WGS:SDAM|PC99_00228_00838063_00839642.mrna14997.6756 529.0940.86-0.083细胞质Pf1CYP71-16rna-gnl|WGS:SDAM|PC99_00228_00768704_00770317.mrna15008.5056 636.2940.14-0.072细胞质Pf1CYP71-17rna-gnl|WGS:SDAM|PC99_00228_00811853_00815371.mrna14916.7955 650.9042.04-0.041细胞质Pf1CYP71-18rna-gnl|WGS:SDAM|PC99_04167_00088331_00089894.mrna14915.7055 687.2844.83-0.102细胞膜Pf1CYP71-19rna-gnl|WGS:SDAM|PC99_01760_00503590_00505156.mrna14928.1655 952.0639.83-0.088线粒体Pf1CYP71-20rna-gnl|WGS:SDAM|PC99_01760_00511334_00512943.mrna14988.7056 435.6745.29-0.138线粒体Pf1CYP71-21rna-gnl|WGS:SDAM|PC99_00326_00319209_00320874.mrna14907.0955 741.1242.130.019细胞膜Pf1CYP71-22rna-gnl|WGS:SDAM|PC99_00364_01027994_01029953.mrna14818.3754 217.0735.69-0.090叶绿体Pf1CYP71-23rna-gnl|WGS:SDAM|PC99_00319_00288398_00290319.mrna15076.0257 084.8543.06-0.096细胞膜Pf1CYP71-24rna-gnl|WGS:SDAM|PC99_00319_00190877_00192937.mrna15067.6757 594.8943.73-0.168细胞质Pf1CYP71-25rna-gnl|WGS:SDAM|PC99_00319_00236616_00238283.mrna15176.3658 445.6038.58-0.096细胞质Pf1CYP71-26rna-gnl|WGS:SDAM|PC99_00319_00387954_00390583.mrna14976.4956 361.2347.28-0.070细胞膜Pf1CYP71-27rna-gnl|WGS:SDAM|PC99_00319_00234683_00236303.mrna15028.2956 997.3936.27-0.046叶绿体Pf1CYP71-28rna-gnl|WGS:SDAM|PC99_00319_00339995_00341596.mrna14976.9656 552.9131.21-0.040细胞质Pf1CYP71-29rna-gnl|WGS:SDAM|PC99_00843_00425212_00427036.mrna15115.8757 380.4445.26-0.057细胞质Pf1CYP71-30rna-gnl|WGS:SDAM|PC99_00610_00164718_00166696.mrna14996.4556 236.1838.95-0.059细胞膜Pf1CYP71-31rna-gnl|WGS:SDAM|PC99_00610_00088893_00092558.mrna15176.1257 921.7842.79-0.115细胞质Pf1CYP71-32rna-gnl|WGS:SDAM|PC99_00746_00464746_00467539.mrna15278.8660 031.7950.84-0.185细胞膜Pf1CYP71-33rna-gnl|WGS:SDAM|PC99_06499_00090172_00093131.mrna15068.5557 227.6438.09-0.069叶绿体Pf1CYP71-34rna-gnl|WGS:SDAM|PC99_00872_00279346_00281994.mrna14996.1856 572.6944.96-0.134叶绿体Pf1CYP71-35rna-gnl|WGS:SDAM|PC99_00431_00481379_00483710.mrna15305.9759 905.0340.15-0.173线粒体Pf1CYP71-36rna-gnl|WGS:SDAM|PC99_01149_00263580_00265878.mrna15088.8257 024.3342.96-0.066叶绿体Pf1CYP71-37rna-gnl|WGS:SDAM|PC99_01092_00645080_00646900.mrna14938.5056 362.2738.53-0.187线粒体Pf1CYP71-38rna-gnl|WGS:SDAM|PC99_00675_00365931_00368061.mrna15106.7257 085.3338.45-0.064细胞质Pf1CYP71-39rna-gnl|WGS:SDAM|PC99_00675_00385811_00387871.mrna15066.4557 005.0641.49-0.093细胞质Pf1CYP71-40rna-gnl|WGS:SDAM|PC99_00676_00265486_00268281.mrna14956.2156 712.2438.01-0.048细胞质Pf1CYP71-41rna-gnl|WGS:SDAM|PC99_00227_00712137_00714303.mrna15066.6957 276.8944.57-0.025细胞质Pf1CYP71-42rna-gnl|WGS:SDAM|PC99_00227_00722538_00726108.mrna15107.1557 705.9339.92-0.140叶绿体Pf1CYP71-43rna-gnl|WGS:SDAM|PC99_00640_00400976_00404711.mrna15029.0357 049.0733.52-0.141线粒体Pf1CYP71-44rna-gnl|WGS:SDAM|PC99_00815_00156466_00159141.mrna15028.7957 315.5841.07-0.079细胞膜Pf1CYP71-45rna-gnl|WGS:SDAM|PC99_00347_02016901_02018493.mrna14996.8456 053.4447.57-0.025线粒体Pf1CYP71-46rna-gnl|WGS:SDAM|PC99_01047_00110664_00112988.mrna15176.5957 904.1832.26-0.042细胞质Pf1CYP71-47rna-gnl|WGS:SDAM|PC99_01046_00108443_00111023.mrna14985.9356 134.4446.48-0.024叶绿体Pf1CYP71-48rna-gnl|WGS:SDAM|PC99_01046_00119077_00121556.mrna14987.5356 651.1443.48-0.060线粒体Pf1CYP71-49rna-gnl|WGS:SDAM|PC99_01045_00168143_00170915.mrna15068.8857 297.1231.86-0.010细胞膜Pf1CYP71-50rna-gnl|WGS:SDAM|PC99_01045_00229505_00231560.mrna14998.7257 008.5832.46-0.110叶绿体Pf1CYP71-51rna-gnl|WGS:SDAM|PC99_01045_00285470_00288308.mrna14997.5757 191.7644.64-0.116叶绿体Pf1CYP71-52rna-gnl|WGS:SDAM|PC99_00557_00653329_00655931.mrna14997.6656 946.9938.61-0.103细胞膜Pf1CYP71-53rna-gnl|WGS:SDAM|PC99_00557_00940452_00942316.mrna14978.3556 799.6142.35-0.137细胞膜Pf1CYP71-54rna-gnl|WGS:SDAM|PC99_01165_00267858_00269566.mrna15016.0856 321.2047.280.001细胞膜Pf1CYP71-55rna-gnl|WGS:SDAM|PC99_00611_00085492_00088908.mrna15106.5057 549.5449.64-0.105叶绿体Pf1CYP71-56rna-gnl|WGS:SDAM|PC99_00611_00123290_00125360.mrna15066.2057 045.8447.97-0.162叶绿体Pf1CYP71-57rna-gnl|WGS:SDAM|PC99_00611_00029423_00031938.mrna14946.4555 618.3936.70-0.079细胞质Pf1CYP71-58rna-gnl|WGS:SDAM|PC99_00611_00072075_00073835.mrna15046.1757 232.1344.29-0.190细胞质Pf1CYP71-59rna-gnl|WGS:SDAM|PC99_00923_00191170_00192782.mrna15115.9157 669.6442.70-0.079细胞膜Pf1CYP71-60rna-gnl|WGS:SDAM|PC99_01118_00216449_00218024.mrna14937.6855 768.6240.69-0.102细胞膜Pf1CYP71-61rna-gnl|WGS:SDAM|PC99_01118_00231118_00232931.mrna15097.2057 715.7737.55-0.079细胞膜Pf1CYP71-62rna-gnl|WGS:SDAM|PC99_05382_00013811_00015953.mrna15058.3557 640.1240.44-0.231细胞核Pf1CYP71-63rna-gnl|WGS:SDAM|PC99_08617_00021406_00024577.mrna15028.7356 364.3733.87-0.081线粒体Pf1CYP71-64rna-gnl|WGS:SDAM|PC99_00376_00389164_00390795.mrna15158.6458 984.0046.07-0.159细胞膜Pf1CYP71-65rna-gnl|WGS:SDAM|PC99_00496_00336811_00339576.mrna15008.6656 412.7348.02-0.122线粒体Pf1CYP71-66rna-gnl|WGS:SDAM|PC99_00543_01144679_01146506.mrna14929.0155 297.3453.53-0.122线粒体Pf1CYP71-67rna-gnl|WGS:SDAM|PC99_00671_00073276_00074958.mrna14998.6556 610.1144.15-0.043线粒体Pf1CYP71-68rna-gnl|WGS:SDAM|PC99_02078_00246032_00247622.mrna14937.6656 258.1245.52-0.198线粒体2.2 二倍体紫苏CYP71基因家族的系统发育分析为了解二倍体紫苏和拟南芥CYP71基因家族进化关系,使用MEGA-X软件对二倍体紫苏68个和拟南芥48个蛋白序列构建NJ系统发育树,见图1。系统发育关系表明二倍体紫苏和拟南芥共116个CYP71基因明显分为10个进化支。由于拟南芥CYP71基因家族主要分为71A(绿色字体)和71B(红色字体)2个亚家族,根据图1的系统发育树可以看出二倍体紫苏大致分为3部分,Ⅰ区与拟南芥CYP71A聚为一簇,提示可能归属于CYP71A亚家族,Ⅱ区与拟南芥CYP71B聚为一簇,提示可能归属于CYP71B亚家族,但是仍然有蓝色分支Ⅲ区的16个Pf1CYP71基因不能归属于任何亚家族中,提示可能归属于不同家族的CYP基因,包括CYP99A1、CYP83B1、CYP84A1等[21]。10.13422/j.cnki.syfjx.20230315.F001图1二倍体紫苏(黑色字体)和拟南芥(彩色字体)CYP71基因家族系统发育树Fig.1Phylogenetic tree of CYP71 gene family of diploid perilla frutescens (black) and Arabidopsis thaliana (colored)2.3 二倍体紫苏CYP71基因家族的基因结构和保守motif分析基因家族成员在序列上具有保守性和相关性[22],外显子-内含子的基因结构能反应基因进化的特征,并为基因的功能分化提供支持[23]。将二倍体紫苏CYP71家族的基因结构和保守基序及其系统进化树使用TBtools软件进行整合可视化作图,见图2。通过MEME网站在线分析,预测68个二倍体紫苏CYP71蛋白的保守motif,获得了10个相对保守的motif,这些保守基序的长度介于15~50个氨基酸,经过NCBI-CDD数据库注释后发现,除了motif7之外,其他均被注释为CYP450结构域。根据图2观察可以看出motif之间的排列具有一定的规律性,在所鉴定的68个二倍体紫苏CYP71基因中均存在motif7-motif2-motif3-motif8-motif5-motif6-motif4-motif10-motif1-motif9的相对稳定的结构,但是存在Pf1CYP71-29基因多了1个motif5,Pf1CYP71-31多了1个motif6,Pf1CYP71-38多了1个motif7,Pf1CYP71-34少了1个motif9,Pf1CYP71-55少了1个motif3的现象。这些结果表明二倍体紫苏CYP71基因家族成员在序列和功能上可能没有显著的差异,但是出现2~3个基因出现保守基序缺失或增加的现象,说明基因家族在进化过程中可能存在结构特征差异。10.13422/j.cnki.syfjx.20230315.F002图2二倍体紫苏CYP71蛋白的10个保守motifFig.2Ten conserved motifs of CYP71 proteins in diploid perilla frutescens为了进一步分析二倍体紫苏CYP71基因之间的进化关系,构建了二倍体紫苏CYP71的基因结构图,见图3。结构显示,二倍体紫苏CYP71家族绝大部分成员只有一个内含子且长短不一,只有Pf1CYP71-61有2个较短的内含子,而Pf1CYP71-31、Pf1CYP71-17、Pf1CYP71-8、Pf1CYP71-9、Pf1CYP71-42、Pf1CYP71-43、Pf1CYP71-55这些基因具有较长的内含子,除了Pf1CYP71-8含有最长的内含子之外,其他6个基因的内含子长度相同,而同一进化支上的基因结构也比较相似,比如Pf1CYP71-3、Pf1CYP71-6、Pf1CYP71-19、Pf1CYP71-20、Pf1CYP71-16、Pf1CYP71-15均含有2个外显子和1个内含子。10.13422/j.cnki.syfjx.20230315.F003图3二倍体紫苏CYP71家族基因结构和motif分析Fig.3Gene structure and motif analysis of CYP71 family in diploid perilla frutescens2.4 二倍体紫苏CYP71基因的KEGG和GO富集分析利用EGGNOG-mapper网站进行功能注释并通过TBtools软件进行富集分析和可视化作图,见增强出版附加材料。结果显示68个二倍体紫苏CYP71基因KEGG共富集到11个通路,包括CYP450酶、硫代葡萄糖苷生物合成、其他次级代谢物的生物合成、色氨酸代谢、倍半萜类和三萜类生物合成、异黄酮生物合成、Brite层次结构、萜类化合物和聚酮类化合物的代谢、氨基酸代谢等,其中富集到CYP450酶、蛋白家族代谢及Brite层次结构的基因最多各有36个,而富集到氨基酸代谢的基因最少只有6个。在通过TBtools对GO富集分析结果进行可视化作图时,68个CYP71基因共注释到114个类别(GO Terms),其中包含5项分子功能、11项细胞组分及98项生物过程,设置显示P值(即显著性,P=1-∑i=0m-1MiN-Mn-iNn,N为所有Unigene中具有GO注释的基因数目,n为N中差异表达基因的数目,M为所有Unigene中注释为某特定GO Term的基因数目,m为注释为某特定GO Term的差异表达基因数目,通常以Pvalue≤0.05为阈值,满足此条件的GO Term即为差异表达基因中显著富集的GO Term)最低的10个GO Terms,得到结果如下,共注释到2条功能,分别是分子功能(Molecular function)和生物过程(Biological process)。分子功能主要包括氧化还原酶活性(oxidoreductase activity),作用于配对供体掺入或还原分子氧(acting on paired donors,with incorporation or reduction of molecular oxygen),NAD(P)H作为一供体,掺入一个氧原子[NAD(P)H as one donor,and incorporation of one atom of oxygen],及单加氧酶活性(monooxygenase activity)。生物过程主要包括吲哚硫代葡萄糖苷生物合成过程(indole glucosinolate biosynthetic process),硫代葡萄糖苷生物合成过程(glucosinolate biosynthetic process), 糖苷酸生物合成过程(glycosinolate biosynthetic process),次级代谢过程(secondary metabolic process),氧化还原过程(obsolete oxidation-reduction process)及细胞壁增厚的防御反应(defense response by cell wall thickening)其中富集到次级代谢过程的基因最多,有35个,富集到4个分子功能和氧化还原过程的基因各有29个,而富集到剩下的4个生物过程基因最少,各有9个。2.5 二倍体紫苏CYP71家族成员的染色体定位和共线性分析二倍体紫苏CYP71基因家族68个基因不均匀的分布在34条染色体上,见图4。从图中可以看出,二倍体紫苏CYP71基因的数量和染色体的长度之间没有必然的联系,每条染色体上排列的基因数目差别较大,大部分染色体上只含有1~2个基因,SDAM02000001.1、SDAM02000072.1和SDAM02002215.1三条染色体上的CYP71基因数目最多,均含有6个基因,且这3条染色体上均出现基因成簇排列的现象,比如SDAM02000072.1染色体上的Pf1CYP71-23、Pf1CYP71-24、Pf1CYP71-25、Pf1CYP71-26、Pf1CYP71-27、Pf1CYP71-28就聚为一簇。此外在同一条染色体上出现了多基因串联重复现象,例如SDAM02000001.1染色体上的Pf1CYP71-4、Pf1CYP71-5、Pf1CYP71-6基因,SDAM02000779.1染色体上的Pf1CYP71-38、Pf1CYP71-39基因,SDAM02005225.1染色体上的Pf1CYP71-60、Pf1CYP71-61基因等。10.13422/j.cnki.syfjx.20230315.F004图4二倍体紫苏CYP71家族成员的染色体定位Fig.4Chromosome location of CYP71 family members of diploid perilla frutescens为了进一步研究二倍体紫苏CYP71基因家族的系统发育机制,探究二倍体紫苏和拟南芥CYP71基因家族成员的共线性关系,构建了二者的同源比较图谱,并通过TBtools软件进行了可视化分析,结果显示有2个二倍体紫苏CYP71基因与拟南芥之间存在共线性关系,即二倍体紫苏和拟南芥间共有两对同源基因,分别为Pf1CYP71-26/At-3和Pf1CYP71-52/At-4。见图5。10.13422/j.cnki.syfjx.20230315.F005图5二倍体紫苏(下)和拟南芥(上)的共线性分析Fig.5Collinearity analysis of diploid perilla frutescens (bottom) and Arabidopsis thaliana (top)2.6 二倍体紫苏CYP71基因家族顺式作用元件预测选取二倍体紫苏CYP71基因上游2 kb的序列进行CYP71基因家族成员顺式作用元件的预测,顺式作用元件能够调控基因表达,进而反映出基因功能。二倍体紫苏CYP71基因家族成员的顺式作用元件预测结果显示,共预测到21类顺式作用元件,包括创伤响应元件、光响应元件、脱落酸响应元件、赤霉素响应元件、茉莉酸甲酯响应元件、水杨酸响应元件、厌氧诱导元件、玉米醇溶蛋白代谢调控元件、抗病和胁迫响应元件、干旱诱导元件、昼夜节律调控、分生组织表达、生长素反应性、类黄酮生物合成基因调控元件、低温响应元件、缺氧特异性诱导响应元件、细胞周期调控、胚乳表达、种子特异性调节等,其中参与光响应和茉莉酸甲酯响应的顺式作用元件最多,分别为201和212个,在所有的二倍体紫苏CYP71基因中均有涉及。其次预测到的厌氧诱导元件有96个,脱落酸响应元件有156个,低温响应元件有54个,而预测到的创伤响应元件、种子特异性调节元件、类黄酮生物合成基因调控元件、细胞周期调控元件及缺氧特异性响应元件数目最少,分别为7、6、9、3、5个。这些说明了CYP71基因家族不同成员不仅能广泛的参与二倍体紫苏的生长发育过程包括激素代谢、生长调控、信号转导等,而且还能响应生物与非生物胁迫,比如低温响应、抗病和胁迫响应、干旱诱导、缺氧特异性诱导等。见增强出版附加材料。2.7 二倍体紫苏CYP71基因互作网络分析根据二倍体紫苏和拟南芥CYP71基因家族的共线性分析得到了二者的同源序列,分别是Pf1CYP71-26和Pf1CYP71-52,将这2个基因的蛋白序列提交到STRING网站进行蛋白质-蛋白质相互作用(PPI)网络预测,物种选择拟南芥(Arabidopsis thaliana),结果显示和二倍体紫苏Pf1CYP71-26和Pf1CYP71-52两个基因的蛋白序列相似度最高的是CYP71A26和CYP71B34,使用Cytoscape软件进行优化和可视化,见增强出版附加材料,形状大小代表互作强度的强弱,故从图中可以看出与CYP71A26蛋白互作强度较高的是CYP51G1、SQS1、BAS、ERG28及LUP2蛋白,这些蛋白基本上是萜类化合物家族蛋白[24]、萜烯环化酶[25]或者是参与甾醇生物合成的关键酶[26]。而与CYP71B34蛋白互作强度较高的是PUM6、MSL6、FLA17及VEP1,这些蛋白能够与NAD(P)H结合[27]、参与细胞表面黏附[28]、调节mRNA稳定性[29]和翻译及作为通道压力响应蛋白[30]。3 讨论本研究从二倍体紫苏PC99全基因组中鉴定出了68个CYP71基因,这些基因不均匀的分布在二倍体紫苏34条染色体上,出现了基因成簇排列和多基因串联重复的现象,这些可能是基因复制[31]导致的。这些基因编码的氨基酸长度在481~530 aa,等电点、总平均亲水性及不稳定系数等理化性质存在差异,亚细胞定位预测显示这些基因表达的蛋白在细胞核、细胞膜、细胞质、叶绿体及线粒体中不均匀的分布,其中只有Pf1CYP71-62蛋白的亚细胞定位预测在细胞核,这些表明CYP71基因家族可能更多的参与二倍体紫苏次生代谢产物的调控中,极少的参与二倍体紫苏的遗传表达,这也与CYP450酶在植物中通常与内质网、线粒体、质体等细胞器等膜性细胞器结合在一起,参与多种次生代谢产物等的生物合成相符合。系统发育分析表明,根据拟南芥CYP71基因家族可以将二倍体紫苏CYP71基因家族划分成CYP71A、CYP71B两个亚家族,并且包含一些归属于不同家族的CYP基因。基因结构和保守基序分析表明同一分支的成员具有较高的保守性,二倍体紫苏CYP71基因家族成员几乎都含有2~3个外显子和1~2个长短不一的内含子,而且都含有规律排列的10个保守基序,只有5个基因存在保守基序增加或缺失的现象,这可能是基因家族在进化过程中结构发生了改变。顺式作用元件分析表明,二倍体紫苏CYP71基因家族存在多种功能的顺式作用元件,其中参与光响应、创伤响应、分生组织表达、昼夜节律调控、细胞周期调控、胚乳表达、种子特异性调节及玉米醇溶蛋白代谢调控的顺式元件说明CYP71基因家族广泛参与二倍体紫苏的生长发育过程,在二倍体紫苏的种子萌发和茎的发育过程占据重要作用,其中的赤霉素、脱落酸、水杨酸及茉莉酸甲酯响应元件说明CYP71基因家族也参与二倍体紫苏植物激素的调控,表明这些激素可能在二倍体紫苏的生长及代谢调控中发挥重要作用,剩下的厌氧诱导、干旱诱导、抗病和胁迫响应及低温响应、类黄酮生物合成基因调控顺式作用元件说明二倍体紫苏CYP71基因家族成员在应对生物或者非生物胁迫方面的作用不可忽视。根据二倍体紫苏CYP71基因家族的KEGG通路富集分析和GO功能富集分析可以得出,CYP71基因主要参与萜类化合物包括倍半萜类和三萜类化合物及异黄酮类化合物的生物合成、氨基酸代谢过程及其他次级代谢物的生物合成过程中,主要功能包括具有氧化还原酶活性或者单加氧酶活性、作为配对供体提供或者掺入分子氧等。根据二倍体紫苏和拟南芥共线性分析得到的两个同源蛋白序列进行PPI网络分析表明二倍体紫苏CYP71基因家族蛋白与萜类化合物家族蛋白、萜烯环化酶或者是参与甾醇生物合成的关键酶密不可分,并且有一部分蛋白能够参与到与NAD(P)H结合或者调节mRNA稳定性等,这些都进一步说明研究CYP71基因家族对紫苏单萜类化合物的生物合成具有至关重要的作用。基于已发表的药用植物基因组,通过对植物不同时期或者不同药用部位进行转录组、蛋白质组及代谢组等多组学分析,从而挖掘出调控药用植物有效成分如萜类物质的关键基因,并对其关键基因进行解析和功能性研究,对研究药用植物有效成分的生物合成途径和提高药用植物资源利用率促进其开发至关重要。SONG等[32]通过对菊花进行基因组学研究,初步鉴定出了菊花中参与类黄酮和萜类生物合成的基因;JIANG等[33]通过分析不同品种紫苏叶片的转录组和代谢组学数据,共鉴定出编码15种酶的77个类黄酮生物合成的候选基因。但是目前紫苏挥发油的合成调控机制和关键基因仍然没有得到很好的鉴定和解析,所以研究紫苏二倍体CYP71基因家族对于开展接下来的紫苏多组学分析并进一步挖掘其关键基因具有重要的意义。综上所述,本研究基于二倍体紫苏PC99的全基因组数据,筛选、比对、鉴定到了68个CYP71基因,在对这68个CYP71基因进行命名的基础上,开展了全面的生物信息学分析,包括基因家族的理化性质、系统发育关系、基因结构、保守结构域、染色体定位、共线性分析及KEGG、GO富集分析和蛋白互作网络预测、顺式作用元件预测等,为初步了解二倍体紫苏CYP71基因家族的基因结构、功能分类及蛋白质作用奠定了基础,并为进一步结合转录组、代谢组学技术研究紫苏中单萜类化合物的生物合成途径和定向培育优良紫苏品种提供数据支持。
使用Chrome浏览器效果最佳,继续浏览,你可能不会看到最佳的展示效果,
确定继续浏览么?
复制成功,请在其他浏览器进行阅读
复制地址链接在其他浏览器打开
继续浏览