油茶(Camellia oleifera Abel)是中国特有的木本食用油料树种,与油橄榄(Olea europaea L.)、油棕(Elaeis guineensis Jacq.)和椰子(Cocos nucifera L.)并称为世界四大木本油料植物,与油桐(Vernicia fordii)、乌桕(Sapium sebiferum L.)和核桃(Juglans regia L.)并称为中国四大木本油料植物。茶油含有90%以上的不饱和脂肪酸,主要成分油酸和亚油酸是人体不可或缺但自身不能合成的多不饱和脂肪酸,具有调节血压和抗氧化的作用,还能有效地预防高血压、冠心病等疾病,是世界上最优质的食用植物油之
在高等植物中,脂肪酸从头生物合成主要发生在质体中。乙酰-CoA 羧化酶(ACC,acetyl-CoA carboxylase)作为脂肪酸生物合成的起始酶,将乙酰-CoA羧化成丙二酸单酰-CoA,丙二酸单酰CoA-ACP 转酰基酶(MCAT,malonyl-CoA∶ACP transacylase)催化丙二酸单酰-CoA生成丙二酸单酰- ACP。丙二酸单酰-ACP在酮脂酰-ACP合酶(KAS,ketoacyl-ACP synthase)和酮脂酰-ACP还原酶(KAR,ketoacyl-ACP reductase)作用下生成羟丁醇-ACP和NAD
研究材料采集于湖北省黄冈市黄梅县湖北省林业科学研究院油茶林基地(115°59′E,30°9′N),试验材料 ‘长林40号’作为湖北省长林系列主栽品种,具有长势旺、抗性强,高产、稳产且极少染病的特点。2023年7月7日、8月14日和10月3日,分别采集‘长林40号’油茶植株不同方向树冠上中下3层各5个油茶果混合,设置3个重复,将其分别命名为Em0707、Em0814和Em1003,剥去果皮和种壳,液氮速冻,保存于-80 ℃中用于转录组测序、含油量和脂肪酸组分分析。
剥去油茶果实果皮和种子种壳,采集3个时期的油茶种仁,送往北京贝瑞和康生物技术有限公司进行RNA提取、文库构建与质检和测序工作。FASTq格式的原始数据使用Perl脚本进行处理以确定数据的质量,包括GC含量、Q20比例和Q30比例。过滤并消除低质量数据,过滤后的数据用于后续分析。从二倍体油茶数据库下载基因模型注释文件(https://github.com/Hengfu-Yin/CON_genome_data)作为参考基因组。HTSeq v0.9.
使用Cluster Profler R软件(http:// www. bioco nduct or. org/packa ges/relea se/bioc/html/clust erPro fler. html)进行GO功能富集分析,利用二倍体油茶数据库(https://github.com/Hengfu-Yin/CON_genome_ data)对差异表达基因进行功能注释,qvalue<0.05作为样本中GO功能显著富集的筛选标准。通过KOBAS 2.0软件(http://bioinfo.org/kobas)对KEGG富集通路进行分析,以拟南芥(Arabidopsis thaliana)TAIR10版本数据库(https://www.arabidopsis.org/)对差异表达基因进行近源Blast和富集通路注释。以qvalue<0.05作为KEGG通路显著富集的阈值, 满足上述条件的通路定义为显著富集,挑选qvalue值富集程度排名前20的通路统计作图。使用OmicShare Tools软件(https://www.omicshare.com/tools/home/report/reporticabg.html)绘制基因表达量热图。
使用Trizol试剂提取不同发育时期种仁总RNA,利用NCBI Primer-BLAST在线软件设计特异性引物(
引物名称 Primer name | 正向引物序列(5′-3′) Forward primer sequence (5′-3′) | 反向引物序列(5′-3′) Reverse primer sequence (5′-3′) |
试剂配制:5%(体积百分比)浓硫酸/甲醇溶液;5 mg/mL碳十七脂肪酸甲酯/石油醚(90~120 ℃)溶液;0.9%(质量百分比)NaCl/水溶液。
对不同发育时期的种仁进行清洁、干燥和研磨。通过0.5 mm筛过筛后,称重1 g样品粉末转移至提取瓶中,加入 5 mg/mL碳十七脂肪酸甲酯/石油醚溶液100 μL,再加入5%浓硫酸/甲醇溶液2 mL,甲苯300 μL。用压盖器将顶空瓶用带聚四氟乙烯垫的铝盖封好,将上述混合物轻微晃动混匀,然后于恒温水浴锅中95 ℃水浴1.5 h提取脂肪酸;提取结束后取出冷却至室温,加入0.9% NaCl 溶液2 mL,稍微振荡,用1 mL正己烷萃取,离心(5000 r/min,5 min)分层,取上清于上样瓶中进行气相色谱分析。气相色谱仪的工作条件:FID氢火焰离子化检测器,DB-FastFAME色谱柱,进样口温度250 ℃,分流比20∶1,检测器温度260 ℃,色谱柱初温80 ℃,保持0.5 min, 以40 ℃/min程序升温至165 ℃,保持1 min,以4 ℃/min程序升温至230 ℃,并在此温度下维持6 min。油脂含量=(S1/S2)×N/M,S1为总峰面积,S2为内标峰面积,N为内标用量,M为样本质量。利用SPSS 11.5软件对数据进行相关性分析。
对9个文库(3个发育时期×3个生物重复) 测序的原始数据进一步精细过滤,共产生416635122个过滤后的数据,过滤后的碱基数共62495268300 bp,GC含量的平均值为46.26%,Q20和Q30平均比例分别为96.81%和92.15% (
样品 Sample | 过滤后数据 Clean reads | 过滤后碱基数(bp) Clean bases | GC含量(%) GC content | Q20比例(%) Q20 ratio | Q30比例(%) Q30 ratio |
Em0707-1 | 39335052 | 5900257800 | 45.69 | 96.86 | 92.17 |
Em0707-2 | 50018672 | 7502800800 | 45.74 | 96.74 | 91.84 |
Em0707-3 | 49993570 | 7499035500 | 45.71 | 96.76 | 92.05 |
Em0814-1 | 45610422 | 6841563300 | 45.22 | 96.98 | 92.50 |
Em0814-2 | 43330344 | 6499551600 | 45.30 | 96.96 | 92.43 |
Em0814-3 | 48184132 | 7227619800 | 45.31 | 96.86 | 92.28 |
Em1003-1 | 48376708 | 7256506200 | 47.73 | 96.72 | 91.99 |
Em1003-2 | 45230518 | 6784577700 | 47.70 | 96.94 | 92.48 |
Em1003-3 | 46555704 | 6983355600 | 47.92 | 96.46 | 91.65 |
总计Total | 416635122 | 62495268300 | 46.26 | 96.81 | 92.15 |
Em0707、Em0814和Em1003分别表示2023年7月7日、8月14日和10月3日油茶种仁样品; 1、2和3分别表示3个生物学重复
Em0707, Em0814 and Em1003 represent Camellia oleifera kernel samples from July 7th, August 14th, and October 3rd, 2023; 1, 2 and 3 represent three biological replicates, respectively

图1 样本之间皮尔逊相关系数热图和主成分分析
Fig. 1 Heat map of Pearson correlation coefficient and principal component analysis between samples
A: Heat map of Pearson correlation coefficient between samples; B: Principal component analysis between samples
利用DESeq软件分析差异表达基因显著性,分析参数为|log2 (Fold Change)|≥2且qvalue<0.05。3个不同发育时期种仁中,共获得17772个差异表达基因,其中,上调表达的基因有11006个(61.93%),下调表达的基因有6766个(38.07%)。各时期上调表达的差异表达基因数量均高于下调表达的差异表达基因数量。与Em0707vsEm0814和Em0814vsEm1003相比,Em0707vsEm1003中差异表达基因数量最多(

图2 差异表达基因的数量和分布
Fig. 2 The number and distribution of differentially expressed genes
A: The number of differentially expressed genes that were up-regulated or down-regulated in the three seed kernel development stages; B: Differentially expressed genes overlapping in different seed kernel development stages or unique to each developmental stage, vs represents the latter relative to the former
以qvalue<0.05为筛选标准,对3个比较组共有的差异表达基因和每个比较组特有的差异表达基因进行GO富集分析。3个比较组共有的1302个差异表达基因富集于195个GO条目,选取富集最显著的20条GO条目进行分析,结果显示,生物过程方面主要富集半纤维素代谢过程(Hemicellulose metabolic process)、木聚糖代谢过程(Xylan metabolic process)、细胞壁大分子代谢过程(Cell wall macromolecule metabolic process)、细胞壁多糖代谢过程(Cell wall polysaccharide metabolic process)和次生代谢过程(Secondary metabolic process)等代谢过程;细胞组分方面主要富集于外部封装结构(External encapsulating structure)、植物型细胞壁(Plant-type cell wall)、细胞壁(Cell wall)、单层包围脂质储存体(Monolayer-surrounded lipid storage body)和质外体(Apoplast)等;分子功能主要富集在葡萄糖基转移酶(Glucosyltransferase activity)、转移酶活性(Transferase activity)、UDP葡糖基转移酶活性(UDP-glucosyltransferase activity)、木聚糖O-乙酰转移酶活性(Xylan O-acetyltransferase activity)和茉莉酰基-异亮氨酸-12-羟化酶活性(Jasmonoyl-isoleucine-12-hydroxylase activity)等催化活性方面 (

图3 种仁3个比较组共有差异表达基因的基因本体分类
Fig. 3 Gene ontology classification of common differentially expressed genes in three comparison groups of seed kernel
样品 Sample | GO类别 GO category | GO编号 GO number | 通路描述 Terms description | 基因数目 Number of genes | q值 q value |
Em0707vsEm0814 | 生物过程 | GO:0050896 | 刺激反应 | 209 | 0.0431 |
GO:0055046 | 刺激微配子发生 | 9 | 0.0431 | ||
GO:0090358 | 色氨酸代谢过程的正调控 | 4 | 0.0431 | ||
GO:0022410 | 昼夜节律/周期循环过程 | 2 | 0.0431 | ||
GO:0042745 | 昼夜节律/周期循环 | 2 | 0.0431 | ||
GO:0042749 | 昼夜节律/周期循环的调节 | 2 | 0.0431 | ||
Em0707vsEm0814 | 生物过程 | GO:0045187 | 昼夜节律/周期循环的调节 | 2 | 0.0431 |
GO:0050802 | 昼夜节律/周期循环 | 2 | 0.0431 | ||
GO:0033240 | 细胞胺代谢过程的正调控 | 4 | 0.0431 | ||
GO:0045764 | 细胞氨基酸代谢过程的正调控 | 4 | 0.0431 | ||
分子功能 | GO:0016594 | 甘氨酸结合 | 3 | 0.0243 | |
GO:0042165 | 神经递质结合 | 3 | 0.0243 | ||
GO:0033759 | 黄酮合酶活性 | 2 | 0.0243 | ||
GO:0034722 | γ-谷氨酰肽酶活性 | 3 | 0.0307 | ||
Em0707vsEm1003 | 分子功能 | GO:0004316 | 3-氧酰基-酰基载体蛋白还原酶 | 6 | 0.0079 |
Em0814vsEm1003 | 生物过程 | GO:0009725 | 响应激素 | 172 | 0.0005 |
GO:0050896 | 刺激反应 | 338 | 0.0005 | ||
GO:0009719 | 内源性刺激反应 | 174 | 0.0005 | ||
GO:0010033 | 有机物反应 | 198 | 0.0006 | ||
GO:0006952 | 防御反应 | 136 | 0.0038 | ||
GO:0033993 | 脂质反应 | 109 | 0.0065 | ||
GO:1901700 | 含氧化合物反应 | 176 | 0.0074 | ||
GO:0042221 | 化学物质反应 | 234 | 0.01099 | ||
GO:0048825 | 子叶发育 | 18 | 0.0189 | ||
GO:0048366 | 叶片发育 | 56 | 0.0273 | ||
分子功能 | GO:0016298 | 脂肪酶活性 | 14 | 0.0437 | |
GO:0008477 | 嘌呤核苷酶活性 | 3 | 0.0437 | ||
GO:0038023 | 信号受体活性 | 29 | 0.0437 | ||
GO:0008782 | 腺苷同型半胱氨酸核苷酶活性 | 2 | 0.0437 | ||
GO:0008930 | 甲硫腺苷核苷酶活性 | 2 | 0.0437 | ||
GO:0050203 | 草酸辅酶A连接酶活性 | 2 | 0.0437 | ||
GO:0019199 | 跨膜受体蛋白激酶活性 | 20 | 0.0437 |

图4 三个时期共有差异表达基因的KEGG通路分析
Fig. 4 KEGG pathway analysis of common differentially expressed genes in three stages

图5 Em0707vsEm1003中差异表达基因的KEGG通路分析
Fig. 5 KEGG pathway analysis of differentially expressed genes in Em0707vsEm1003
脂肪酸生物合成和脂肪酸代谢通路分别有10个和12个差异表达基因,进一步分析发现,其中10个差异表达基因为2个通路中共有,2个差异表达基因为脂肪酸代谢特有。12个差异表达基因中,4个基因编码NADPH依赖性醛还原酶(NADPH-dependent aldehyde reductase, ALR1、ALR2、ALR3、ALR4);其余8个基因分别编码3-氧代酰基-ACP合酶3 (KASIII,3-oxoacyl-ACP synthase3)、短链脱氢酶(SDR,short-chain dehydrogenase)、烯醇辅酶A水合酶1 (ECH,enoyl-CoA hydratase)

图6 三个不同时期种仁中脂肪酸代谢相关差异表达基因表达网络
Fig. 6 Expression network of differentially expressed genes related to fatty acid metabolism in three different stages of seed kernels
The heatmap from left to right shows the stages of Em0707, Em0814 and Em1003, respectively

图7 脂肪酸代谢6个差异表达基因的相对表达分析
Fig. 7 Relative expression analysis of six differentially expressed genes in fatty acid metabolism
The histogram represents the relative expression levels of genes in qRT-PCR, line chart represents FPKM values in transcriptome
测定种仁含油量发现,3个时期含油量分别为31.29 mg/g、188.06 mg/g和307.69 mg/g,表明随着种仁的发育,含油量逐渐增加(
组分 Components | Em0707 | Em0814 | Em1003 |
含油量(mg/g)Oil content | 31.29 ± 6.04 | 188.06 ± 14.36 | 307.69 ± 9.24 |
棕榈酸(C16∶0)(%)Palmitic acid (C16∶0) | 19.16 ± 1.38 | 13.18 ± 1.08 | 9.23 ± 0.12 |
棕榈油酸(C16∶1)(%)Palmitoleic acid (C16∶1) | 0.32 ± 0.07 | 0.14 ± 0.04 | 0.12 ± 0.03 |
硬脂酸(C18∶0)(%)Stearic acid (C18∶0) | 1.09 ± 0.13 | 1.47 ± 0.32 | 1.88 ± 0.08 |
油酸(C18∶1n-9c)(%)Oleic acid (C18∶1n-9c) | 59.94 ± 1.39 | 71.72 ± 1.56 | 81.67 ± 1.39 |
亚油酸(C18∶2n-6c)(%)Linoleic acid (C18∶2n-6c) | 16.24 ± 1.53 | 12.45 ± 1.58 | 6.44 ± 0.28 |
α-亚麻酸(C18∶3n-3)(%)α-linolenic acid (C18∶3n-3) | 2.33 ± 0.20 | 0.71 ± 0.12 | 0.34 ± 0.11 |
花生烯酸(C20∶1)(%)Cis-11-Eicosenoicacid (C20∶1) | 0.92 ± 0.19 | 0.33 ± 0.07 | 0.32 ± 0.07 |
对脂肪酸代谢相关差异表达基因表达量、含油量和各脂肪酸组分比例进行相关性分析表明,所有基因表达量与种仁的含油量、硬脂酸和油酸均呈正相关,与其余脂肪酸组分均呈负相关。其中ACC、ECH、SAD、KASIII、PATE和KAT2基因与含油量呈极显著正相关(P< 0.001),ACC、KASIII、PATE、SAD和KAT2基因与油酸均呈极显著正相关(P<0.001);PATE、ACC、KASIII和KAT2基因与棕榈酸呈极显著负相关(P< 0.001)(

图8 油茶种仁脂肪酸代谢差异表达基因表达量、含油量和脂肪酸组分相关性
Fig. 8 Correlation between differentially expressed gene expression levels, oil content, and fatty acid composition in Camellia oleifera seed kernel
无标记表示相关不显著,*表示在P< 0.05水平上相关显著,**表示在P<0.01水平上相关显著,***表示在P<0.001水平上相关显著
Unmarked represents no significant correlation, * represents significant correlation at the P<0.05 level, ** represents significant correlation at the P<0.01 level, *** represents significant correlation at the P<0.001 level
