将以下sci论文生成一个科普视频:好的,这是您提供的论文《PANDORA-seq reveals human sperm sncRNA signature endowed with sperm quality assessment》的中文全文翻译: --- # **基因与疾病 (Genes & Diseases)** **PANDORA-seq揭示人类精子小非编码RNA特征及其在精子质量评估中的应用** --稿件草稿-- | 稿件编号: | GENDIS-D-25-00045R3 | |---|---| | 文章类型: | 全文文章 | | 关键词: | 男性生育力低下;PANDORA-seq;rsRNA;精子质量;tsRNA | | 通讯作者: | 张云芳 (Yunfang Zhang) 同济大学 中国 | | 第一作者: | 黄若凡 (Ruofan Huang) | | 作者顺序: | 黄若凡 (Ruofan Huang) | | | 杨依婷 (Yiting Yang) | | | 姜文林 (Wenlin Jiang) | | | 曹政 (Zheng Cao) | | | 石俊超 (Junchao Shi) | | | 张小欧 (Xiao-Ou Zhang) | | | 张云芳 (Yunfang Zhang) | **摘要:** 人类生育力低下的主要诱因之一是精液质量的持续下降,这导致了全球性的生育危机。超过一半的生育力低下男性患有弱精子症(AZS)和畸形精子症(TZS),其机制在很大程度上仍未知。传统的小RNA测序(smRNA-seq)主要针对miRNA,未能捕获更广泛的小非编码RNA(sncRNA)谱,包括丰富的转运RNA来源的小RNA(tsRNA)和核糖体RNA来源的小RNA(rsRNA)。这些sncRNA具有复杂的RNA修饰和非典型末端结构,阻碍了其精确分析。在这项前瞻性队列研究中,我们通过结合我们先进的全景RNA展示技术(通过克服RNA修饰阻断的测序,PANDORA-seq)与传统sncRNA测序,解决了这些局限性,首次生成了来自25名AZS、TZS或正常精子症(NZS)参与者的人类精子最全面的sncRNA图谱。PANDORA-seq显著提高了sncRNA的注释效率,并对tsRNA和rsRNA进行了更详细的表征,这些sncRNA与精子质量的关键临床指标密切相关,从而增进了我们对人类精子sncRNA组蓝图及其与男性生育力低下关联的理解。重要的是,结合Lasso回归的机器学习识别出特定的tsRNA/rsRNA特征作为高度有效的临床生物标志物(AUC ≥ 0.83),用于预测精子异常,相比基于世界卫生组织(WHO)的精液质量评估提供了显著改进,并为临床诊断提供了新的见解。 **反对审稿人:** **对审稿人的回复:** 由Aries Systems Corporation的Editorial Manager®和ProduXion Manager®提供支持 --- **尊敬的编辑:** 主题:稿件 GENDIS-D-25-00045R3 “PANDORA-seq揭示人类精子小非编码RNA特征及其在精子质量评估中的应用” 非常感谢您处理我们的稿件所做的努力,我们非常感谢审稿人2提出的宝贵建议,这些建议极大地改进了我们的稿件。 在本轮修订中,我们尽力根据审稿人2的宝贵建议广泛修订了引言和讨论部分。具体来说,我们重构了讨论部分的上下文,并仔细校对了整个稿件的英语语言。我们真诚希望本轮修订能够满足审稿人的要求并达到《基因与疾病》的出版标准。 我们已在重新提交系统中上传了修订后的稿件(包括正文、图表和补充材料)。与先前版本相比的更改已用红色文本标出。逐点回复也已在提交系统中提供。 我们衷心感谢这次修订机会以及您处理我们稿件所付出的努力。 此致, 张云芳 ______ 张云芳 教授 同济大学 生命科学与技术学院 上海市第一妇婴保健院 中国上海市杨浦区四平路1239号,200093 电话:+86-18810085579(办公室) 邮箱:zhangyunfang@tongji.edu.cn --- **PANDORA-seq揭示人类精子小非编码RNA特征及其在精子质量评估中的应用** 黄若凡\(^{a,1}\),杨依婷\(^{a,b,1}\),姜文林\(^{a}\),曹政\(^{a}\),石俊超\(^{c,***}\),张小欧\(^{a,**}\),张云芳\(^{a,*}\) \(^{a}\) 同济大学生命科学与技术学院,上海市第一妇婴保健院临床与转化研究中心,上海市信号转导与疾病研究重点实验室,干细胞研究中心前沿科学中心,上海 200092,中国。 \(^{b}\) 国家卫生健康委员会生殖调控重点实验室,上海市健康与疾病基因组学重点实验室,上海生物医药技术研究院(SIBPT),上海 200032,中国。 \(^{c}\) 中国科学院北京基因组研究所(国家生物信息中心),北京 100101,中国 * 通讯作者。 ** 通讯作者。同济大学生命科学与技术学院,上海,200092,中国。 *** 通讯作者。中国科学院北京基因组研究所(国家生物信息中心),北京,100101,中国。 邮箱地址:zhangyunfang@tongji.edu.cn (张云芳)。zhangxiaoou@tongji.edu.cn (张小欧)。shijc@big.ac.cn (石俊超)。 \(^{1}\) 这些作者对工作贡献相同。 **摘要** 人类生育力低下的主要诱因之一是精液质量的持续下降,这导致了全球性的生育危机。超过一半的生育力低下男性患有弱精子症(AZS)和畸形精子症(TZS),其机制在很大程度上仍未知。传统的小RNA测序(smRNA-seq)主要针对miRNA,未能捕获更广泛的小非编码RNA(sncRNA)谱,包括丰富的转运RNA来源的小RNA(tsRNA)和核糖体RNA来源的小RNA(rsRNA)。这些sncRNA具有复杂的RNA修饰和非典型末端结构,阻碍了其精确分析。在这项前瞻性队列研究中,我们通过结合我们先进的全景RNA展示技术(通过克服RNA修饰阻断的测序,PANDORA-seq)与传统sncRNA测序,解决了这些局限性,首次生成了来自25名AZS、TZS或正常精子症(NZS)参与者的人类精子最全面的sncRNA图谱。PANDORA-seq显著提高了sncRNA的注释效率,并对tsRNA和rsRNA进行了更详细的表征,这些sncRNA与精子质量的关键临床指标密切相关,从而增进了我们对人类精子sncRNA组蓝图及其与男性生育力低下关联的理解。重要的是,结合Lasso回归的机器学习识别出特定的tsRNA/rsRNA特征作为高度有效的临床生物标志物(AUC \(\geq\) 0.83),用于预测精子异常,相比基于世界卫生组织(WHO)的精液质量评估提供了显著改进,并为临床诊断提供了新的见解。 **关键词:** 男性生育力低下,PANDORA-seq,rsRNA,精子质量,tsRNA --- **稿件正文** **1 引言** 生育率的下降已成为一个紧迫的全球性问题,在发达国家尤为普遍,并且在一些发展中国家也日益明显[1]。这一趋势是由多种因素的复杂相互作用驱动的,包括不断变化的社会价值观、环境条件以及生活方式等心理因素[2]。然而,在积极寻求生育的夫妇中,不孕率仍然显著高企,影响约15-20%的人群。值得注意的是,男性相关因素占这些病例的一半[3, 4]。弱精子症(Asthenozoospermia, AZS)和畸形精子症(Teratozoospermia, TZS)是男性生育力低下的两种主要临床表现,分别以精子活力降低和形态异常为特征[5]。然而,目前的临床精液分析提供的分子病因学信息极少[6]。因此,对男性生育力的分子生物标志物进行系统研究将能更精确地评估精子质量,并为精子参数异常的分子基础提供机制上的见解。 小非编码RNA(sncRNA)在成熟精子中高度丰富,并在调节精子发生和精子功能中发挥关键作用[7-20]。例如,Piwi相互作用RNA(piRNA)相关蛋白的缺失通过损害piRNA的生物合成导致男性不育[21]。此外,高脂饮食喂养小鼠精子中的tRNA来源小RNA(tsRNA)参与将父系获得性代谢疾病传递给后代的功能调节[14, 17]。与众所周知的微RNA(miRNA)不同,tsRNA和rRNA来源小RNA(rsRNA)的生物合成涉及特定核糖核酸酶对其tRNA和rRNA前体的切割[22-25]。因此,根据被Dicer、Angiogenin和其他RNase切割的位置,tsRNA可分为5' tsRNA、内部tsRNA(inner' tsRNA)和3' tsRNA[22-24]。同样,rsRNA根据其来源的不同rRNA(如5S、5.8S、18S和28S rsRNA)进行分类[25, 26]。如前所述,tsRNA在多种生物过程中表现出多方面的调节能力,可在多个水平调控基因表达,包括转录[27, 28]、转录后[29]和翻译[30-32]。此外,一些tsRNA还可以通过多种机制调节逆转录转座子的活性[33]。相反,rsRNA的功能和调控机制在很大程度上未知,只有有限的证据表明其参与免疫反应[34, 35]。因此,各种sncRNA,特别是rsRNA在成熟精子中的功能意义在很大程度上仍然是个谜。 研究精子中sncRNA的主要挑战在于构建sncRNA文库,这需要高效的接头连接和将RNA稳健地逆转录成互补DNA(cDNA),而这一过程通常受到RNA修饰的阻碍[26]。例如,3'末端修饰(包括3'-P和2',3'-cP)会阻碍接头连接,而RNA甲基化修饰,包括m1A、m3C、m1G和m2G,会阻碍有效的逆转录[36, 37]。因此,后续测序通常无法准确反映sncRNA的实际丰度和分布,特别是对于那些具有多样化和丰富修饰的sncRNA,如rsRNA和tsRNA[26, 38-40]。在本研究中,我们采用我们先前建立的sncRNA测序方法——全景RNA展示技术(通过克服RNA修饰阻断的测序,PANDORA-seq),全面分析了来自AZS、TZS和健康对照样本的人类精子中的sncRNA谱。我们对小RNA应用了两步酶处理... **2 材料与方法** **伦理委员会批准和知情同意** 所有实验的实施均遵守并按照世界医学协会《赫尔辛基宣言》中的相关规定进行。本文描述的研究获得了上海计划生育科学研究所(SIPPR;中国上海;批准号:PJ2019-24)医学伦理委员会的一致批准,每位参与者均提供了签署的知情同意书。 **参与者招募和人类精液样本的收集/分析** 本研究共招募了25名在中山医院(中国上海)生殖医学中心接受精液分析的男性(年龄24-34岁)。所有参与者被要求在样本采集前禁欲2至7天。通过手淫收集精液样本,在37°C液化30分钟,随后进行精液分析。每个精液样本至少分析200个精子的参数以生成最终的精液分析报告。本研究中包含的所有精液样本白细胞检测均为阴性。根据世界卫生组织(2010年,第五版)关于精子活力和形态参数的指南,本研究中的精液样本被分为正常精子症(NZS,作为健康对照;n=9)、弱精子症(AZS;n=9)和畸形精子症(TZS;n=7)组。分类标准如下:NZS具有大于4%的正常精子形态和大于32%的前向运动精子率;AZS具有大于4%的正常精子形态但前向运动精子率小于32%;TZS具有小于4%的正常精子形态。 **从精液样本中纯化精子** 在本研究中,我们实施体细胞裂解以确保纯化获得高效的人类精子RNA样本。首先,将2 mL液化精液与磷酸盐缓冲盐水(PBS)以1:1的体积比混合,200g离心5分钟,弃去上清液。随后,用1 mL PBS重悬沉淀,并重复离心和重悬步骤。然后,将悬浮液在冰上通过70 µm细胞滤网(Corning, Harrodsburg, KY, USA)过滤。将混合物与4°C预冷的细胞裂解液(由0.1% SDS、0.5% Triton X-100溶解于无菌0.1% DEPC水中组成)以1:5的体积比(精子悬浮液:细胞裂解液)混合。轻轻颠倒离心管确保充分混合后,将混合物在冰上静置30分钟。随后,600g离心5分钟,弃去上清液。使用1 mL PBS重复离心和弃上清步骤,最终沉淀用1 mL PBS重悬。接着,在4°C下以5000 rpm离心5分钟,在管底得到可见的纯白色沉淀。为了最大限度地去除上清液中来源于细胞裂解的体细胞RNA成分,小心吸弃上清液。最后,向每个1.5 mL离心管中的白色沉淀加入1 mL Trizol试剂(Invitrogen, Waltham, MA, USA)用于RNA提取。 **精子RNA提取** 使用1 mL注射器(0.45×15mm,常规壁短斜面(RWSB),常州悦康医疗器械有限公司,中国)反复抽吸以分散并彻底混匀溶液,确保沉淀能顺利通过注射器针头。随后,将混合物置于冰上2-3小时,然后加入0.2 mL氯仿并剧烈震荡,接着在室温下孵育2-3分钟。混合物在4°C下以13000 rpm离心15分钟。小心收集上层水相至新的1.5 mL离心管中,加入600 µl异丙醇和1-2 µl糖原(Invitrogen Thermo Fisher AM9510)。轻轻颠倒EP管,混合物在-20°C缓慢沉淀过夜。随后在4°C下以13000 rpm离心20分钟。沉淀用75%乙醇洗涤,并在4°C下以13000 rpm离心10分钟。沉淀风干后,用7.5-10 µl无RNase水重悬作为总RNA,用于后续的逆转录、PANDORA-seq和Northern blot实验。 **精子RNA逆转录和纯度检测** RNA逆转录按照Takara的说明书(Iwate, Japan, 目录号: PR047-A)进行。简言之,RNA样本在42°C下用gDNA Eraser处理2分钟,在冰上制备反应混合物,随后在37°C下逆转录15分钟。然后在85°C下将RNA转化为cDNA 5秒。 进行RT-PCR以评估体细胞裂解效率,通过测量体细胞特异性基因(包括钙粘蛋白-1 (CDH1)、钙粘蛋白-2 (CDH2)、CD4)和生殖细胞特异性基因KIT的mRNA表达水平。此外,使用精子特异性基因鱼精蛋白-2 (PRM2)引物进行精子纯度评估。PCR产物在1.5%琼脂糖凝胶上分析,并使用Tanon凝胶成像系统(mini space 1000, Tanon, 上海, 中国)成像。引物序列和聚合酶链式反应(PCR)程序详见表S1。 **sncRNA分离和PANDORA-seq** 我们使用PAGE凝胶分离sncRNA,如前所述[26]。简言之,总RNA用RNA上样染料(New England Biolabs, B0363S)在95°C变性5分钟,通过15%变性尿素-PAGE分离,并用SYBR Gold(Thermo Fisher, S11494)染色。根据RNA ladder(New England Biolabs, N0364S)(Takara, 3416)切取15-50个核苷酸的条带并提取RNA。对于标准RNA-seq,可以直接使用Vazyme NR801试剂盒进行小RNA文库构建和测序。对于PANDORA-seq方法,涉及以下步骤:将RNA与T4PNK在37°C孵育20分钟,然后用Alkb在37°C处理产物30分钟。这些酶反应溶液见表S2。将Trizol LS以3:1的体积比(Trizol LS:反应混合物)加入反应混合物中。随后,根据我们先前描述的方法提取RNA。使用VAHTS Small RNA Library Prep Kit for Illumina (Vazyme, NR801)构建专门针对15-50 nt RNA片段的小RNA文库,随后由Sequanta Technologies(中国上海)进行测序。 **小RNA测序数据处理** 使用SPORTS软件(版本1.1)处理并注释原始测序读段,允许最多一个错配(参数:-M 1)[40]。预处理后,保留长度在18至45个核苷酸之间的读段用于进一步分析。简言之,读段依次比对到人类参考基因组(GRCh38/hg38)和以下非编码RNA数据集:来自NCBI的rRNA和YRNA,来自GtRNAdb的基因组tRNA,来自mitotRNAdb的线粒体tRNA,来自miRbase的miRNA,来自Ensembl ncRNA数据库和Rfam的非编码RNA,以及来自piRBase的piRNA,以估算单个sncRNA的表达。在至少50%的样本中至少有一个读段的sncRNA转录本被保留为表达的snRNA用于进一步分析。除非另有说明,sncRNA转录本表达量被标准化为每百万比对读段值(RPM)。对于tsRNA和rsRNA,sncRNA转录本根据其各自来源的亲本RNA进一步分类为各个亚组。 **差异表达sncRNA的鉴定** 使用DESeq2包(v1.34.0)鉴定差异表达的sncRNA(DE-sncRNA)。我们比较了两组之间的sncRNA表达谱:AZS vs NZS 和 TZS vs NZS。DE-sncRNA的显著性定义为调整后p值阈值≤ 0.05且绝对log2倍数变化≥ 1.5。 **Northern blot和RT-PCR验证** 对于Northern blot,总RNA在95°C变性5分钟。每个样本加载1µl,通过15%尿素-PAGE分离并用SYBR Gold染色。UV成像后,我们调整每个样本的上样量进行标准化,并重复凝胶电泳、SYBR Gold染色和UV成像。然后将凝胶转移到Nytran SuperCharge膜(Schleicher and Schuell, 32-10416296)上,并用0.12 J的UV交联。随后,将膜在42°C的DIG预杂交液(Roche: DIG Easy Hyb, 11603558001)中预杂交30分钟。然后将膜在42°C与合成的DIG标记的寡核苷酸探针(终浓度16 nM)孵育过夜(12-16小时)。探针序列见表S3。过夜杂交后,膜在42°C下用低严格度缓冲液(2 × SSC含0.1% (w/v) SDS)洗涤两次,每次15分钟,然后用高严格度缓冲液(0.1 × SSC含0.1% (w/v) SDS)洗涤两次,每次5分钟,最后在室温下用洗涤缓冲液(1 × SSC)漂洗10分钟。将膜转移到1 × 封闭缓冲液(Roche, 11096176001)中,室温孵育3小时。随后,将DIG抗体(Roche: Anti-Digoxigenin-AP Fab片段, 11093274910)以1:10,000的比例加入封闭缓冲液中,室温下再孵育半小时。然后将膜在DIG洗涤缓冲液(1 × 马来酸缓冲液, 0.3% Tween-20)中洗涤4次,每次15分钟,在DIG检测缓冲液(0.1 M Tris-HCl, 0.1 M NaCl, pH 9.5)中漂洗5分钟,并在避光条件下与CSPD即用型试剂(Roche, 11755633001)在37°C孵育15分钟,然后使用Tanon成像系统(上海,中国)成像。 对于RT-PCR,总RNA按前述方法依次用T4PNK和Alkb处理。然后,按照Takara的说明书(Iwate, Japan, 目录号: PR047-A),进行逆转录获得cDNA。使用PCR进行sncRNA的验证。程序详见表S1,使用的引物见表S3。 **sncRNA类型与临床精液参数之间的相关性分析** 计算Spearman相关系数以评估各种sncRNA类型与精子质量两个关键方面(活力和形态)之间的关系。活力参数包括不动(IM)、前向运动(PR)和非前向运动(NP)精子的百分比。形态参数评估精子头部/尾部形态异常(Abnormal)、头部完整(Total_head)、颈部完整(Total_neck)、胞质小滴(CD)、头部形状指数(TZI)和严格形态指数(SDI)的百分比。此外,对于选定的sncRNA亚类,我们使用R包中的lm函数进行线性回归,以进一步研究其表达水平与特定临床指标之间的关联。 **利用机器学习开发sncRNA特征评分** 为了识别用于男性生育力低下诊断的稳健且信息丰富的sncRNA特征,我们采用了机器学习方法。首先,我们通过关注差异表达的sncRNA(p值 < 0.05)、最小平均表达水平为10 RPM(每百万读段)以及与精液参数具有强相关系数(r > 0.5)来筛选候选特征。接下来,我们利用R包中通过cv.glmnet函数实现的LASSO回归模型进行特征选择和模型构建。LASSO方法收缩回归系数,有效去除对模型贡献最小的特征并防止过拟合。采用交叉验证来优化模型并确定最优的lambda参数。最终模型中具有非零系数的特征被认为是该特征的核心sncRNA。sncRNA特征评分通过将选定sncRNA的表达值与其LASSO回归系数值加权来构建。最后,为了评估我们模型的性能和泛化能力,我们采用随机森林算法比较sncRNA特征评分、单个sncRNA和临床指标在区分不同疾病状态时的特征重要性和ROC曲线。 **统计分析** 使用Student’s t检验评估正态分布数据的统计显著性,使用Wilcoxon秩和检验评估非参数数据。使用R(版本4.1)中的pheatmap函数生成tsRNA亚类分析的热图,数据经过log2转换。Spearman相关系数用于评估tsRNA类别之间的相关性。 **3 结果** **PANDORA-seq增强了对人类精子中sncRNA的检测** 为了揭示人类精子中的sncRNA谱,使用纯化的人类精子以避免体细胞污染(图S1A)。对来自9个NZS样本的人类精子RNA进行了PANDORA-seq和传统小RNA测序。与传统小RNA测序数据相比,PANDORA-seq在干净读段水平和基因组比对水平上都捕获了更多有效的sncRNA读段(图1A),并在人类精子中鉴定出超过15种不同的sncRNA类别(图S1C-D)。值得注意的是,PANDORA-seq揭示了人类精子中tsRNA和rsRNA的显著富集,而miRNA在两种测序方法之间表现出相似的表达模式(图1B;图S1E-F)。Northern blot(NB)实验验证了每种sncRNA亚型中表达量最高的前3个小RNA,并证实表达量最高的rsRNA的丰度高于表达量最高的tsRNA和miRNA,表明rsRNA在人类精子中高度富集,这与PANDORA-seq结果一致(图1C-D)。此外,piRNA在PANDORA-seq中显示出一定程度的富集(图S1B),尽管它们的整体表达水平相对较低(图1C)。 通过PANDORA-seq,人类精子中核编码和线粒体tsRNA(如我们先前报道的[26]那样标准化到miRNA)显示出与传统测序不同的表达特征(图1E-F;图S2A-E)。值得注意的是,PANDORA-seq在人类精子中对内部来源的tsRNA(inner-derived tsRNAs)(与5'和带有CCA尾的3'相比,根据tRNA切割位置分类)显示出更高的比对效率(图1G-H;图S2F-G, S2J-K),同时具有强烈的源自位置的tRNA同工型偏向性(图1H-I)。表征了tsRNA表达谱后,我们随后研究了人类精子中rsRNA的表达景观。与PANDORA-seq揭示的小鼠精子sncRNA谱一致[26],rsRNA也是人类精子中最丰富的sncRNA(图S2H-I)。在这些rsRNA中,绝大多数rsRNA来源于胞质rRNA,线粒体rRNA的贡献很小(图1J)。此外,rsRNA-28S(74.35%)和rsRNA-18S(11.56%)共同构成了总rsRNA群体的85%以上,其次是5.8S来源的rsRNA贡献了可观的9.17%(图1J-K)。NB验证证实,在细胞背景下,来源于5.8S、18S和28S rRNA的rsRNA表达水平呈阶梯式增加,反映了测序数据(图1M)。有趣的是,rsRNA在28S和18S rRNA上呈现出特定的序列来源和分布模式(图1L)。测序数据中确定的两个主要序列峰通过NB分析得到进一步确认(图1M)。 **PANDORA-seq揭示了生育力低下精子中独特的sncRNA景观** 为了进一步探索人类异常精子中sncRNA的改变,我们招募了被诊断为AZS和TZS的患者,收集精子样本进行PANDORA-seq,并与NZS个体的样本进行比较。使用UMAP(均匀流形近似与投影)进行的无监督降维可视化显示,PANDORA-seq能够清晰区分精子样本的临床状态(图2A)。与我们健康对照中的观察一致,AZS和TZS样本检测到超过15种sncRNA(图2B;图S3A-B)。主要的表达改变发生在rsRNA,其次是miRNA和tsRNA(图2B;图S3C)。对于tsRNA,如图2C所示,与NZS样本相比,AZS样本在大多数氨基酸来源的tsRNA中表现出表达丰度普遍较低的趋势,而TZS样本显示出相当的tsRNA水平(图2C)。值得注意的是,NZS、AZS和TZS样本之间tsRNA的共表达分析显示出显著不同的表达模式(图2D)。在rsRNA和miRNA中也观察到类似的表达模式(图2E-H),揭示了在不同临床状态的人类精子中,单个sncRNA水平和整体sncRNA共表达网络水平的动态表达改变。 **生育力低下精子中的tsRNA表达与精子活力和形态相关** 尽管在不同疾病状态下,核或线粒体tsRNA的整体表达丰度没有明显差异(图S4A),但我们发现核编码的tsRNA主要来源于5'端,而线粒体tsRNA主要偏向于产生内部tsRNA(inner' tsRNAs)(图S4B)。在不同疾病状态下,检测到tsRNA在不同氨基酸、反密码子和同受体之间发生改变(图3C;图S4C-D)。值得注意的是,在AZS样本中观察到tsRNA\(^{Ile}\)和tsRNA\(^{Phe}\)的显著增加,同时与NZS相比,TZS样本中少数tsRNA类别的水平升高(图3A)。Northern blot验证证实了核编码tsRNA\(^{Ala}\)的PANDORA-seq数据,显示在AZS中水平较高,在TZS中水平较低(图3B;图S4B)。同样,核编码tsRNA\(^{Ile}\)的表达趋势(在AZS中较高,在TZS中较低)通过NB分析得到验证,强化了测序观察结果。线粒体编码的tsRNA在生育力低下精子样本中也表现出动态变化(图3A)。 为了进一步探索sncRNA在人类精子中的临床意义,我们研究了精子中各种sncRNA类型与临床精液参数之间的关系,包括精子活力(IM、PR和NP)和精子形态(Abnormal、Total_head、Total_neck、CD、TZI和SDI)。有趣的是,miRNA亚型通常与活力参数相关(图S5A-B),而与形态在序列水平上的相关性则较难测量(图S5C-D)。关于tsRNA,我们发现特定tsRNA亚类的整体丰度与精子活力密切相关,例如PR和IM参数。具体来说,tsRNA\(^{Phe}\)和tsRNA\(^{Ile}\)与PR呈正相关,但与IM呈负相关,提示它们可能具有促进精子运动的作用(图3D, F)。相反,其他tsRNA亚类,包括tsRNA\(^{iMet}\)、tsRNA\(^{Met}\)、tsRNA\(^{Trp}\)、tsRNA\(^{His}\)、tsRNA\(^{Ile}\)、tsRNA\(^{Cys}\)和tsRNA\(^{Val}\)显示出与PR负相关但与IM正相关(图3D),表明这些tsRNA可能与精子活力下降有关。虽然tsRNA亚类与精子形态参数之间的相关性不太显著,但也观察到一些值得注意的关联(图3H, J)。例如,tsRNA\(^{Val}\)与异常指数(Abnormal)呈正相关,而tsRNA\(^{His}\)与异常指数(Abnormal)、颈部完整指数(Total_neck)、TZI和SDI指数呈负相关。在序列水平上,单个tRNA序列与单个或多个临床指标显示出更广泛的强相关性,进一步支持了tRNA亚类观察到的整体趋势(图3E, G, I, K)。 **rsRNA在生育力低下精子中显示出不同的表达模式** 通过比对和比较不同rsRNA的整体表达谱,我们在序列来源的分辨率上表征了人类精子中rsRNA的表达改变(图S6A-C和图4A)。所有这些来源于5S、5.8S、18S和28S rRNA的rsRNA在AZS和TZS组中,在其亲本5S、5.8S、18S和28S rRNA的不同位置均表现出相当大的改变。有趣的是,我们发现与健康对照相比,整体28S rRNA来源的rsRNA表达丰度普遍较低(图4A)。具体来说,rsRNA-28S的峰#2在AZS组显著下降,在TZS组上升,这也通过Northern blot得到了验证(图4B)。此外,我们发现与其他rsRNA亚型相比,rsRNA-28S的丰度与AZS样本中的所有活力参数(IM、PR和NP)均表现出强相关性(图4C-D)。有趣的是,大多数28S-rsRNA与PR呈显著负相关,而与IM呈正相关,提示28S-rsRNA在调节精子活力中的潜在作用。与活力相反,不同来源的rsRNA与精子形态参数之间的相关性图谱总体上较弱,只有rsRNA-5.8S与头部完整指数(Total_head)和TZI指数均显示出显著的负相关(图4F, H)。rsRNA-5.8S在TZS中的增加(图2D)表明其在生育力低下精子形态中的潜在作用。除了这些整体趋势外,单个rsRNA表现出不同的反应,rsRNA-18S、rsRNA-28S、rsRNA-5S与单个或多个临床指标显示出显著的线性相关性(图4D, G;图S6D-E)。 **基于精子sncRNA的特征作为精子质量评估中的稳健生物标志物** 虽然sncRNA在其他疾病背景下已成为有前景的诊断工具,但rsRNA和tsRNA的诊断潜力——特别是在人类生育力评估方面——在很大程度上仍未开发。在本研究中,我们基于tsRNA和rsRNA在NZS、AZS和TZS组中的表达特征,探索了它们在人类精子质量评估中的诊断潜力。我们开发了多个诊断分类器(MSsncSig、AZSsncSig和TZSsncSig),基于精子rsRNA和tsRNA谱。这些由选择性精子小非编码RNA组成的分类器,在区分生育力低下个体与健康对照时,展现出比传统临床精液参数更优越的诊断性能,与关键生育力参数显著相关,并具有强大的诊断准确性。然而,鉴于本研究样本量有限(n=25),这些发现的临床意义应谨慎解释。需要在更大的独立队列中通过PANDORA-seq,或通过定量逆转录PCR(qRT-PCR)和基于微流控的检测方法(适用于精液样本中tsRNA和rsRNA的快速、经济高效检测)进行验证,以进一步优化这些生物标志物,并支持其转化为标准化的临床诊断工具。尽管如此,精子rsRNA和tsRNA表达模式在正常和生育力低下组中的一致存在,表明其作为诊断生物标志物的临床应用潜力,并为研究人员研究其在精子发生、受精和胚胎发育中的功能贡献提供了新见解,这将进一步扩展其作为临床男性生育力评估工具箱的潜在效用。 **4 讨论** 20世纪90年代在哺乳动物精子中发现RNA,挑战了长期以来认为精子是转录惰性的假设。随后的测序技术进步推动了关于精子RNA功能作用的广泛研究[41]。然而,对人类精子中sncRNA的全面分析一直受到传统sncRNA测序方法技术局限性的阻碍,这些方法在捕获具有丰富RNA修饰和非典型末端磷酸化的sncRNA方面效率低下[26]。在本研究中,我们采用我们先前建立的PANDORA-seq策略,该策略能够稳健检测修饰的sncRNA,以全面表征人类精子中的小RNA谱,揭示了一个未被充分认识的小RNA景观,其中富含高丰度的rsRNA和tsRNA。我们的分析数据显示,miRNA(在NZS中占0.8%)和piRNA(在NZS中占0.02%)在人类精子中的实际水平可以忽略不计。事实上,rsRNA(在NZS中占94.7%)和tsRNA(在NZS中占2.64%)构成了主要的(>90%)小RNA种类。尽管tsRNA和rsRNA在人类精子质量控制中的生物学功能仍不清楚,但它们在精子中的丰度可能表明了一个研究男性不育潜在调控机制的新方向。然而,当研究旨在识别精子中的功能性miRNA和其他低丰度小RNA时,应谨慎以避免下游分析中的潜在偏差。方法学优化和数据测序深度的提高可能会增强PANDORA-seq对人类精子中稀少sncRNA类型的检测灵敏度,并加强下游分析的数据可靠性。 此外,我们注意到本研究中干净读段和比对读段的总体比例相对较低,这可能归因于人类精液样本固有的复杂性。尽管如此,我们在数据预处理阶段实施了严格的质量过滤标准和严谨的质量控制措施,以确保仅保留高置信度的读段用于后续分析。尽管PANDORA-seq提高了这些sncRNA类型的检测效率,并在多个人类精子样本中产生了可重复的结果,但仍需要扩大样本量的进一步研究,以增进我们对人类精子sncRNA谱的理解。此外,由于每个sncRNA序列计数都标准化到测序深度(每百万读段,RPM),所得值实际上代表了每个sncRNA序列在人类精子总sncRNA中的相对丰度。这种标准化导致获得的sncRNA数据之间整体计数平衡;因此,一种sncRNA丰度的降低会导致其他sncRNA丰度的增加,即使它们的绝对拷贝数保持不变。鉴于相对定量引入的这种相互依赖性,我们因此分析了NZS、AZS和TZS组中不同sncRNA类型之间的共表达模式,这可能表明不同精子sncRNA之间的调控相互作用或组成稳态。数据显示,不同亚型的sncRNA在NZS、AZS和TZS组中表现出独特的表达相关特征。有趣的是,差异表达的幅度并不总是与其在共表达网络中观察到的破坏程度相对应。例如,尽管miRNA在AZS和TZS组中显示出显著的表达改变,但它们的组内共表达模式与正常精子中观察到的相似(图4C-H)。这种差异表明sncRNA共表达网络可能具有一定程度的稳健性——尽管个体表达水平波动,但它们的共表达调控关系可能保持相对稳定。尽管如此,这种共表达模式分析为理解不同sncRNA如何在人类精子环境中相互作用或稳定提供了系统的视角,超越了单个表达的变化。 虽然基于miRNA的诊断已在其他疾病背景下被探索[42],但rsRNA和tsRNA的诊断潜力——特别是在人类生育力评估方面——在很大程度上仍未开发。在本研究中,我们基于tsRNA和rsRNA在NZS、AZS和TZS组中的表达特征,探索了它们在人类精子质量评估中的诊断潜力。我们开发了多个基于精子rsRNA和tsRNA谱的诊断分类器(MSsncSig、AZSsncSig和TZSsncSig)。这些由选择性精子小非编码RNA组成的分类器,在区分生育力低下个体与健康对照时,展现出比传统临床精液参数更优越的诊断性能,与关键生育力参数显著相关,并具有强大的诊断准确性。然而,鉴于本研究样本量有限(n=25),这些发现的临床意义应谨慎解释。需要在更大的独立队列中通过PANDORA-seq,或通过定量逆转录PCR(qRT-PCR)和基于微流控的检测方法(适用于精液样本中tsRNA和rsRNA的快速、经济高效检测)进行验证,以进一步优化这些生物标志物,并支持其转化为标准化的临床诊断工具。尽管如此,精子rsRNA和tsRNA表达模式在正常和生育力低下组中的一致存在,表明其作为诊断生物标志物的临床应用潜力,并为研究人员研究其在精子发生、受精和胚胎发育中的功能贡献提供了新见解,这将进一步扩展其作为临床男性生育力评估工具箱的潜在效用。 **5 致谢** 我们要感谢张云芳实验室和张小欧实验室的成员对稿件提出的宝贵意见和讨论。 **6 作者贡献** 张云芳:概念化,方法论,撰写—初稿。 张小欧:概念化,形式分析,撰写—初稿。 石俊超:形式分析,撰写—审阅与编辑。 黄若凡:概念化,形式分析,方法论,撰写—初稿。 杨依婷:概念化,验证,方法论,撰写—初稿。 姜文林:撰写—审阅与编辑。 曹政:撰写—审阅与编辑。 **7 基金资助** 本工作得到了国家重点研发计划[2019YFA0802600 资助张云芳;2022YFA1103200 资助张小欧]、国家自然科学基金[NSFC, 项目 82371727, 82022029 和 81971460 资助张云芳;项目 32170553 资助张小欧;项目 32370596 资助石俊超]、上海市科学技术委员会[23JC1403802 资助张云芳]、国家卫生健康委与上海市重点实验室创新促进计划,上海生物医药技术研究院[RC2024-04 资助杨依婷]、中国科学院战略性先导科技专项[XDA0460302 资助石俊超]以及中央高校基本科研业务费[项目 22120240435 资助张云芳和张小欧]的支持。开放获取费用由国家重点研发计划资助。 **8 利益冲突** 张云芳是《基因与疾病》的编委,未参与本稿件的编辑审阅或发表决定。所有作者声明不存在利益冲突。 **9 数据可用性** 本文基础数据可在文章及其在线补充数据中找到,并可在人类基因组序列存档库(Genome Sequence Archive for Human)https://www.cncb.ac.cn 获取,访问号为 PRJCA031725。 **10 补充材料** 补充图表可在《基因与疾病》在线获取。 **11 参考文献** (略 - 保留原文格式和编号) --- **图表标题翻译** **图1:人类精子sncRNA特征在传统小RNA测序与PANDORA-seq之间的表征和比较。** (A) 比较传统RNA-seq与PANDORA-seq之间干净读段占原始读段的比例以及比对到基因组的读段占干净读段的比例。 (B) 散点图描绘配对传统RNA-seq与PANDORA-seq的miRNA、tsRNA和rsRNA表达谱的相关性。显示Spearman相关系数和p值。 (C) 通过PANDORA-seq方案确定的健康人类精子中四种主要sncRNA来源(miRNA、tsRNA、rsRNA、ysRNA和piRNA)相对表达水平的比较。 (D) Northern blot验证人类精子样本中的miRNA、tsRNA和rsRNA表达水平。 (E) 雷达图显示两种方案下每个tsRNA亚类的相对表达比例。 (F) Northern blot验证人类精子中的tsRNA\(^{Leu(TAG)}\)、tsRNA\(^{Lys(TTT)}\)和tsRNA\(^{Gly(GCC)}\)。 (G) 通过PANDORA-seq方案可视化的健康人类精子中胞质tsRNA(cyto-tsRNAs)和线粒体tsRNA(mt-tsRNAs)的比例分布。 (H) 雷达图说明与三种不同tsRNA来源(5'、内部和3')相关的每个tsRNA亚类的相对表达比例。 (I) 人类精子中tsRNA\(^{Ala(AGC)}\)、tsRNA\(^{Arg(TCG)}\)和tsRNA\(^{Glu(CTC)}\)的序列定位图(左)、表达谱(中)和RT-PCR验证(右)。 (J) 六种核编码rsRNA和两种线粒体编码rsRNA的表达比例分布。 (K) 箱线图显示五种核编码rsRNA和两种线粒体编码rsRNA类别的相对表达。 (L) 人类精子样本中rsRNA-18S和rsRNA-28S的表达特征和序列定位可视化。 (M) Northern blot验证人类精子样本中的rsRNA-5.8S、选定的rsRNA-18S主峰(峰#1、峰#2)和选定的rsRNA-28S主峰(峰#1、峰#2)。 **图2:PANDORA-seq揭示AZS和TZS与NZS相比sncRNA的改变特征。** (A) 均匀流形近似与投影(UMAP)结果可视化健康对照(NZS, n = 9)、AZS (n = 9) 和 TZS (n = 7) 样本之间人类精子总sncRNA的分布。 (B) 检测到的miRNA、tsRNA、rsRNA的动态景观和长度分布。图中显示了miRNA和tsRNA的放大面板以便更清晰的可视化。 (C) 雷达图显示AZS和TZS样本中每个tsRNA亚类相对于NZS样本的表达比例(标准化)。 (D) 热图显示tsRNA亚类丰度之间的Spearman相关系数。 (E) 条形图显示NZS、AZS和TZS中六种核编码rsRNA和两种线粒体编码rsRNA的表达比例。 (F) 热图显示rsRNA来源丰度之间的Spearman相关系数。 (G) 热图显示基于log2转换尺度在NZS、AZS和TZS中miRNA表达谱的变化。 (H) 热图显示前20个miRNA家族丰度之间的Spearman相关系数。 **图3:AZS和TZS与NZS相比tsRNA表达模式的综合分析。** (A) 雷达图说明AZS和TZS样本中核编码和线粒体tsRNA亚类相对于NZS标准化的相对比例。 (B) Northern blot验证生育力低下(AZS或TZS)与健康对照(NZS)精子样本之间tRNA-Arg和tRNA-Lys的表达。 (C) 雷达图显示AZS和TZS样本中每个tsRNA亚类的核编码和线粒体编码tsRNA来源相对于NZS标准化的相对表达水平。 (D) 每个tsRNA亚类丰度与精子活力之间的Spearman相关性分析。 (E) 点图(DotPlot)显示单个tsRNA表达水平与精子活力之间的相关性。 (F) tsRNA亚类与精子活力之间代表性线性相关性。 (G) tsRNA与精子活力之间代表性线性相关性。 (H) 每个tsRNA亚类丰度与形态学指标之间的Spearman相关性分析。 (I) 点图(DotPlot)显示单个tsRNA表达水平与精子形态学指标之间的相关性。 (J) tsRNA亚类与精子形态学指标之间代表性线性相关性。 (K) tsRNA与精子形态学指标之间代表性线性相关性。 脚注:IM - 不动率,PR - 前向运动率,NP - 非前向运动率,Abnormal - 头部/尾部形态异常率,Total_head - 头部完整率,Total_neck - 颈部完整率,CD - 胞质小滴率,TZI - 头部形状指数,SDI - 严格形态指数。 **图4:AZS和TZS与NZS相比rsRNA表达模式的综合分析。** (A) 生育力低下精子(AZS或TZS)与健康对照(NZS)之间rsRNA-28S的序列定位图和表达谱。 (B) 在生育力低下精子(AZS或TZS)与健康对照(NZS)样本之间进行的rsRNA-28S代表性表达峰(峰#2)的Northern blot。 (C) 不同来源rsRNA的表达丰度与精子活力指标之间的Spearman相关系数。 (D) 点图(DotPlot)显示精子活力与单个rsRNA表达水平的相关性。 (E) 不同来源rsRNA与精子活力指标之间代表性线性相关性。 (F) 不同来源rsRNA的表达丰度与精子形态学指标之间的Spearman相关系数。 (G) 点图(DotPlot)显示精子形态学指标与单个rsRNA表达水平的相关性。 (H) 不同来源rsRNA与精子形态学指标之间代表性线性相关性。 **图5:基于sncRNA的特征稳健地区分具有生育力低下精子的受试者与健康对照。** (A) 本研究的发现队列。 (B) 筛选sncRNA特征以开发生育力低下精子(AZS和/或TZS)与健康对照(NZS)样本之间预测模型的策略和工作流程。 (C) 随机森林分类器区分生育力低下精子(AZS和TZS)病例与健康对照的排序结果,按特征重要性排序。 (D) 用于区分生育力低下精子(AZS和TZS)病例与健康对照的sncRNA特征的ROC曲线,以及相应的AUC分数。 (E) 选定的sncRNA序列与精子活力或精子形态学指标之间的代表性线性相关性。 (F-K) 随机森林分类器区分AZS (F) 或 TZS (I) 病例与健康对照的排序结果,按特征重要性排序。sncRNA特征、精子形态指标、精子活力指标和单个sncRNA分别标记为红色、橙色、紫色和蓝色点。用于区分AZS (G) 或 TZS (J) 病例与健康对照的选定sncRNA特征的ROC曲线,以及相应的AUC(ROC曲线下面积)分数。选定的sncRNA序列与精子活力 (H) 或精子形态学指标 (K) 之间的代表性线性相关性。 **审稿人#2:尊敬的作者们,** 稿件已得到实质性改进。我仍然认为讨论部分应该直接讨论研究中获得的结果,并且英语语言需要修订。 **回复:** 非常感谢您的宝贵建议和评论。我们感谢您对我们先前修订稿件的认可,并衷心感谢您为改进我们稿件所做的努力。同时,我们确实对之前讨论部分的修订不满意以及英语语言问题感到非常抱歉。在本轮修订中,我们仔细重写了讨论部分,并广泛校对了整个稿件的英语语言问题。我们希望所有这些修订和改进能够充分解决您的关切。 --- **补充图表标题翻译 (图S1-S7)** * **图S1:** (A) 精子纯化示意图。(B) PANDORA-seq与传统测序中piRNA表达比例的比较。(C-D) 传统测序和PANDORA-seq检测到的sncRNA类型分布。(E) 两种方法中sncRNA类型表达比例的比较。(F) PANDORA-seq与传统测序中miRNA表达的相关性。 * **图S2:** tsRNA和rsRNA在人类精子中表达谱的详细分析(包括来源分布、位置偏向性、序列特征等验证)。 * **图S3:** AZS和TZS与NZS相比sncRNA整体表达谱和共表达模式的补充分析。 * **图S4:** AZS和TZS与NZS相比tsRNA表达谱的补充分析(包括来源比例、氨基酸分布等)。 * **图S5:** miRNA表达与精子活力(A-B)和形态(C-D)参数的相关性分析。 * **图S6:** rsRNA表达与精子活力(A-B)和形态(C-D)参数的相关性分析,以及rsRNA来源的详细表达谱。 * **图S7:** 机器学习筛选sncRNA特征标志物的过程图示(特征筛选、LASSO回归、模型构建和验证)。 **补充表格 (Supplemental Tables_0506.xlsx)**:包含引物序列、酶反应体系、差异表达sncRNA列表、相关性数据等详细表格。 **补充材料 (Supplementary Material_0506.docx)**:包含补充方法细节、结果描述、图表图例等文本内容。 ---

视频信息