心肌梗死潜在生物标志物的生物信息学研究

钱晗, 曹梦菲, 吕书梅, 袁伟

钱晗, 曹梦菲, 吕书梅, 袁伟. 心肌梗死潜在生物标志物的生物信息学研究[J]. 实用临床医药杂志, 2023, 27(3): 21-28, 34. DOI: 10.7619/jcmp.20223235
引用本文: 钱晗, 曹梦菲, 吕书梅, 袁伟. 心肌梗死潜在生物标志物的生物信息学研究[J]. 实用临床医药杂志, 2023, 27(3): 21-28, 34. DOI: 10.7619/jcmp.20223235
QIAN Han, CAO Mengfei, LYU Shumei, YUAN Wei. Bioinformatics study on potential biomarkers of myocardial infarction[J]. Journal of Clinical Medicine in Practice, 2023, 27(3): 21-28, 34. DOI: 10.7619/jcmp.20223235
Citation: QIAN Han, CAO Mengfei, LYU Shumei, YUAN Wei. Bioinformatics study on potential biomarkers of myocardial infarction[J]. Journal of Clinical Medicine in Practice, 2023, 27(3): 21-28, 34. DOI: 10.7619/jcmp.20223235

心肌梗死潜在生物标志物的生物信息学研究

基金项目: 

江苏省重点研发计划项目 BE2021694

江苏省333人才基金 BRA2020395

详细信息
    通讯作者:

    袁伟, E-mail: Yuanwei1@medmail.com.cn

  • 中图分类号: R542.2;Q811.4

Bioinformatics study on potential biomarkers of myocardial infarction

  • 摘要:
    目的 

    基于外周血单个核细胞(PBMCs)寻找心肌梗死潜在的生物学标志物。

    方法 

    从基因表达综合(GEO)数据库中下载心肌梗死患者PBMCs的测序数据集GSE59867, 基于加权基因共表达网络分析(WGCNA)和差异表达基因(DEGs)探讨心肌梗死过程中的生物学变化和共同基因,并进行共同转录因子预测。通过LASSO回归分析确定关键基因,绘制受试者工作特征(ROC)曲线,评估关键基因的临床价值。通过基因集富集分析(GSEA)探讨与关键基因有关的生物学变化,并基于心肌梗死数据集GSE123342验证关键基因的表达。

    结果 

    心肌梗死过程伴随着免疫炎症反应,其中关键基因有6个,即CD163RNASE2HPFAM20AMCEMP1FAM198B。ROC曲线分析结果显示,这些关键基因的表达对心肌梗死均有较高的诊断价值。在心肌梗死恢复过程中,这些基因的表达呈现明显下降趋势。GSEA结果显示,这些关键基因涉及的生物学改变大多与糖脂代谢、活性氧、免疫炎症等有关。

    结论 

    基于PBMCs进行分析,本研究发现CD163RNASE2HPFAM20AMCEMP1FAM198B基因与心肌梗死有关,这可能为心肌梗死的早期诊断和梗死恢复的监测、评估与管理提供新的见解。

    Abstract:
    Objective 

    To find potential biomarkers of myocardial infarction from the perspective of peripheral blood mononuclear cells (PBMCs).

    Methods 

    The sequencing dataset GSE59867 of peripheral blood mononuclear cells from patients with myocardial infarction was downloaded from the Gene Expression Omnibus (GEO) database. Weighted gene co-expression network (WGCNA) and differentially expressed genes (DEGs) were used to investigate the biological changes during process of myocardial infarction and to find common genes. Common transcription factors for these genes were predicted. Finally, hub genes were identified by LASSO regression analysis. Receiver operating characteristic curve (ROC) analysis was used to evaluate the clinical value of hub genes. Gene set enrichment analysis (GSEA) was used to explore the biological changes related to hub genes, and the expression of hub genes was verified based on myocardial infarction dataset GSE123342.

    Results 

    Myocardial infarction was accompanied by an immune inflammatory response. Six novel hub genes were identified (CD163, RNASE2, HP, FAM20A, MCEMP1, and FAM198B). ROC analysis showed that the expression of these hub genes had good diagnostic for myocardial infarction. The expression of these genes also decreased significantly during recovery from infarction during recovering from myocardial infarction. GSEA results suggested that most of these hub genes were related to glucose and lipid metabolism, reactive oxygen species, immune inflammation and so on.

    Conclusion 

    Based on the analysis of PBMCs, this study find that CD163, RNASE2, HP, FAM20A, MCEMP1 and FAM198B genes are associated with myocardial infarction, which may provide new insights for the early diagnosis of myocardial infarction and the monitoring, evaluation and management of infarction recovery.

  • 在人口老龄化和代谢危险因素的双重压力下,中国居民的心血管疾病风险持续增加,心肌梗死患者的病死率亦逐渐上升[1]。心肌梗死是指心肌缺血性坏死,通常是在冠状动脉病变的基础上发生冠状动脉血供减少或中断,心肌细胞因严重且持续的缺血缺氧而发生坏死[2]。心肌细胞的死亡会引发一系列免疫炎症反应,这些免疫炎症反应介导的受损心肌修复在梗死后心室重构、心功能和患者结局等方面起着关键作用[3]。急性心肌梗死的诊断主要依据临床表现、血清生物学标志物和心电图,其中临床常用的生物学标志物包括肌红蛋白、肌酸激酶-MB、心肌肌钙蛋白I和心肌肌钙蛋白T[4-5]。然而,这些标志物水平在心力衰竭、肾衰竭和甲状腺疾病患者中也同样升高,故结合多组学平台探寻更多特异性的生物学标志物非常必要[6-7]。外周血单个核细胞(PBMCs)包括T细胞、B细胞、单核细胞、树突状细胞和自然杀伤细胞,在免疫应答、免疫监测和免疫治疗中发挥着重要作用[8]。本研究基于PBMCs分析心肌梗死和梗死恢复过程中潜在的关键基因和生物学改变,旨在为心肌梗死的诊断、评估、管理和预后分析提供新的见解。

    从GEO数据库中下载关于心肌梗死PBMCs的转录组测序芯片数据集GSE59867[9-10], 芯片注释平台为GPL6244, 芯片信息为Affymetrix Human Gene 1.0 ST Array。该数据集收集了111例ST段抬高型心肌梗死(STEMI)患者入院、出院、心肌梗死后1个月、心肌梗死后6个月时的外周血样本数据。对照组为46例无心肌梗死病史的稳定型冠心病患者。基于芯片注释平台对数据集进行基因名转换,用于后续共表达网络的构建。

    通过WGCNA R包筛选与心肌梗死有关的易感基因模块[11]。WGCNA是一种常用的生物信息学方法,可以识别具有相似表达模式的基因模块,分析基因模块与样本表型之间的关系,绘制基因模块中的调控网络,识别关键模块和调控基因[12-13]。首先,选取数据集中方差变异程度最高的前3 000个基因构建共表达网络; 其次,利用R函数pickSoftThreshold计算软阈值1~20; 然后,对这些基因进行层次聚类和动态树切割来划分模块,并合并相似的模块(阈值为0.25); 最后,计算模块与疾病之间的Spearman相关系数,进而确定易感基因模块。为了探讨所选模块的潜在生物学功能,通过ClusterProfiler R包对模块中的基因进行基因本体论(GO)分析和京都基因与基因组百科全书(KEGG)通路分析[14]。GO分析包括生物过程(BP)、分子功能(MF)和细胞成分(CC)。通过Ggplot2 R包进行结果展示。

    使用Limma R包进行基因差异分析[15]。差异表达基因(DEGs)的筛选标准为矫正后P < 0.05, |log2(倍数变化)|>0.5。基于ClusterProfiler R包对DEGs进行GO分析和KEGG通路分析, P < 0.05表示显著富集。对上述易感基因模块和DEGs进行交集分析,通过ChEA3数据库对交集基因进行转录因子预测。ChEA3是一种转录因子富集分析工具,整合了多个数据库,如ENCODE、GTEx、ARCHS4等数据库[16]。由于ChEA3数据库并未对预测结果可靠度进行严格划分,参考相关研究[16-17]结论,本研究对平均排名分≤30分的共同转录因子进行结果展示。基于STRING数据库构建交集基因的蛋白相互作用网络,并将交互评分>0.4分的数据导入Cytoscape 3.8.2软件进行可视化处理[18-19]

    LASSO回归分析是常用的筛选变量的压缩估计方法,通过构造惩罚函数获得较为精炼的模型,使得其压缩一些回归系数,同时设定一些回归系数为0,因此保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计,常被用于协变量筛选[20]。基于glmnet R包对交集基因中存在蛋白相互作用的基因进行LASSO回归分析,进一步筛选关键基因[21]。采用10倍交叉验证法选择惩罚项(λ), 并选择最小二项偏差在1个标准误差内的最简单模型的λ值(lambda.1se)。通过pROC R包对关键基因进行ROC曲线分析,计算曲线下面积(AUC), 评估关键基因对心肌梗死的诊断价值[22]

    根据每个关键基因的表达量将数据集划分为高表达组和低表达组,通过GSEA探讨高表达组和低表达组之间潜在的生物学功能变化,将特征基因集作为预先定义的基因集。作为一种常见的生物信息学方法, GSEA可评估一个预先定义的基因集的基因在与表型相关度排序的基因表中的分布趋势,从而判断其对表型的影响[23]。从GEO数据库中选取另一个数据集GSE123342, 将其用于验证关键基因的表达。GSE123342数据集包括急性心肌梗死(65例)、梗死后30 d(64例)、梗死后1年(37例)、稳定型冠心病(22例)样本数据以及4例技术重复样本数据。

    根据无标度网络原理,选取10作为共表达网络的软阈值,见图 1A。通过层次聚类和动态树切割,将前3 000个基因划分为15个基因模块,见图 1B。剔除聚类失败的灰色模块,棕色模块的总体表达与心肌梗死的相关性最高(r=0.4), 且与出院至心肌梗死后6个月的演变过程呈负相关(r=-0.33), 见图 1C。棕色模块中的共表达基因伴随着心肌梗死的发生呈现高表达趋势,而在心肌梗死恢复过程中则呈现低表达趋势。由此提示,棕色模块可能是易感基因模块,其中包含243个基因,即ABHD5ACER3ACP3ACSL1ADAM17ADAM9ADMAHRALCAMALDH2ALPK1ANKRD50ANO5AQP9ARHGAP24ARHGAP29ARRDC4ASPHATP6V0A1ATP6V1AB3GNT5BACH1BLVRBBST1C3AR1C5C9orf72CALCRLCAPGCAPZA2CARD6CASP1CASP5CCDC88ACCR2CD14CD163CD1DCD33CD36CD63CLEC1ACLEC4ACLEC4DCLEC4ECLEC7ACLMNCNTLNCPED1CPMCPNE8CPVLCR1CR1LCREG1CRISPLD2CSTACTNNA1CTSHCYBRD1CYP1B1CYP1B1-AS1DACH1DDIASDOCK4DOCK5DRAM1DSC2DSEDUSP6EDNRBENTPD1ERLIN1EVI5F5FAM114A1FAM13AFAM151BFAM20AFAM198BFAR2FBN2FBP1FCGR2AFGD4FGD6FLT3FLVCR2FMO5FPR1FPR2FRRS1FUCA1FUCA2GAPTGAS2L3GCAGIMAP8GLT1D1GPAT3GPR141HALHGFHMGB2HNMTHORMAD1HPHPSEIDH1IFNGR1IL13RA1IL15IL18IMPA2IRAK3JAK2KCNJ15KCNJ2KIF13AKLHL8KYNULHFPL2LILRA5LIN7ALIPNLMNB1LPCAT2LRMDALRRK2LTA4HLY86LYVE1MAP3K20MCEMP1ME1METTL7AMETTL7BMFSD1MGST1MGST2MILR1MNDAMOSPD2MS4A4AMSRB1MTARC1MYOFNAAANAIPNETO2NLNNLRC4NPLOLFML2BP2RX7P2RY13PGDPIP4P2PLA2G4APLBD1PLD1PLIN2PLSCR1PPARGPPT1PRRG4PSTPIP2PYGLQPCTRAB39ARALBRBP7RGL1RNASE2RNASE6RNF141RNF217RRAGDS100A12S100A9S100ZSAT2SEMA3CSEPTIN10SERPINB1SERPINB2SESTD1SGMS2SH3PXD2BSHTN1SIPA1L2SIRPDSLC15A2SLC1A3SLC22A15SLC22A4SLC26A8SLC31A1SLC36A4SLC7A7SLC8A1SLITRK4SMAD1SMPDL3ASNX10SOD2SORT1SPATA6ST3GAL6ST6GALNAC3STEAP4SULT1B1TASLTBC1D12TCN2TDRD9TFECTGFBITLR1TLR2TLR4TLR5TLR6TLR7TLR8TM6SF1TMEM144TMEM167ATMTC2TNFAIP6TNFSF13BTPST1TSPOUBE2D1UGGT2VNN2VNN3WASF1WDFY3WLSZC3H12CZFYVE16ZNF438

    图  1  易感基因模块的确定与功能注释
    A: 共表达网络的无标度拟合指数; B: 基因聚类树状图; C: 模块特征基因与临床特征相关性热图; D、E: GO分析结果、KEGG分析结果的气泡图展示。

    棕色模块GO分析最显著的结果分别是骨髓白细胞激活(BP)、囊泡(CC)和模式识别受体活性(MF), 见图 1D; KEGG分析结果则主要为感染、免疫炎症等相关生物学过程的改变,包括Toll样受体信号通路等,见图 1E

    进一步对数据集进行基因差异分析,根据筛选标准共得到142个DEGs(图 2A), 其中上调的DEGs有77个,下调的DEGs有65个,见表 1。BP分析结果主要包括免疫反应、免疫系统过程和免疫效应过程, CC分析结果包括分泌颗粒、分泌小泡和细胞质小泡部分等, MF分析结果主要包括信号受体活性、分子传感器活性和碳水化合物结合,见图 2B。KEGG分析提示,这些DEGs主要涉及免疫、炎症和感染的相关生物学改变,见图 2C。DEGs与上述棕色模块存在35个交集基因,见图 2D。基于ChEA3数据库对35个交集基因进行共同转录因子预测,其中平均排名分≤30分的共同转录因子分别是CREB5、MTF1、NFE4、SPI1、ZNF467、NFE2、TFEC、MXD1、NR1H3、BORCS8MEF2B、NFIL3和CEBPE, 见表 2。构建蛋白互作网络,其中有18个基因存在蛋白质相互作用,见图 2E

    图  2  基因差异分析和蛋白互作网络
    A: 差异基因火山图; B、C: 差异基因的GO分析、KEGG分析结果; D: DEGs与棕色模块的交集基因; E: 18个交集基因的蛋白相互作用网络以及各基因的log2(倍数变化)改变量。
    表  1  差异基因与交集基因
    上调DEGs 下调DEGs 与棕色模块交集的DEGs
    ACSL1ADMAQP9ASGR2BLVRBBST1CCR1CCR2CD14CD163CES1CES1P1CR1CYP1B1CYP27A1DSC2DYSFECRPEGR1EGR2FAM20AFAM20CFLVCR2FMN1FOLR3FPR1FPR2FAM198BGPR162HLXHPIFITM3IL1R2KCNJ15LILRA3LILRA5LILRB4LRP1MAFBMCEMP1MERTKMIR21MS4A4AMTARC1NFE2NRG1PADI2PLB1PLBD1PPARGQPCTRNASE1RNASE2S100A12S100A9SASH1SERPINB10SERPINB2SH3PXD2BSIGLEC16SIGLEC9SLED1SOCS3ST14STAB 1STEAP4TBC1D2TCN2TDRD9TMEM150BTMEM176ATMEM176BTNFAIP6TREM1TRIB1TSPOVSIG4 ARAP2BIRC3C12orf75CD160CD3GCENPKCEP78CLCCLEC2DCPA3DTHD1EPB41L4AFAM169AFCRL6FGFBP2GBP4GNLYHRH4IL18RAPJAKMIP2KLRA1PKLRC1KLRC3KLRC4-KLRK1KLRD1KLRF1KLRG1KPNA5MIR29AMS4A3MYBL1MYO6ODF2LPDGFDPRSS23RNU5A-1RORASAMD3SCARNA9SH2D1ASLC4A4SLCO4C1SNORA16BSNORA20SNORA75SNORD20SNORD28SNORD30SNORD45CSNORD50ASNORD54SNORD58ASNORD59ASNORD59BSNORD61SNORD81SNORD82SYTL2TARPTBC1D19TFDP2TGFBR3VPS13AZNF675ZNF737 ACSL1ADMAQP9BLVRBBST1CCR2CD14CD163CR1CYP1B1DSC2FAM20AFLVCR2FPR1FPR2FAM198BHPKCNJ15LILRA5MCEMP1MS4A4AMTARC1PLBD1PPARGQPCTRNASE2S100A12S100A9SERPINB2SH3PXD2BSTEAP4TCN2TDRD9TNFAIP6TSPO
    下载: 导出CSV 
    | 显示表格
    表  2  共同转录因子预测结果(平均排名分≤30分)
    排名 转录因子 平均得分/分 转录因子数据库计算方法与得分 重叠基因
    1 CREB5 7.667 ARCHS4 Coexpression, 5分; Enrichr Queries, 14分; GTEx Coexpression, 4分 CR1STEAP4TNFAIP6ACSL1AQP9FPR1MCEMP1ADMFPR2LILRA5BST1QPCTPLBD1CYP1B1CD14S100A9CCR2
    2 MTF1 8.500 ARCHS4 Coexpression, 6分; GTEx Coexpression, 11分 CR1SERPINB2TNFAIP6ACSL1AQP9FPR1FPR2LILRA5BST1PLBD1CYP1B1FLVCR2CD14S100A9
    3 NFE4 9.000 GTEx Coexpression, 9分 BST1CR1AQP9FPR1PLBD1MCEMP1FPR2LILRA5CCR2
    4 SPI1 9.667 Literature ChIP-seq, 5分; ARCHS4 Coexpression, 11分; ENCODE ChIP-seq, 8分; Enrichr Queries, 11分; ReMap ChIP-seq, 5分; GTEx Coexpression, 18分 CD163CR1STEAP4SERPINB2ACSL1AQP9FPR1TDRD9MCEMP1FPR2RNASE2LILRA5MS4A4ABST1QPCTPLBD1CYP1B1CD14S100A9CCR2
    5 ZNF467 19.333 ARCHS4 Coexpression, 18分; Enrichr Queries, 30分; GTEx Coexpression, 10分 CR1AQP9FPR1MCEMP1ADMFPR2LILRA5BST1PLBD1CYP1B1BLVRBCD14S100A9CCR2
    6 NFE2 21.000 ARCHS4 Coexpression, 16分; ENCODE ChIP-seq, 78分; Enrichr Queries, 1分; ReMap ChIP-seq, 8分; GTEx Coexpression, 2分 CR1SERPINB2AQP9FPR1MCEMP1ADMFPR2RNASE2LILRA5BST1TCN2QPCTPLBD1S100A12BLVRBTSPOCYP1B1PPARGCD14S100A9CCR2
    7 TFEC 21.667 ARCHS4 Coexpression, 21分; Enrichr Queries, 4分; GTEx Coexpression, 40分 CD163CR1SERPINB2TNFAIP6ACSL1AQP9FPR1MS4A4ABST1TCN2FLVCR2PPARGCD14S100A9CCR2
    8 MXD1 23.000 ARCHS4 Coexpression, 4分; Enrichr Queries, 9分; GTEx Coexpression, 56分 CR1SERPINB2STEAP4ACSL1AQP9FPR1ADMFPR2LILRA5BST1PLBD1CYP1B1CD14S100A9
    9 NR1H3 26.600 Literature ChIP-seq, 10分; ARCHS4 Coexpression, 17分; Enrichr Queries, 10分; ReMap ChIP-seq, 36分; GTEx Coexpression, 60分 CD163STEAP4TCN2ACSL1FLVCR2CYP1B1PPARGADMCD14S100A9MS4A4A
    10 BORCS8MEF2B 29.000 ARCHS4 Coexpression, 29分 AQP9FPR1TSPOFPR2S100A9LILRA5
    11 NFIL3 30.000 ARCHS4 Coexpression, 1分; Enrichr Queries, 21分; GTEx Coexpression, 68分 CR1TNFAIP6ACSL1AQP9FPR1ADMFPR2LILRA5MS4A4ABST1CYP1B1PLBD1CD14S100A9
    12 CEBPE 30.000 ARCHS4 Coexpression, 31分; Enrichr Queries, 12分; GTEx Coexpression, 47分 BST1FPR1PLBD1ADMMCEMP1FPR2CD14RNASE2S100A9CCR2LILRA5
    计算方法包括ARCHS4 Coexpression、ENCODE ChIP-seq、Enrichr Queries、GTEx Coexpression、Literature ChIP-seq、ReMap ChIP-seq; 平均得分为各计算方法得分之和除以计算方法数量所得之商。
    下载: 导出CSV 
    | 显示表格

    对18个存在蛋白相互作用的基因进一步行LASSO回归分析,这些基因不同惩罚参数值所对应的系数见图 3A。本研究选取最小二项偏差在1个标准误差内的λ值(lambda.1se, 6个基因),该λ值提供更精简的模型,见图 3B。ROC曲线分析显示, CD163RNASE2HPFAM20AMCEMP1FAM198B基因表达水平对心肌梗死的发生均具有良好的诊断价值, AUC分别为0.831、0.798、0.775、0763、0.866和0.829, 见图 3C。与对照组稳定型冠心病患者相比,这些关键基因的表达水平在入院时心肌梗死患者中显著上升,并在出院时、心肌梗死后1个月、心肌梗死后6个月逐步下降,见图 3D

    图  3  LASSO回归与ROC分析
    A、B: 基于惩罚项的LASSO回归系数图和交叉验证图; C: 基于ROC分析评估关键基因表达在预测心肌梗死中的作用; D: 关键基因在不同时点的表达折线图(两者比较, ***P < 0.001)。

    GSEA结果提示,这些关键基因涉及的生物学改变主要与糖脂代谢、活性氧、免疫炎症等有关,见图 4。这些基因在外部数据集中大多也存在差异表达。基于外部验证数据集GSE123342, 本研究同样发现,与稳定型冠心病相比, HPFAM198BCD163FAM20AMCEMP1表达水平在急性心肌梗死发生时显著上升,而RNASE2仅表现出上升趋势,见图 5

    图  4  关键基因的GSEA分析结果
    图  5  外部数据集验证关键基因的表达情况
    两者比较, ns>0.05, *P < 0.05, **P < 0.01, ***P < 0.001。

    本研究基于PBMCs转录组学的变化探讨心肌梗死及梗死恢复过程中可能存在的生物学改变和潜在标志物, WGCNA和DEGs分析结果显示,心肌梗死过程伴随着免疫炎症紊乱。基于LASSO分析,本研究从上述2种分析方法得到的共同基因中鉴定出6个关键基因,即 CD163RNASE2HPFAM20AMCEMP1FAM198B。ROC曲线分析结果提示,这些关键基因对心肌梗死的发生均具有较高的诊断价值。本研究还发现,在梗死恢复过程中,这些基因的表达呈现明显下降趋势。GSEA分析结果表明,这些关键基因涉及的生物学改变主要与糖脂代谢、活性氧、免疫炎症等有关。

    CD163分子是Ⅰ型膜蛋白,蛋白表达限于单核细胞/巨噬细胞系, CD163抗原特异性释放机制可能在炎症调节过程中起重要作用。在动脉粥样硬化过程中, CD163+巨噬细胞能促进血管生成和增加血管通透性,并伴随炎症反应;此外,破裂的冠状动脉斑块中 CD163 的表达增加了心肌梗死和冠心病发生风险[24]RNASE2 编码的蛋白质是非分泌型核糖核酸酶,属于胰核糖核酸酶家族[25]FAM20A 是激酶编码基因家族的成员,本身不具有激酶活性,通过与家族成员 FAM20C 形成复合物,增强 FAM20C 的激酶活性,从而使分泌通路内的蛋白磷酸化[26]MCEMP1 又称 C19ORF59 , 可编码表达于肥大细胞、巨噬细胞等的跨膜蛋白[27]。研究[27]表明, MCEMP1 基因可能是卒中诊断和预后评估的新生物标志物。生物信息学研究[28-29]提示, RNASE2FAM20AMCEMP1 可能是心肌梗死的关键基因,然而这些基因在心肌梗死及梗死恢复过程中的具体作用机制有待进一步研究。HP基因编码一种前蛋白,经处理后产生α链和β链,结合为四聚体产生触珠蛋白,其基因型与急性心肌梗死的发病风险密切相关,并且能决定心肌梗死面积[30-31]FAM198B(GASK1B) 是目前未知功能的新基因,可能编码定位在高尔基体上的膜结合糖蛋白,被认为参与癌症的转移与进展[32]。本研究分析结果显示, FAM198B 可能是心肌梗死和反映心肌梗死恢复的关键基因。

    本研究尚存在一定局限性: 首先,本研究基于GEO数据库中下载的心肌梗死患者PBMCs的测序数据集进行分析,还需要进一步开展分子生物学实验来验证这些基因在心肌梗死中的表达及其可能的生物学机制; 其次,本研究仅分析了现有的样本数据,未来还需基于更大的样本规模和更详细的样本类型进一步深入研究; 最后,由于缺乏临床资料,本研究未分析这些关键基因的表达与心肌梗死患者年龄、性别、射血分数等临床指标的相关性。

    综上所述,本研究基于PBMCs确定了6个可能与心肌梗死密切相关的关键基因,即 CD163RNASE2HPFAM20AMCEMP1FAM198B, 为心肌梗死的诊断、评估、管理和预后分析提供了新的思路。

  • 图  1   易感基因模块的确定与功能注释

    A: 共表达网络的无标度拟合指数; B: 基因聚类树状图; C: 模块特征基因与临床特征相关性热图; D、E: GO分析结果、KEGG分析结果的气泡图展示。

    图  2   基因差异分析和蛋白互作网络

    A: 差异基因火山图; B、C: 差异基因的GO分析、KEGG分析结果; D: DEGs与棕色模块的交集基因; E: 18个交集基因的蛋白相互作用网络以及各基因的log2(倍数变化)改变量。

    图  3   LASSO回归与ROC分析

    A、B: 基于惩罚项的LASSO回归系数图和交叉验证图; C: 基于ROC分析评估关键基因表达在预测心肌梗死中的作用; D: 关键基因在不同时点的表达折线图(两者比较, ***P < 0.001)。

    图  4   关键基因的GSEA分析结果

    图  5   外部数据集验证关键基因的表达情况

    两者比较, ns>0.05, *P < 0.05, **P < 0.01, ***P < 0.001。

    表  1   差异基因与交集基因

    上调DEGs 下调DEGs 与棕色模块交集的DEGs
    ACSL1ADMAQP9ASGR2BLVRBBST1CCR1CCR2CD14CD163CES1CES1P1CR1CYP1B1CYP27A1DSC2DYSFECRPEGR1EGR2FAM20AFAM20CFLVCR2FMN1FOLR3FPR1FPR2FAM198BGPR162HLXHPIFITM3IL1R2KCNJ15LILRA3LILRA5LILRB4LRP1MAFBMCEMP1MERTKMIR21MS4A4AMTARC1NFE2NRG1PADI2PLB1PLBD1PPARGQPCTRNASE1RNASE2S100A12S100A9SASH1SERPINB10SERPINB2SH3PXD2BSIGLEC16SIGLEC9SLED1SOCS3ST14STAB 1STEAP4TBC1D2TCN2TDRD9TMEM150BTMEM176ATMEM176BTNFAIP6TREM1TRIB1TSPOVSIG4 ARAP2BIRC3C12orf75CD160CD3GCENPKCEP78CLCCLEC2DCPA3DTHD1EPB41L4AFAM169AFCRL6FGFBP2GBP4GNLYHRH4IL18RAPJAKMIP2KLRA1PKLRC1KLRC3KLRC4-KLRK1KLRD1KLRF1KLRG1KPNA5MIR29AMS4A3MYBL1MYO6ODF2LPDGFDPRSS23RNU5A-1RORASAMD3SCARNA9SH2D1ASLC4A4SLCO4C1SNORA16BSNORA20SNORA75SNORD20SNORD28SNORD30SNORD45CSNORD50ASNORD54SNORD58ASNORD59ASNORD59BSNORD61SNORD81SNORD82SYTL2TARPTBC1D19TFDP2TGFBR3VPS13AZNF675ZNF737 ACSL1ADMAQP9BLVRBBST1CCR2CD14CD163CR1CYP1B1DSC2FAM20AFLVCR2FPR1FPR2FAM198BHPKCNJ15LILRA5MCEMP1MS4A4AMTARC1PLBD1PPARGQPCTRNASE2S100A12S100A9SERPINB2SH3PXD2BSTEAP4TCN2TDRD9TNFAIP6TSPO
    下载: 导出CSV

    表  2   共同转录因子预测结果(平均排名分≤30分)

    排名 转录因子 平均得分/分 转录因子数据库计算方法与得分 重叠基因
    1 CREB5 7.667 ARCHS4 Coexpression, 5分; Enrichr Queries, 14分; GTEx Coexpression, 4分 CR1STEAP4TNFAIP6ACSL1AQP9FPR1MCEMP1ADMFPR2LILRA5BST1QPCTPLBD1CYP1B1CD14S100A9CCR2
    2 MTF1 8.500 ARCHS4 Coexpression, 6分; GTEx Coexpression, 11分 CR1SERPINB2TNFAIP6ACSL1AQP9FPR1FPR2LILRA5BST1PLBD1CYP1B1FLVCR2CD14S100A9
    3 NFE4 9.000 GTEx Coexpression, 9分 BST1CR1AQP9FPR1PLBD1MCEMP1FPR2LILRA5CCR2
    4 SPI1 9.667 Literature ChIP-seq, 5分; ARCHS4 Coexpression, 11分; ENCODE ChIP-seq, 8分; Enrichr Queries, 11分; ReMap ChIP-seq, 5分; GTEx Coexpression, 18分 CD163CR1STEAP4SERPINB2ACSL1AQP9FPR1TDRD9MCEMP1FPR2RNASE2LILRA5MS4A4ABST1QPCTPLBD1CYP1B1CD14S100A9CCR2
    5 ZNF467 19.333 ARCHS4 Coexpression, 18分; Enrichr Queries, 30分; GTEx Coexpression, 10分 CR1AQP9FPR1MCEMP1ADMFPR2LILRA5BST1PLBD1CYP1B1BLVRBCD14S100A9CCR2
    6 NFE2 21.000 ARCHS4 Coexpression, 16分; ENCODE ChIP-seq, 78分; Enrichr Queries, 1分; ReMap ChIP-seq, 8分; GTEx Coexpression, 2分 CR1SERPINB2AQP9FPR1MCEMP1ADMFPR2RNASE2LILRA5BST1TCN2QPCTPLBD1S100A12BLVRBTSPOCYP1B1PPARGCD14S100A9CCR2
    7 TFEC 21.667 ARCHS4 Coexpression, 21分; Enrichr Queries, 4分; GTEx Coexpression, 40分 CD163CR1SERPINB2TNFAIP6ACSL1AQP9FPR1MS4A4ABST1TCN2FLVCR2PPARGCD14S100A9CCR2
    8 MXD1 23.000 ARCHS4 Coexpression, 4分; Enrichr Queries, 9分; GTEx Coexpression, 56分 CR1SERPINB2STEAP4ACSL1AQP9FPR1ADMFPR2LILRA5BST1PLBD1CYP1B1CD14S100A9
    9 NR1H3 26.600 Literature ChIP-seq, 10分; ARCHS4 Coexpression, 17分; Enrichr Queries, 10分; ReMap ChIP-seq, 36分; GTEx Coexpression, 60分 CD163STEAP4TCN2ACSL1FLVCR2CYP1B1PPARGADMCD14S100A9MS4A4A
    10 BORCS8MEF2B 29.000 ARCHS4 Coexpression, 29分 AQP9FPR1TSPOFPR2S100A9LILRA5
    11 NFIL3 30.000 ARCHS4 Coexpression, 1分; Enrichr Queries, 21分; GTEx Coexpression, 68分 CR1TNFAIP6ACSL1AQP9FPR1ADMFPR2LILRA5MS4A4ABST1CYP1B1PLBD1CD14S100A9
    12 CEBPE 30.000 ARCHS4 Coexpression, 31分; Enrichr Queries, 12分; GTEx Coexpression, 47分 BST1FPR1PLBD1ADMMCEMP1FPR2CD14RNASE2S100A9CCR2LILRA5
    计算方法包括ARCHS4 Coexpression、ENCODE ChIP-seq、Enrichr Queries、GTEx Coexpression、Literature ChIP-seq、ReMap ChIP-seq; 平均得分为各计算方法得分之和除以计算方法数量所得之商。
    下载: 导出CSV
  • [1]

    ZHAO D, LIU J, WANG M, et al. Epidemiology of cardiovascular disease in China: current features and implications[J]. Nat Rev Cardiol, 2019, 16(4): 203-212. doi: 10.1038/s41569-018-0119-4

    [2] 商广芸, 高燕飞, 曹洪波, 等. 急性心肌梗死的危险因素分析[J]. 实用临床医药杂志, 2020, 24(12): 48-50. https://www.cnki.com.cn/Article/CJFDTOTAL-XYZL202012015.htm
    [3]

    WEIL B R, NEELAMEGHAM S. Selectins and immune cells in acute myocardial infarction and post-infarction ventricular remodeling: pathophysiology and novel treatments[J]. Front Immunol, 2019, 10: 300. doi: 10.3389/fimmu.2019.00300

    [4]

    DE WINTER R J, KOSTER R W, STURK A, et al. Value of myoglobin, troponin T, and CK-MBmass in ruling out an acute myocardial infarction in the emergency room[J]. Circulation, 1995, 92(12): 3401-3407. doi: 10.1161/01.CIR.92.12.3401

    [5]

    DE LEMOS J A, DRAZNER M H, OMLAND T, et al. Association of troponin T detected with a highly sensitive assay and cardiac structure and mortality risk in the general population[J]. JAMA, 2010, 304(22): 2503-2512. doi: 10.1001/jama.2010.1768

    [6]

    GE Y, WANG T J. Identifying novel biomarkers for cardiovascular disease risk prediction[J]. J Intern Med, 2012, 272(5): 430-439. doi: 10.1111/j.1365-2796.2012.02589.x

    [7]

    WANG Y, ZHANG X Y, DUAN M, et al. Identification of potential biomarkers associated with acute myocardial infarction by weighted gene coexpression network analysis[J]. Oxid Med Cell Longev, 2021, 2021: 5553811.

    [8]

    SEN P, KEMPPAINEN E, OREŠIC M. Perspectives on systems modeling of human peripheral blood mononuclear cells[J]. Front Mol Biosci, 2017, 4: 96.

    [9]

    BARRETT T, WILHITE S E, LEDOUX P, et al. NCBI GEO: archive for functional genomics data sets: update[J]. Nucleic Acids Res, 2013, 41(Database issue): D991-D995.

    [10]

    MACIEJAK A, KILISZEK M, MICHALAK M, et al. Gene expression profiling reveals potential prognostic biomarkers associated with the progression of heart failure[J]. Genome Med, 2015, 7(1): 26. doi: 10.1186/s13073-015-0149-z

    [11]

    LANGFELDER P, HORVATH S. WGCNA: an R package for weighted correlation network analysis[J]. BMC Bioinformatics, 2008, 9: 559. doi: 10.1186/1471-2105-9-559

    [12]

    DAS S, MEHER P K, RAI A, et al. Statistical approaches for gene selection, hub gene identification and module interaction in gene co-expression network analysis: an application to aluminum stress in soybean (glycine max l. )[J]. PLoS One, 2017, 12(1): e0169605. doi: 10.1371/journal.pone.0169605

    [13] 朱宝华, 孙岩. 冠状动脉疾病差异基因富集和加权基因共表达网络分析[J]. 实用临床医药杂志, 2021, 25(17): 15-21. doi: 10.7619/jcmp.20212119
    [14]

    YU G C, WANG L G, HAN Y Y, et al. clusterProfiler: an R package for comparing biological themes among gene clusters[J]. OMICS, 2012, 16(5): 284-287. doi: 10.1089/omi.2011.0118

    [15]

    RITCHIE M E, PHIPSON B, WU D, et al. Limma Powers differential expression analyses for RNA-sequencing and microarray studies[J]. Nucleic Acids Res, 2015, 43(7): e47. doi: 10.1093/nar/gkv007

    [16]

    KEENAN A B, TORRE D, LACHMANN A, et al. ChEA3: transcription factor enrichment analysis by orthogonal omics integration[J]. Nucleic Acids Res, 2019, 47(W1): W212-W224. doi: 10.1093/nar/gkz446

    [17]

    FU Z J, XU Y Q, CHEN Y, et al. Construction of miRNA-mRNA-TF regulatory network for diagnosis of gastric cancer[J]. Biomed Res Int, 2021, 2021: 9121478.

    [18]

    SZKLARCZYK D, GABLE A L, NASTOU K C, et al. The STRING database in 2021: customizable protein-protein networks, and functional characterization of user-uploaded gene/measurement sets[J]. Nucleic Acids Res, 2021, 49(D1): D605-D612. doi: 10.1093/nar/gkaa1074

    [19]

    SHANNON P, MARKIEL A, OZIER O, et al. Cytoscape: a software environment for integrated models of biomolecular interaction networks[J]. Genome Res, 2003, 13(11): 2498-2504. doi: 10.1101/gr.1239303

    [20]

    MCELIGOT A J, POYNOR V, SHARMA R, et al. Logistic LASSO regression for dietary intakes and breast cancer[J]. Nutrients, 2020, 12(9): 2652. doi: 10.3390/nu12092652

    [21]

    ENGEBRETSEN S, BOHLIN J. Statistical predictions with glmnet[J]. Clin Epigenetics, 2019, 11(1): 123. doi: 10.1186/s13148-019-0730-1

    [22]

    ROBIN X, TURCK N, HAINARD A, et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves[J]. BMC Bioinformatics, 2011, 12: 77. doi: 10.1186/1471-2105-12-77

    [23]

    SUBRAMANIAN A, TAMAYO P, MOOTHA V K, et al. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles[J]. Proc Natl Acad Sci USA, 2005, 102(43): 15545-15550. doi: 10.1073/pnas.0506580102

    [24]

    GUO L, AKAHORI H, HARARI E, et al. CD163+ macrophages promote angiogenesis and vascular permeability accompanied by inflammation in atherosclerosis[J]. J Clin Invest, 2018, 128(3): 1106-1124. doi: 10.1172/JCI93025

    [25]

    WU T F, CHEN Y X, YANG L Y, et al. Ribonuclease A family member 2 promotes the malignant progression of glioma through the PI3K/Akt signaling pathway[J]. Front Oncol, 2022, 12: 921083. doi: 10.3389/fonc.2022.921083

    [26]

    LI L L, SAIYIN W, ZHANG H, et al. FAM20A is essential for amelogenesis, but is dispensable for dentinogenesis[J]. J Mol Histol, 2019, 50(6): 581-591. doi: 10.1007/s10735-019-09851-x

    [27]

    RAMAN K, O'DONNELL M J, CZLONKOWSKA A, et al. Peripheral blood MCEMP1 gene expression as a biomarker for stroke prognosis[J]. Stroke, 2016, 47(3): 652-658. doi: 10.1161/STROKEAHA.115.011854

    [28]

    QIU L, LIU X. Identification of key genes involved in myocardial infarction[J]. Eur J Med Res, 2019, 24(1): 22. doi: 10.1186/s40001-019-0381-x

    [29]

    KILISZEK M, BURZYNSKA B, MICHALAK M, et al. Altered gene expression pattern in peripheral blood mononuclear cells in patients with acute myocardial infarction[J]. PLoS One, 2012, 7(11): e50054. doi: 10.1371/journal.pone.0050054

    [30]

    GURUNG R L, YIAMUNAA M, LIU S, et al. Association of haptoglobin phenotype with incident acute myocardial infarction in Chinese patients with type 2 diabetes[J]. Cardiovasc Diabetol, 2019, 18(1): 65. doi: 10.1186/s12933-019-0867-4

    [31]

    BLUM S, ASAF R, GUETTA J, et al. Haptoglobin genotype determines myocardial infarct size in diabetic mice[J]. J Am Coll Cardiol, 2007, 49(1): 82-87. doi: 10.1016/j.jacc.2006.08.044

    [32]

    HSU C Y, CHANG G C, CHEN Y J, et al. FAM198B is associated with prolonged survival and inhibits metastasis in lung adenocarcinoma via blockage of ERK-mediated MMP-1 expression[J]. Clin Cancer Res, 2018, 24(4): 916-926. doi: 10.1158/1078-0432.CCR-17-1347

  • 期刊类型引用(2)

    1. 于琪力,葛雪,刘丽. 冠状动脉粥样硬化性心脏病患者心力衰竭危险因素分析. 新乡医学院学报. 2024(06): 560-565 . 百度学术
    2. 孙宁,李飞. 心肌梗死患者血清miR-34a-5p和C1q/肿瘤坏死因子相关蛋白-9水平及其与心肌重构的相关性. 检验医学与临床. 2024(19): 2785-2789 . 百度学术

    其他类型引用(0)

图(5)  /  表(2)
计量
  • 文章访问数:  435
  • HTML全文浏览量:  100
  • PDF下载量:  46
  • 被引次数: 2
出版历程
  • 收稿日期:  2022-10-30
  • 网络出版日期:  2023-03-02
  • 刊出日期:  2023-02-14

目录

/

返回文章
返回