9种常见生信图解读全攻略（附文献案例）- 医嘉研

生信分析已经成为医学科研的热门方向，无论是想发SCI、毕业答辩，还是申博晋升，掌握生信技能都成了科研人的必备能力。

但对于刚入门的科研小白来说，最大的困扰往往不是没有数据，而是看不懂文献里五花八门的生信图。

明明图就在眼前，却读不懂里面的生物学故事；甚至连图的类型和核心价值都分不清楚，导致：

❌ 阅读文献时，一扫而过，抓不住关键信息

❌ 数据分析卡壳，不知道该用哪种图来呈现结果

❌ 写论文时，看着图表却不知道如何描述和讨论

今天，我们就一次性把9种最常见的生信图掰开揉碎了讲清楚，让你不仅看得懂，更能用得上！

01 | ROC曲线图：模型性能评估的利器

【案例来源】

文章："Machine learning and SHAP value interpretation for predicting comorbidity of cardiovascular disease and cancer with dietary antioxidants"，Fig.3A

【核心解读方法】

高TPR + 低FPR = 曲线越靠近左上角，性能越好

【实例分析】

在这5个机器学习模型中：

• LightGBM整体最靠近左上角 → 综合性能最佳

• NB更靠近对角线 → 性能最弱

• 优先选择LightGBM模型，如需更精确判断可计算AUC（曲线下面积）

02 | PPI网络图：蛋白互作关系可视化

【案例来源】

文章："Network toxicological and single-cell sequencing reveals the potential mechanisms of psoriatic toxicity of polybrominated diphenyl ethers"，Fig.1B

研究对象：PBDEs和银屑病之间的139个重叠靶点

【关键要素】

① 聚焦橙色节点（高degree）：圆圈颜色越深，蛋白质间相互作用可信度越高

② 关注蓝色连线：连接线越趋近于蓝色，相互作用可靠度越高

③ 子网络划分：通过节点聚焦和边的连接度可进一步划分子网络

03 | 韦恩图：算法交集分析

【案例来源】

文章："Investigating the potential risk of cadmium exposure on Osteoporosis: An integrated multi-omics approach"，Fig.3C

应用场景：机器学习方法识别关键基因

【区域解读】

① 左侧蓝色区域：SVM算法独有的关键基因4个（占比28.6%）

② 右侧橙色区域：RandomForest算法独有的关键基因4个（占比28.6%）

③ 重叠区域：两种算法共同筛选出6个关键基因（占比42.9%）

包括：FOXO3、CCND1、MAP1LC3B、HMOX1、EGFR、MT1G

04 | GO富集直方图：功能通路可视化

【案例来源】

文章："Network toxicological and single-cell sequencing reveals the potential mechanisms of psoriatic toxicity of polybrominated diphenyl ethers"，Fig.2

研究内容：探索PBDE诱导的潜在皮肤毒性中重叠靶点的生物学功能

【解读要点】

① GO分类：基因本体中生物过程相关条目，对基因功能进行系统分类

② 矩形条长度：代表生物过程的富集程度，越长越显著

③ P值排序：10个条目按P值排序，P值越小越显著

【图表价值】

直观展示"哪些生物过程在目标基因集中被显著富集"，帮助理解基因主要参与的生物学功能

05 | 相关性热图：多维数据关联分析

【案例来源】

文章："Pan-cancer and multi-omics analysis：NDUFA1 is a potential therapeutic target and prognostic marker for esophageal cancer"，Fig.3A

【坐标轴解读】

• Y轴：24种免疫细胞类型

• X轴：33种癌症类型

【颜色含义】

• 红色 = 正相关（颜色越深，正相关越强）

• 蓝色 = 负相关（颜色越深，负相关越强）

• 标注 p < 0.05 = 相关性统计显著

【关键发现】

T helper cells、TCM、TEM、TFH几个免疫细胞在半数以上癌种呈深蓝色负相关，说明这些免疫细胞能有效抑制抗肿瘤免疫浸润

06 | Co-IP图：蛋白互作验证

【案例来源】

文章："Overexpression of STX11 alleviates pulmonary fibrosis by inhibiting fibroblast activation via the PI3K/AKT/mTOR pathway"，Fig.3n

实验目的：验证STX11是否能够与SNAP25结合

【泳道解读】

① Input：细胞裂解后的总蛋白提取物，证明目标蛋白存在（有清晰条带=有表达）

② IgG：阴性对照，模拟非特异性结合（无或极弱条带=结果可靠）

③ 沉淀抗体：使用STX11或SNAP25进行免疫沉淀

④ 检测抗体：IB/WB所使用的抗体

⑤ kDa分子量标记：指示蛋白条带大小

⑥ 条带判读：Input列两条带都有；IgG列无或很弱；目标抗体列两条带都有→证明蛋白相互作用

07 | 箱线图：模型性能对比

【案例来源】

文章："Machine learning and SHAP value interpretation for predicting comorbidity of cardiovascular disease and cancer with dietary antioxidants"，Fig.3

应用场景：比较5种机器学习模型预测"心血管疾病与癌症共病"时的AUC表现

【坐标轴】

• 横轴：R-PART、RF、K-NN、NB、LightGBM 5种模型

• 纵轴AUC：模型预测能力指标（范围0-1，数值越高预测越准）

【性能判读】

• RF、LightGBM：AUC中位数≈0.95，箱体窄、须线短 → 预测能力强且稳定

• K-NN：AUC中位数≈0.88，箱体宽、须线长 → 预测能力中等，稳定性一般

08 | 火山图：差异基因筛选

【案例来源】

文章："Investigating the potential risk of cadmium exposure on Osteoporosis: An integrated multi-omics approach"，Fig.2E

研究目的：探索关键基因的潜在生物学功能

【坐标含义】

① 横坐标（Log₂FC）：倍数变化的对数值

• 正值 = 基因表达上调

• 负值 = 基因表达下调

② 纵坐标（-Log₁₀(P.Value)）：P值的负对数值，数值越大差异越显著

③ 颜色梯度：红色=上调，蓝色=下调，颜色越深P值越小

【典型基因】

• 显著上调：FOXO3等（Log₂FC为正，-Log₁₀(P.Value)数值大）

• 显著下调：CCND1等（Log₂FC为负，-Log₁₀(P.Value)数值大）

09 | GSEA图：基因集富集分析

【案例来源】

文章："Investigating the potential risk of cadmium exposure on Osteoporosis: An integrated multi-omics approach"，Fig.4i

研究内容：测试HMOX1与巨噬细胞的功能和细胞间相互作用

【关键元素】

① ES曲线：判断富集方向与强度

曲线先上升至峰值后下降 → M2巨噬细胞极化相关基因在排名靠前区域富集显著

② 显著性指标：均远小于0.05 → 富集具有统计学意义

③ 基因分布条带：黑色线条展示每个基因在排序列表中的位置

④ 热图+面积图：

• 热图：红色=高相关，蓝色=低相关

• 灰色面积图：排序指标的连续分布

看到这里，相信你对这9种常见生信图已经有了清晰的认识。

但知易行难——会看图和会做图，中间隔着的是数据处理、统计分析、代码实现的整套技能。

很多科研人在这一步卡住了：

• 自学太费时间，网上教程零散不成体系

• 跟着教程做完了，换个数据就不会了

• 遇到问题没人问，一个报错卡三天

• 做出来的图不知道对不对，能不能发表

如果你也有这样的困扰，不妨试试「换一种学习方式」——

医嘉研 1V1 生信分析指导

不是卖课程，是真人带练

根据你的研究方向和数据，定制专属分析方案

不只教操作，更讲逻辑

为什么用这个图？参数怎么调？结果怎么解读？一个个掰开了讲

不限次答疑，直到发表

从数据清洗到论文投稿，全程有人陪你解决问题

比起自己摸索浪费的时间和试错成本

让专业的人带你走专业的路，或许是更明智的选择

生信分析全程辅导

想突破生信分析瓶颈，发表高水平SCI？医嘉研提供"选题-数据获取-分析-写作-投稿"全流程一对一指导，涵盖九大服务维度，从开题到发表全程护航！

医嘉研生信分析一对一服务

核心竞争力

◆资深团队背书：生信分析专家团队均具备生物信息学与统计学双背景，导师均具备生信研究SCI发表经验。

◆全流程一对一：覆盖"选题-数据-分析-写作-投稿"全流程，无缝衔接各环节，一对一服务贯穿全程。

◆数据安全保障：签署严格的保密协议、拥有自建数据管理系统，杜绝数据泄露风险。

◆时效性承诺：从开题到返修每个阶段响应时间<24小时，高效缩短平均投稿周期。

服务说明

服务期限：自首次投稿开始，为期12个月不限次指导选刊、投稿、返修

开票方式：可联系项目顾问，开具电子发票，抬头可为单位或个人

签署协议：所有套餐皆可签署对应的套餐协议（合同），保障服务

更多服务

医嘉研专注于提供医学科研服务，不论您是需要发SCI还是国内核心，都可以联系我们！主要方向如下：

Meta分析

经典meta，网状meta，预测模型meta等等，医护全领域各类meta分析！

临床研究

Minic数据库挖掘、NHanes数据库、GBD数据库、Charls数据库、临床真实数据（已有数据或制定数据收集方案）

生信分析

转录组、单细胞测序、蛋白组、基因组、代谢组、孟德尔随机化、网络药理学、分子对接、多组学+机器学习等各类生信分析指导服务！

扫码了解更多内容

医嘉研专注于医学科研1V1指导

? 配套实验服务

如果你在临床研究或生信分析过程中需要配套的湿实验支持，医嘉研同步提供分子生物学实验服务、细胞实验服务、动物实验服务等一站式外包，覆盖完整的细胞生物学实验与分子生物学实验流程，从课题设计到数据产出全程辅助，让你的SCI研究更扎实。

超全面的常见生信图解集合来了！（附案例）

需要科研辅导服务？

超全面的常见生信图解集合来了！（附案例）

需要科研辅导服务？

用户登录