新芽专题介绍：计算病理前沿探索

Last updated on Oct 3, 2025

选择此专题并在新芽系列课程中获得优秀的同学，可以免去前期筛选考核流程，直接进入南开大学媒体计算团队以及国家人工智能学院等合作院校团队推免生招收面试的最后一轮。

一、专题介绍

1.1 研究背景

组织病理学是现代医学的基石，尤其在肿瘤学中，对染色组织切片的显微镜检查是疾病诊断和治疗决策的金标准。然而，传统病理诊断高度依赖病理医师的人工阅片，这是一个劳动密集型且受主观因素影响的过程。随着全切片数字扫描（WSI）技术获得临床批准并大规模部署，病理学迎来了数字化革命。WSI将传统的玻璃切片转化为十亿像素级的数字图像，为深度学习的应用提供了前所未有的海量数据，催生了计算病理学（Computational Pathology, CPath）这一交叉学科。

1.2 研究意义

计算病理学的核心目标是开发计算机辅助诊断（CAD）系统，以增强病理医师的工作流程，其研究意义体现在多个层面：

提升诊断精度与效率：通过提供客观、可量化的分析结果，减少观察者间的差异，并自动化繁琐任务（如细胞计数），从而提升诊断的准确性与效率。
赋能精准医疗：通过深度挖掘组织形态学特征，并将其与基因组学、临床数据等多模态信息融合，发现新的生物标志物，为患者提供个性化的预后判断和治疗方案。
推动病理学边界：AI模型能够识别人眼难以察觉的微观模式，揭示形态与分子层面之间潜在的关联，推动对疾病生物学机制的理解。

因此，计算病理学不仅是改善临床实践的关键技术，更是驱动精准医学发展的核心引擎。

▲ 一张典型的全切片数字影像（WSI，> 十亿像素），其巨大的数据量和复杂性为计算分析带来了挑战。

1.3 当前主要挑战

尽管前景广阔，但计算病理学的发展仍面临三大核心挑战，这些挑战也正是当前最前沿的研究方向：

挑战一：从“像素识别”到“语义理解”的鸿沟
- 当前主流的**基础模型（FM）+多示例学习（MIL）**范式在特定分类任务上表现出色，但其本质上是学习从图像模式到标签的映射，缺乏深度的病理学语义理解。
- 新兴的**视觉-语言模型（VLM）**试图通过对齐图像和病理报告文本来学习更丰富的语义，但其在泛癌种任务上的性能与高度优化的FM+MIL范式相比仍存在差距，如何融合二者优势是关键难题。
挑战二：数据异质性与标注瓶颈
- 不同医疗机构的制片、染色和扫描差异导致了严重的域偏移问题，影响模型泛化能力。同时，获取海量、高质量的专家标注数据成本极高。
- 统一的生成式模型，特别是基于扩散模型的虚拟染色技术，为实现数据标准化和数据增强提供了新思路。然而，如何生成临床上可信的高保真图像，并同时服务于下游的理解任务，是亟待解决的挑战。
挑战三：从“黑箱预测”到“可信推理”的障碍
- 多数深度学习模型的决策过程不透明，难以获得临床医生和监管机构的信任，这是阻碍其临床应用的主要障碍。
- **AI智能体（AI Agent）**范式被寄予厚望，它旨在模拟病理学家的诊断推理过程——制定计划、调用工具、综合证据。如何构建能够进行多步推理、解释其决策过程并与人类专家协同工作的AI智能体，是实现可信AI的终极探索。

综上，这三大挑战相互关联，共同构成了计算病理学从辅助工具迈向智能诊断伙伴的技术演进路线图。

二、学习资料与参考文献

为了引导新芽学子逐步进入研究，本专题结构分为以下四部分：

2.1 基础教材与学习材料

在开始探险之前，你需要掌握一些基础的“内功心法”，这些是后续一切学习的基石。以下是你可以使用的一些书籍/教程：

李沐《动手学深度学习》——适合中文初学者的深度学习教材，以及课程系列视频
《Deep Learning》（Ian Goodfellow 等）——深度学习入门经典教材
PyTorch 官方教程，也可以使用 PyTorch 中文文档
《Pattern Recognition and Machine Learning》（Christopher M. Bishop）——机器学习原理入门（难度不小）

此外，你也可以使用一些入门工具：

Google Colab：免费云平台，不用安装软件，就能跑PyTorch代码。
Kaggle平台：免费数据集和竞赛

Tips：务必摆脱所有基础都打好后，再进行下一阶段学习的心态，在干中学，遇到不明白的再回溯补基础。

2.2 入门文献（计算病理学基础综述）

学生第一阶段的阅读训练，可帮助理解计算病理学的核心概念与发展脉络和相关基础技术。仅用于入门，不可选择此部分文献汇报。

A New Era in Computational Pathology: A Survey on Foundation and Vision-Language Models (arXiv 2024)
- 一篇对计算病理学中基础模型（FM）和视觉-语言模型（VLM）进行全面系统概述的最新综述，是理解当前前沿的绝佳起点。
Weakly-supervised deep learning models in computational pathology (EBioMedicine 2022)
- 介绍了在仅有切片级标签的情况下，如何使用多示例学习（MIL）框架进行模型训练，这是CPath领域最核心的弱监督学习范式。
Computational pathology: A survey review and the way forward (Journal of Pathology Informatics 2024)
- 系统性地回顾了CPath领域面临的数据、模型和应用层面的挑战，并对未来发展方向进行了展望。
Deep Learning and Its Applications in Computational Pathology (BioMedInformatics 2022)
- 回顾了包括CNN、GAN等在内的流行深度学习方法及其在病理学中的应用。
A Survey on Computational Pathology Foundation Models (arXiv 2025)
- 全面回顾了病理学基础模型的数据集、自适应策略和评估任务，适合深入了解FM。
CycleGAN: Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks (ICCV 2017)
Pix2Pix: Image-to-Image Translation with Conditional Adversarial Networks (CVPR 2017)
VIT: An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale (ICLR 2021)
ReACT: ReAct: Synergizing Reasoning and Acting in Language Models (ICLR 2023)

2.3 进阶文献（三大挑战的前沿探索）

结合本专题的研究背景，此部分文献聚焦于三大挑战的最前沿工作。学生可在此部分选择文献进行专题汇报，或自行查找最新的同类重要文献。

挑战一：VLM泛癌模型 vs. FM+MIL范式

PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology (arXiv 2025)
SlideChat: A Large Vision-Language Assistant for Whole-Slide Pathology Image Understanding (CVPR 2025)
HIPT: Hierarchical Image Pyramid Transformer (Nature Medicine 2022)
UNI: A Unified Foundation Model for Multi-modal CPath (Nature Medicine 2024)
Virchow: A 1.5-million-slide computational pathology foundation model (arXiv 2023)
CONCH: CONtrastive learning from Captions for Histopathology (Nature Biomedical Engineering 2024)
MR-PLIP: Multi-Resolution Pathology-Language Pre-training Model (CVPR 2025)
TITAN: A multimodal whole slide foundation model (arXiv 2024)
Quilt-LLaVA: A Multi-modal Large Language Model for Pathology (arXiv 2024)

挑战二：统一生成理解模型（虚拟染色）

HealthGPT: A MedicalLargeVision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation (arXiv 2025)
Uni Model Survey: Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities (arXiv 2025)
Stain Survey: Content Generation Models in Computational Pathology: A Comprehensive Survey on Methods, Applications, and Challenges (arXiv 2025)
LPFM: A Unified Low-level Foundation Model for Enhancing Pathology Image Quality (arXiv 2025)
PaPIS: Pathology-Guided Virtual Staining Metric for Evaluation and Training (arXiv 2025)
StainDiff: Controllable and Efficient Multi-Class Pathology Nuclei Data Augmentation using Text-Conditioned Diffusion Models (MICCAI 2024)
VLM-Prompt-GAN: VLM-based Prompts as the Optimal Assistant for Unpaired Histopathology Virtual Staining (arXiv 2025)
GANs vs. Diffusion Models: GANs vs. Diffusion Models for virtual staining with the HER2match dataset (arXiv 2025)
Stain-DDPM: A Diffusion-based Data Augmentation Method for Histopathology Images (MICCAI 2023)
PathLDM: A Latent Diffusion Model for Histopathology Image Generation and Restoration (arXiv 2023)

挑战三：AI智能体（推理与可解释性）

SlideSeek: A Clinical-Grade Agentic and Generative AI-driven Copilot for Human Pathology (arXiv 2025)
AURA: A Multi-Modal Medical Agent for Understanding, Reasoning & Annotation (arXiv 2025)
ArgMed-Agents: ArgMed-Agents: Explainable Clinical Decision Reasoning with LLM Discussion via Argumentation Schemes (arXiv 2024)
SmartPath-R1: A Versatile Pathology Co-pilot via Reasoning Enhanced Multimodal Large Language Model (arXiv 2025)
PathChat+: An Agentic and Generative AI-driven Copilot for Human Pathology (arXiv 2025)
Med-Agents: Self-discovery of Cognitive Tools for Medical Question Answering by Large Language Models (Nature 2024)
Agent-Bio: A Large Language Model-based Agent for Collaborative Biomedical Research (Nature Biotechnology 2024)
Pathfinder: An AI agent for histopathology slide navigation and interpretation (npj Digital Medicine 2024)
XAI-Path: Explainable AI for computational pathology identifies model limitations and tissue biomarkers (Nature Communications 2025)

三、结语与期望

“新芽计划”的初衷是点燃新芽学子对未知探索的热情，并为大家提供一片成长的沃土。计算病理学是一个充满挑战与机遇的领域，它既是精准医疗的“硬骨头”，也是AI技术创新的“试金石”。希望通过这个专题，新芽学子不仅能学到前沿的AI知识，更能培养出独立思考、动手实践和解决复杂问题的能力。

我们热切期待，在最终的汇报中，能看到大家闪耀着智慧火花的解读与创见！