鼻息肉新药临床试验 为什么越来越离不开独立影像评估(IRC)?

2026-06-10

19

慢性鼻窦炎伴鼻息肉(CRSwNP)的新药研发,尤其是生物制剂赛道,正在全球呼吸领域持续升温。

 

 

这不是偶然。鼻息肉患者病程长、复发率高,传统糖皮质激素和手术治疗后仍有大量患者反复发作——临床需求明确且迫切。但新药能否最终获批上市,关键不在于概念多热、融资多少,而在于一件事:

 

能不能在临床试验中

拿出无可辩驳的疗效证据

 

而在所有疗效证据中,影像终点是最客观、最难被挑战的那一块基石。很多申办方在设计试验时会把大量精力放在入组速度和中心管理上,却往往忽略了一个关键问题——你的主要终点,真的经得起监管机构 scrutiny(审查)吗?

 

01.

鼻息肉试验的"终极大考":

Lund-Mackay 评分

 

先看事实。目前鼻息肉新药临床试验中最常见的终点指标包括:

 

 

其中,Lund-Mackay 鼻窦CT评分的变化已被 FDA 和 EMA 多次在指导原则中认可为最具说服力的客观终点。不少 III 期注册研究直接将其作为共同主要终点(co-primary endpoint)或关键次要终点——这本身就说明了它的分量。

 

Lund-Mackay 评分系统对双侧鼻腔窦腔(上颌窦、前组筛窦、后组筛窦、蝶窦、额窦)及鼻道各赋 0–3 分,总分 0–24 分。分数越高,病变越重。这个评分体系的优势在于:标准化程度高、可重复性好、跨中心可比性强。

 

但问题恰恰出在这里——"可比性强"不代表"天然可比"。

 

02.

多中心试验的隐形陷阱:

你以为的"标准",可能并不标准

 

想象一个典型的 III 期场景:

  • 50 家研究中心,分布在不同国家
  • CT 设备品牌不同、层厚设置不同
  • 放射科医生经验差异巨大——有的每天阅片几十例鼻窦 CT,有的一年也见不了几例
  • 对"部分黏膜增厚"和"完全充盈"的判断尺度,天然存在个体差异

 

如果每家中心自行阅片并上报 Lund-Mackay 评分,会发生什么?

 

⚠ 系统误差会被放大。

 

有的中心倾向打高分,有的倾向保守;同一份影像,A中心评 12 分,B 中心可能评9分。当这些数据汇总到统计分析中,偏倚不是被平均掉,而是被固化进最终结果里。

 

更严峻的是——监管机构对此心知肚明。FDA 在多项审评意见中明确提出:对于以影像评估为主要或关键终点的试验,建议或要求采用独立第三方盲态评估(IRC)。

 

换句话说:

 

IRC 不是锦上添花

而是越来越多的场景下,它正在成为一道必答题

 

03.

IRC

到底解决了什么问题?

 

独立影像评审委员会(Independent Review Committee / Central Imaging Review),核心价值可以概括为四个字:统一标尺。

 

具体来说,独立影像评估(IRC) 通过以下机制消除多中心影像评估中的偏倚:

 

① 集中化盲态阅片

所有受试者的基线和随访影像汇集至 IRC 中心,由经过培训的放射科专科医师在盲态下(不知晓治疗分组、临床信息)进行独立评判。从根本上阻断期望偏倚(expectation bias)。

 

② 标准化的评估手册

在试验启动前,IRC 协助申办方制定详细的影像评估手册(Imaging Assessment Manual),明确每一项评分细则:

 

  • CT 扫描参数要求(层厚≤1mm 或 ≤1.25mm、骨窗+软组织窗重建)‘’
  • 各窦腔评分的边界定义(什么算"1分"、什么算"2分")
  • 基线与访视的时间窗规定
  • 影像质量不合格的判定标准

 

→ 这本手册不是摆设——它是所有阅片医师必须遵守的操作宪法,也是后续监管核查时的依据文件。

 

③ 一致性训练与质控

正式阅片前,IRC 团队需进行一致性测试(reader calibration exercise),确保多名阅片者之间的评分一致性达到预设阈值(通常 Kappa 值 >0.6–0.8)。试验执行过程中持续进行质量监控,发现异常及时干预。

 

④ 复核与仲裁机制

遇到边缘病例(borderline cases)、术后改变合并炎症、或初次评分与中心评分差异较大等情况,启动复核流程——由高年资医师二次判定,必要时提交仲裁委员会讨论。每一个结论都有据可查、有迹可循。

 

⑤ 全程留痕,审计友好

所有阅片记录、评分痕迹、疑问处理(query)、复核意见均完整存档,满足 FDA 21 CFR Part 11 及 GCP 对数据完整性(ALCOA+ 原则)的要求。

 

04.

从方案到申报:

IRC 贯穿全周期

 

一个设计良好的鼻息肉IRC项目,其工作起点远早于第一张CT影像的上传:

 

方案设计阶段

参与方案讨论 → 制定影像采集规范 → 编写/审核评估手册 → 设计随机化前影像合格筛查流程

 

试验执行阶段

逐例基线/访视影像盲态独立评分 → 计算 LM 总分及分项变化值 → 判定临床获益阈值 → 处理 query 与不合格影像管理

 

数据锁定与申报阶段

提供最终 IRC 评分数据库 → 撰写方法学与结果报告 → 配合敏感性分析 → 支持监管问询与核查

 

写在最后

 

鼻息肉新药研发的竞争正在加剧。当多个生物制剂在同一路径上角逐,试验设计的科学性和数据质量的可靠性就成了区分胜负的关键变量。

 

对于依赖影像评分作为核心终点的研究来说,IRC 已经从"可选项"逐渐演变为"必需项"。它不是一项形式主义的合规动作,而是真正能够提升数据可信度、降低研发风险、加速审评进程的战略投入。

 

选择一家在耳鼻喉(ENT)/呼吸领域有实际项目经验的 IRC 服务商,从方案阶段就深度介入,是值得认真考虑的一步棋。

 

声明:

本文内容仅供行业交流与学习参考,不构成任何形式的法律、注册或商业建议,如发现任何不当或错误之处,恳请业内同道不吝批评指正,欢迎在评论区留言交流,我们将及时核实与完善。由于药物研发具有高度复杂性,具体项目执行请以现行法律法规及监管机构的最新要求为准。

 

在线
咨询