鼻息肉新药临床试验为什么越来越离不开独立影像评估（IRC）？

热点推荐

2026-06-10

536

慢性鼻窦炎伴鼻息肉（CRSwNP）的新药研发，尤其是生物制剂赛道，正在全球呼吸领域持续升温。

这不是偶然。鼻息肉患者病程长、复发率高，传统糖皮质激素和手术治疗后仍有大量患者反复发作——临床需求明确且迫切。但新药能否最终获批上市，关键不在于概念多热、融资多少，而在于一件事：

能不能在临床试验中

拿出无可辩驳的疗效证据

而在所有疗效证据中，影像终点是最客观、最难被挑战的那一块基石。很多申办方在设计试验时会把大量精力放在入组速度和中心管理上，却往往忽略了一个关键问题——你的主要终点，真的经得起监管机构 scrutiny（审查）吗？

01.

鼻息肉试验的"终极大考"：

Lund-Mackay 评分

先看事实。目前鼻息肉新药临床试验中最常见的终点指标包括：

其中，Lund-Mackay 鼻窦CT评分的变化已被 FDA 和 EMA 多次在指导原则中认可为最具说服力的客观终点。不少 III 期注册研究直接将其作为共同主要终点（co-primary endpoint）或关键次要终点——这本身就说明了它的分量。

Lund-Mackay 评分系统对双侧鼻腔窦腔（上颌窦、前组筛窦、后组筛窦、蝶窦、额窦）及鼻道各赋 0–3 分，总分 0–24 分。分数越高，病变越重。这个评分体系的优势在于：标准化程度高、可重复性好、跨中心可比性强。

但问题恰恰出在这里——"可比性强"不代表"天然可比"。

02.

多中心试验的隐形陷阱：

你以为的"标准"，可能并不标准

想象一个典型的 III 期场景：

50 家研究中心，分布在不同国家
CT 设备品牌不同、层厚设置不同
放射科医生经验差异巨大——有的每天阅片几十例鼻窦 CT，有的一年也见不了几例
对"部分黏膜增厚"和"完全充盈"的判断尺度，天然存在个体差异

如果每家中心自行阅片并上报 Lund-Mackay 评分，会发生什么？

⚠ 系统误差会被放大。

有的中心倾向打高分，有的倾向保守；同一份影像，A中心评 12 分，B 中心可能评9分。当这些数据汇总到统计分析中，偏倚不是被平均掉，而是被固化进最终结果里。

更严峻的是——监管机构对此心知肚明。FDA 在多项审评意见中明确提出：对于以影像评估为主要或关键终点的试验，建议或要求采用独立第三方盲态评估（IRC）。

换句话说：

IRC 不是锦上添花

而是越来越多的场景下，它正在成为一道必答题

03.

IRC

到底解决了什么问题？

独立影像评审委员会（Independent Review Committee / Central Imaging Review），核心价值可以概括为四个字：统一标尺。

具体来说，独立影像评估（IRC）通过以下机制消除多中心影像评估中的偏倚：

① 集中化盲态阅片

所有受试者的基线和随访影像汇集至 IRC 中心，由经过培训的放射科专科医师在盲态下（不知晓治疗分组、临床信息）进行独立评判。从根本上阻断期望偏倚（expectation bias）。

② 标准化的评估手册

在试验启动前，IRC 协助申办方制定详细的影像评估手册（Imaging Assessment Manual），明确每一项评分细则：

CT 扫描参数要求（层厚≤1mm 或 ≤1.25mm、骨窗+软组织窗重建）‘’
各窦腔评分的边界定义（什么算"1分"、什么算"2分"）
基线与访视的时间窗规定
影像质量不合格的判定标准

→ 这本手册不是摆设——它是所有阅片医师必须遵守的操作宪法，也是后续监管核查时的依据文件。

③ 一致性训练与质控

正式阅片前，IRC 团队需进行一致性测试（reader calibration exercise），确保多名阅片者之间的评分一致性达到预设阈值（通常 Kappa 值 >0.6–0.8）。试验执行过程中持续进行质量监控，发现异常及时干预。

④ 复核与仲裁机制

遇到边缘病例（borderline cases）、术后改变合并炎症、或初次评分与中心评分差异较大等情况，启动复核流程——由高年资医师二次判定，必要时提交仲裁委员会讨论。每一个结论都有据可查、有迹可循。

⑤ 全程留痕，审计友好

所有阅片记录、评分痕迹、疑问处理（query）、复核意见均完整存档，满足 FDA 21 CFR Part 11 及 GCP 对数据完整性（ALCOA+ 原则）的要求。

04.

从方案到申报：

IRC 贯穿全周期

一个设计良好的鼻息肉IRC项目，其工作起点远早于第一张CT影像的上传:

方案设计阶段

参与方案讨论 → 制定影像采集规范 → 编写/审核评估手册 → 设计随机化前影像合格筛查流程

试验执行阶段

逐例基线/访视影像盲态独立评分 → 计算 LM 总分及分项变化值 → 判定临床获益阈值 → 处理 query 与不合格影像管理

数据锁定与申报阶段

提供最终 IRC 评分数据库 → 撰写方法学与结果报告 → 配合敏感性分析 → 支持监管问询与核查

写在最后

鼻息肉新药研发的竞争正在加剧。当多个生物制剂在同一路径上角逐，试验设计的科学性和数据质量的可靠性就成了区分胜负的关键变量。

对于依赖影像评分作为核心终点的研究来说，IRC 已经从"可选项"逐渐演变为"必需项"。它不是一项形式主义的合规动作，而是真正能够提升数据可信度、降低研发风险、加速审评进程的战略投入。

选择一家在耳鼻喉（ENT）/呼吸领域有实际项目经验的 IRC 服务商，从方案阶段就深度介入，是值得认真考虑的一步棋。

声明：

本文内容仅供行业交流与学习参考，不构成任何形式的法律、注册或商业建议，如发现任何不当或错误之处，恳请业内同道不吝批评指正，欢迎在评论区留言交流，我们将及时核实与完善。由于药物研发具有高度复杂性，具体项目执行请以现行法律法规及监管机构的最新要求为准。

上一篇：类风湿关节炎新药研发进展：从JAK抑制剂革新到CAR-T破局下一篇：临床核素治疗选择指南：核药CRO视角下[90Y]与[177Lu]的适应症界定与应用场景适配

返回列表