人工智能医疗器械软件临床试验设计的特殊考量与审评趋势

供应商: 亿麦思医疗科技（南京）有限公司
认证
联系电话: 18570885878
手机号: 18570885878
联系人: 阮睿园
所在地: 南京市江北新区新锦湖路3-1号中丹生态生命科学产业园一期B座1208-1210室（注册地址）
更新时间: 2026-03-13 17:14

详细介绍-

AI 医疗器械软件的临床试验，核心是在传统 GCP基础上，重点解决算法黑箱、数据偏见、泛化不足、动态更新、人机协同五大特殊问题，并匹配审评从 “结果验证”走向 “全生命周期风险治理”的趋势。下面从特殊设计考量、审评核心要点、Zui新趋势与落地路径三方面展开。

一、AI 医疗器械软件临床试验的特殊设计考量（一）核心法规与底层逻辑

法规依据：《医疗器械监督管理条例》《医疗器械临床试验质量管理规范（2022版）》《人工智能医疗器械注册审查指导原则》《深度学习辅助决策医疗器械软件审评要点》

底层逻辑：AI软件≠传统器械，必须证明分析有效性、科学有效性、临床性能三层闭环；坚持人在环中（Human-in-the-loop），AI仅作辅助，医生Zui终决策

（二）试验设计的六大特殊维度1. 研究类型与证据路径选择（审评Zui关注）

全新算法 / 全新用途：必须开展前瞻性、多中心、盲法对照试验（RCT优先）

算法优化 / 功能扩展：可采用同品种比对 +补充临床验证，但需证明核心算法实质等同

低风险辅助筛查：可采用回顾性队列 +前瞻性小样本验证，但需满足数据独立、标注合规

2026 新规：高风险 AI 诊断软件（SaMD-D 级）纳入 Ⅰ级风险，需提交全链条风险缓解计划（CRMP）

2. 数据治理：从 “够不够” 到 “好不好”（审评核心）

数据合规：来源合法、受试者知情同意、去标识化、可溯源、第三方审计

数据代表性：覆盖年龄、性别、种族、地域、设备厂商、扫描参数、疾病谱，避免人群/ 设备偏见

数据独立性：训练集 / 调优集 / 测试集 /临床验证集完全独立，严禁数据泄漏

标注质量：多专家共识标注、标注一致性检验（Kappa≥0.8）、标注标准SOP、标注记录可追溯

3. 终点设计：技术指标与临床结局并重

技术终点（必选）：准确率、敏感度、特异度、AUC、阳性 /阴性预测值、召回率、F1-score

临床终点（核心）：

诊断类：与金标准一致性、检出率、假阳 / 假阴率、漏诊 / 误诊风险

决策类：医生决策时间、治疗方案合理性、患者预后、不良事件发生率

分层终点：按设备类型、人群亚组、疾病分期分层分析，证明泛化稳定性

4. 样本量与统计考量（AI 专属）

传统计算：基于预期效果、α=0.05、1-β=0.8计算基础样本量

AI 额外要求：

样本量需覆盖数据分布、罕见病例、边缘场景，通常 **≥传统器械 2–5 倍 **

采用成组序贯、样本量重新估算（SSR），但需提前锁定统计方法

亚组分析需预设、有统计学效力，避免事后分组

5. 偏倚控制与盲法设计（AI 难点）

盲法实施：

单盲：医生不知 AI 结果（评估 AI 辅助价值）

双盲：AI 与医生判读均独立、结果互盲（Zui严谨）

中心效应控制：多中心、中心化随机、统一标注标准、统一判读流程

算法偏倚控制：试验前完成公平性测试，排除性别 / 年龄 / 种族偏见

6. 人机协同与安全性设计（AI 底线）

人在环中：明确AI 输出→医生复核→Zui终决策流程，严禁 AI自动执行治疗

异常处理：AI置信度低、结果矛盾、系统故障时的人工干预流程、报警机制

AE 监测：重点监测误诊 /漏诊导致的不良事件、系统故障、数据安全事件，建立快速上报与应急处置

7. 算法可解释性与透明性（审评新硬指标）

必须提供算法逻辑、特征选择、决策依据、局限性的清晰说明

高风险产品需 ** 可解释 AI（XAI）** 模块，支持医生理解 AI 决策路径

二、审评核心要点（2025–2026 Zui新）（一）审评逻辑转变：从 “产品验证” 到 “全生命周期风险治理”

从关注上市前性能 → 扩展为研发→临床→上市后→更新→退市全链条监管

强调算法可控、数据合规、泛化稳定、风险可测、持续监测

（二）审评shida核心关注点

算法与数据合规：训练 / 测试数据独立、来源合法、无偏见、标注一致

泛化能力：多中心、多设备、多人群下性能稳定，无显著差异

可解释性：非 “黑箱”，决策路径清晰、局限性明确

人机协同：人在环中、干预流程完善、风险可控

变更控制：算法更新分级管理，重大变更需重新临床验证

网络安全：数据加密、访问控制、审计追踪、漏洞管理、应急响应

临床价值：AI 辅助显著提升诊疗效率 / 质量 /安全性，而非单纯替代

说明书规范：明确适用范围、局限性、置信度阈值、慎用 /禁忌、操作流程

上市后监测：建立 ** 性能漂移监测、不良事件收集、定期风险评估（PMSR）** 机制

证据链完整：注册检验→算法验证→临床试验→上市后监测，数据一致、逻辑闭环

三、2025–2026 Zui新审评趋势（NMPA + 国际）（一）国内Zui新趋势（NMPA）

分类与审批提速

发布多病种、大模型 AI审评要点，简化核心算法不变的性能优化变更注册

探索测评数据库替代部分临床验证，提升创新效率

创新 AI 产品实施特别审查程序，承诺 “135” 时限（1 天形式审查、30 天技术审评、5天行政审批）

证据路径多元化

认可真实世界证据（RWE）与 RCT协同，用于泛化验证、亚组分析、上市后确认

2026 年 4 月起，允许数字孪生对照，特定适应症可用 30% 虚拟对照替代真实对照

全生命周期监管强化

要求提交算法生命周期档案：训练数据溯源、迭代规则、变更阈值、监测方案

上市后性能漂移监测成为强制要求，准确率下降超预设阈值（如5%）需重新验证

数据与算法合规收紧

严格审查数据来源、知情同意、去标识化、可追溯性，不合规直接否决

强化算法公平性测试，禁止人群 / 设备偏见

（二）国际趋势（FDA/IMDRF）

FDA：推行Pre-Cert计划，对成熟企业简化审评；强调预定变更控制（Pre-SpecifiedChanges）与实时监测

IMDRFGMLP：确立透明度、人机协同、持续监测、数据质量四大底线

四、落地路径与常见问题应对（一）临床试验设计落地步骤

前期规划：注册、研发、临床、统计、算法团队联合设计，明确预期用途、风险等级、证据路径

数据准备：建立合规、独立、代表性的训练 / 测试 /验证集，完成标注与一致性检验

方案制定：

确定研究类型、对照、盲法、样本量、分层、终点

明确人机协同流程、AE 监测、算法异常处理、数据安全

提交伦理审查 + 监管沟通，高风险产品走前置沟通通道

实施与质控：

多中心统一 SOP、统一标注、统一判读

实时数据核查、算法性能监测、偏倚控制

分析与报告：

按预设统计计划分析，重点报告整体性能、亚组稳定性、泛化能力、安全性

完整提交算法说明、数据溯源、可解释性、局限性、上市后监测方案

（二）常见问题与应对

表格

常见问题审评风险应对策略

数据不独立 / 数据泄漏	结果不被认可	严格训练 / 测试 / 临床集物理隔离，第三方审计
人群 / 设备偏见	泛化不足被拒	扩大多中心、多设备、多人群，预设亚组分析
算法黑箱、不可解释	审评不通过	开发XAI 模块，提供决策路径、特征权重、局限性
样本量不足、统计效力低	证据不足	按AI 专属方法计算，采用成组序贯、SSR，必要时联合多病种
人机协同不清、风险不可控	安全性质疑	明确人在环中流程、干预机制、报警阈值、AE 上报
变更无控制、性能漂移	全生命周期风险	建立算法变更分级SOP，预设性能阈值，上市后持续监测

展开全文

商务服务 »财务服务 »其他咨询 » 南京其他咨询

我们其他产品

我们的新闻