药物临床试验数据管理与统计分析的计划和报告指导原则 下载本文

附件

药物临床试验数据管理与统计分析的

计划和报告指导原则

一、前言

规范的数据管理计划有助于获得真实、准确、完整和可靠的高质量数据;而详细的统计分析计划则有助于保证统计分析结论正确和令人信服。为保证临床试验数据的质量和科学评价药物的有效性与安全性,必须事先对数据管理工作和统计学分析原则制定详细的计划书。在试验完成时,对试验中的数据管理和统计分析工作进行全面完整的总结至关重要,通过数据管理报告真实反映临床试验过程中的数据质量和试验样本特征,通过统计分析报告为临床试验总结报告的内容和研究结论提供主要依据。因此,在药物上市注册时,监管部门将数据管理计划和报告与统计分析计划和报告视为评价临床试验结果的重要文件和依据。

虽然我国《药物临床试验质量管理规范》(Good Clinical Practice,GCP)中对药物临床试验数据管理与统计分析进行了原则要求,且国家食品药品监督管理总局已发布的有关药物临床试验及其统计学的相应技术指南也涉及数据管理和统计分析工作的主要环节,但针对数据管理计划和报告、统计分析计划和报告却没有详细的技术规范和指导性建议。因此,本技术指导原则对此进行了较为详细的介绍和阐述,并提出具体要求,旨在为临床试验的数据管理和统计分析人员提供技术指导,帮助其更好地完成相关工作以达到监管要求。

第 1 页 共 39 页

二、数据管理的计划和报告 (一)一般考虑

数据管理计划(Data Management Plan, DMP)是由数据管理人员依据临床试验方案书写的一份动态文件,它详细、全面地规定并记录某一特定临床试验的数据管理任务,包括人员角色、工作内容、操作规范等。数据管理计划应在试验方案确定之后、第一位受试者筛选之前定稿,经批准后方可执行。通常数据管理计划需要根据实际操作及时更新与修订。

数据管理工作涉及多个单位或业务部门,包括数据管理、临床研究者、统计分析、医学事务、临床监查、临床稽查等单位或部门。数据管理的职责可分为负责、参与、审核、批准、告知等,各单位/部门在数据管理各步骤的职责不尽相同。数据管理计划需明确参与数据管理的相关组织及人员职责。数据管理各步骤需建立并遵循相应的标准操作规程(Standard Operation Procedure,SOP),数据管理计划应列出项目所遵循的SOP清单。

数据管理报告是在临床研究结束后,数据管理人员撰写的研究项目数据管理全过程的工作总结,是数据管理执行过程、操作规范及管理质量的重要呈现手段。通常以定性和定量的参数来表达,如数据量、疑问数等,并与数据管理计划一起作为药物注册上市的申请材料提交给监管部门用于对临床试验结果的评价。

(二)数据管理计划的基本内容

数据管理计划应全面且详细地描述数据管理流程、数据采集与管理所使用的系统、数据管理各步骤及任务,以及数据管理的质量保障措施。

1.试验概述

第 2 页 共 39 页

简要描述试验方案中与数据管理相关的内容,一般包括研究目的和总体设计,如随机化方法及其实施、盲法及设盲措施、受试者数量、评估指标、试验的关键时间节点、重要的数据分析安排及对应的数据要求等。

2.数据管理流程及数据流程

列出数据管理的工作流程以及试验数据的流程,便于明确各环节的管理,可采用图示方式。

数据管理的工作流程应包含数据采集/管理系统建立、病例报告表(Case Report Form,CRF)及数据库的设计、数据接收与录入、数据核查与质疑、医学编码、外部数据管理、盲态审核、数据库锁定、解锁及再锁定、数据导出及传输、数据及数据管理文档的归档等数据管理过程。

数据流程应包含临床试验中所有类型数据的生成、采集、传输、导入、导出、存档等的位臵、负责单位/人、期限等。详细列出每一种类型的试验数据流程,便于明确各种类型和介质的数据的管理,如CRF数据、中心实验室检测数据、药代动力学检测数据、电子的患者报告结果(Electronic Patient Reported Outcome, ePRO)数据、影像学数据等。

3.采集/管理系统

列出采集试验数据的方法,如纸质或电子的CRF、采用的数据采集/管理系统的名称及版本。描述系统用户的权限控制计划,或者以附件形式提供相应信息,包含权限定义、分配、监控及防止未经授权操作的措施或方法、权限撤销等。

数据采集/管理系统应具备稽查轨迹、安全管理、权限控制及数据备份的功能,并通过完整的系统验证。

第 3 页 共 39 页

4.数据管理步骤与任务 (1)CRF及数据库的设计

CRF的设计必须保证收集试验方案所规定并满足统计分析需求的所有数据。

不论是何种数据记录方式,均需对相应CRF填写指南的建立和管理有所阐述。

数据库的设计通常按既定的注释CRF和/或数据库设计说明执行,建立逻辑核查,经用户接受测试(User Acceptance Testing, UAT)合格后方可上线使用。数据管理计划中对此过程应进行简要描述和说明。

(2)数据的接收与录入

数据管理计划应明确阐述数据采集、接收和录入的方式和过程。 临床试验研究者或临床研究协调员(Clinical Research Coordinator,CRC)应依照CRF填写指南,准确、及时、完整、规范地填写CRF。在数据录入前需制定数据录入说明,确定数据录入的要求及方式。纸质CRF常用双人双份录入,电子CRF由临床研究者或由其指定的CRC直接录入。纸质CRF表还需定义完成CRF的发送、转运、接收方式,如传真、邮寄、监查员收集等。同时定义收集频率及记录文件接收的格式等。

(3)数据核查与质疑

在进行数据核查之前,应制定详细的数据核查计划(Data Validation Plan, DVP),明确数据核查内容、方式与核查要求。数据核查通常需要数据管理人员、监查员、医学人员及统计师等共同完成。

(4)医学编码

第 4 页 共 39 页

医学编码是把从CRF上收集的不良事件、医学诊断、合并用药、既往用药、既往病史等的描述与标准字典中的术语进行匹配的过程。如采用医学编码,数据管理计划需详细描述编码流程、编码工具、编码字典及版本,以及执行编码的相关标准文件。

(5)外部数据管理

临床试验外部数据包括实验室数据、电子日志、ePRO、随机化数据等。针对外部数据的管理,数据管理计划中应列出数据传输协议,包括数据类别、数据提供者、数据格式、传输方式、传输频率等,以及对外部数据进行质控的措施,如传输测试、一致性核查等。对于盲态的外部数据,如血液样品中的药物浓度或某些关键数据等,需描述此类数据的管理流程。

(6)盲态审核

列出数据盲态审核的要求,并在计划中描述盲态审核操作的具体流程。一般地,数据盲态审核时应对所有数据质疑、脱落和方案偏离的病例、合并用药和不良事件的发生情况以及分析数据集的划分进行最终确认。

(7)数据库锁定、解锁及再锁定

数据管理计划应详细说明数据库锁定的流程、负责人及执行的SOP文件。

数据库锁定后的解锁和再锁定,应事先规定并详细说明其条件和流程。

(8)数据导出及传输

描述数据的导出和传输的文件格式、导出内容(数据库、变量名及变量值编码)、提交程序及传输介质,传输介质应符合国家法规和监管部门要求。

第 5 页 共 39 页

(9)数据及数据管理文档的归档要求

试验数据及录入/导入数据库的时间、录入者、数据稽查轨迹及数据管理过程形成的文档都需要完整保存。数据管理过程形成的数据通常包括但不限于:临床试验数据、外部数据、数据库元数据信息、实验室检测参考值范围、逻辑检验及衍生数据变更控制列表、数据质疑表和程序代码等。数据管理过程形成的文件通常包括但不限于:数据管理计划、空白CRF、CRF填写指南、完成CRF的PDF格式文件、注释CRF、数据库设计说明、数据库录入说明、数据核查计划、数据质控核查报告等。

数据管理计划中应明确需要存档的试验数据、管理文件、介质、归档方式及时限。

5.质量控制

数据管理计划需确定数据及数据管理操作过程的质控项目、质控方式(如质控频率、样本选取方式及样本量等)、质量要求及达标标准、对未达到预期质量标准的补救措施等。

(三)数据管理报告的基本内容

数据管理报告应全面且详细陈述与数据管理执行过程、操作规范及管理质量相关的内容,包括参与单位/部门及职责、主要时间节点、CRF及数据库设计、数据核查和清理、医学编码、外部数据管理、数据质量保障、重要节点时的数据传输记录、关键文件的版本变更记录,并描述与数据管理计划的偏离。

1.参与单位/部门及职责

数据管理报告应列出数据管理涉及的所有单位/部门及其在数据管理各步骤的职责。

2.数据管理的主要时间节点

第 6 页 共 39 页

数据管理各步骤的时间节点可体现数据管理工作的时效性及数据质量,数据录入与数据清理不及时可能有损数据质量。可采用列表方式描述各主要时间节点的起止时间,包括数据录入、数据清理、外部数据管理、数据质控、数据锁库、数据传输、文档归档等主要步骤。

3.CRF及数据库设计

描述CRF及数据库设计各主要步骤的执行情况及具体工作内容/方法,包括CRF设计、编制CRF填写指南和注释CRF、形成数据库设计说明以及数据录入说明、数据库建库及数据标准、数据库测试情况等。

4.数据核查和清理

数据管理报告应描述数据质疑的总体情况,并按照疑问类型进行归类汇总。为体现质疑的及时性,数据管理报告应描述质疑生成到答疑的时长(中位天数及其范围)。针对质疑管理中的主要异常问题,数据管理报告应描述出现问题的原因或说明,如质疑数量过高/过低的临床中心/研究者、答疑时间过长等。

数据管理报告应描述是否有不同于临床数据库的严重不良事件数据库,如有则应描述一致性核查情况,包括试验严重不良事件(Serious Adverse Event, SAE)总数、被核查的SAE数量及SAE核查频率等,对未核查的SAE以及经核查不一致的SAE应当详细说明其不一致点和修正情况。

5.医学编码

对所采用的医学编码,数据管理报告应描述各项内容编码采用的字典名称及其版本号,并列出各项内容的编码数量。

6.外部数据管理

第 7 页 共 39 页

描述外部数据的种类,并描述各类外部数据的来源单位、数据传输协议、数据传输起止日期、传输频率及方式,以及是否执行外部数据的一致性核查和核查结果等。对盲态的外部数据需重点描述维持其盲态的措施。

7.数据管理的质量评估

在数据库锁定前进行数据质量评估,评估并报告的内容应包含计划与实际发生的临床数据录入天数(针对纸质CFR)、质控过程发现并纠正的问题的数量等。

描述数据管理过程中进行数据质控核查的次数,每一次质控核查需描述核查时受试者总例数、关键指标错误率、非关键指标的抽样例数、抽样比例及依据和错误率。

数据管理应当严格按照数据管理计划执行,如实际操作中有任何不一致,报告中需详细描述其发生原因,并进一步阐述对数据质量的影响。如数据管理接受稽查或视察,应当描述稽查承担单位、稽查时间、稽查发现的主要问题、采取的纠正和预防措施等。

8.重要节点时的数据传输记录

试验数据管理过程中可能需要多次数据传输,数据管理报告应描述重要节点的传输记录,包括期中分析的数据传输、数据锁定后向统计分析单位或申办者的传输、以及向药品监管部门的提交等。描述内容应当包含传输的数据集名称、传输日期、接收单位、传输格式、以及原数据集的储存/备份地点、责任单位/人。

9.关键文件的版本变更记录

数据管理报告应详细列出与数据管理相关的重要文档的版本变更记录,包括试验方案、CRF、数据库(包括eCRF与逻辑检验程序)及数据管理计划的版本变更记录,并描述各版本执行

第 8 页 共 39 页

日期、修正内容及修正原因等。

10.报告附件

以下报告附件作为关键性文件,应视为数据管理报告不可缺少的内容。

(1)空白CRF

(2)注释CRF (可提交电子版) (3)数据库锁定清单及批准文件

(4)数据核查计划DVP(可提交电子版) 三、统计分析的计划和报告 (一)一般考虑

统计分析计划(Statistical Analysis Plan,SAP)是比试验方案中描述的分析要点更加技术性和有更多实际操作细节的一份独立文件,包括对主要和次要评价指标及其他数据进行统计分析的详细过程。临床试验的统计分析有其特殊性,统计分析计划应当由具有参与临床试验经验的统计学专业人员起草,要求全面而详细地陈述临床试验数据的分析方法和表达方式,以及对预期的统计分析结果的解释。统计分析计划初稿应形成于试验方案和CRF确定之后,在临床试验进行过程中以及数据盲态审核时,可以进行修改、补充和完善,不同时点的统计分析计划应标注版本及日期,正式文件在数据锁定和揭盲之前完成并予以签署。如果试验过程中试验方案有修订,则统计分析计划也应作相应的调整。如果涉及期中分析,则相应的统计分析计划应在期中分析前确定。

统计分析报告(Statistical Analysis Report,SAR)是根据统计分析计划,对试验数据进行统计分析后形成的报告,是临床试验结果的重要呈现手段,是撰写临床研究报告(Clinical Study

第 9 页 共 39 页

Report,CSR)的重要依据,并与统计分析计划一起作为药物注册上市的申请材料提交给监管部门用于对临床试验结果的评价。

(二)统计分析计划的基本内容

统计分析计划的基本内容涵盖了设计的类型、比较的类型、随机化与盲法、主要指标和次要指标的定义与测量、检验假设、数据集的定义、疗效及安全性评价和统计分析的详细计划。确证性试验要求提供主要指标的分析原则及预期分析方法。探索性试验通常描述概括性的原则和方法。

1.试验概述

试验概述是试验方案中与统计学相关的部分,常可直接摘录。一般包括以下主要内容:

(1)研究目的:临床试验的主要目的和次要目的。 (2)设计类型:如平行设计、交叉设计、析因设计、成组序贯设计等。

(3)对照的类型:如安慰剂对照、阳性对照、剂量组对照等,需说明试验选择的对照类型及理由。

(4)随机化方法及其实施:明确随机化方法,如区组随机、分层随机及其分层因素等。

(5)盲法及设盲措施:说明是单盲还是双盲,设盲措施是双盲单模拟、双盲双模拟等,以及保持盲态下执行统计分析的措施。若采用开放设计,需充分说明无法实施盲法的理由。

(6)样本量:计划入组的受试者数量及其计算依据。若采用成组序贯设计应说明不同阶段的样本量。

2.评价指标

统计分析计划中应清晰描述主要指标和次要指标的定义,包

第 10 页 共 39 页

括具体观察和测量的方法、观察时点、指标属性。如果主要指标需要通过计算得到,则需给出相应的计算公式。

3.分析数据集

根据不同研究目的,在统计分析计划中需明确描述数据集的定义。临床试验的分析数据集一般包括ITT/全分析集(Full Analysis Set,FAS)、符合方案集(Per Protocol Set,PPS)、安全性数据集(Safety Set, SS)。在定义分析数据集时,需遵循两个原则:①尽可能地减小偏倚;②控制I 类错误的增加。

4.缺失数据和离群值的处理

缺失值和离群值是临床试验中潜在的偏倚来源之一,但在实际的临床试验中往往难以避免。因此,一方面在试验的计划、执行过程中应有必要的措施尽量避免其发生,另一方面在统计分析计划中应预先说明主要疗效指标缺失值的填补方法及理由,离群值的处理方法应当从医学和统计学两方面去考虑,并在统计分析计划中明确描述。

5.统计分析方法

统计分析应建立在真实、准确、完整和可靠的数据基础上,应根据研究目的、试验方案和观察指标的类型选择国内外公认的统计分析方法。应给出不同类型资料的描述及统计推断方法,明确采用的单双侧检验及其水准,并说明所采用的统计软件及版本号。

(1)比较类型和检验假设

明确临床试验的比较类型,如优效性检验、非劣效性/等效性检验及其界值等。写出主要指标进行统计学检验的原假设和备择假设及其检验水准等。

要注意多个主要指标、多个比较组、多个时间点的比较、期

第 11 页 共 39 页

中分析、亚组分析等情况的多重性问题,说明控制Ⅰ类错误率的措施。

(2)人口学资料和基线特征分析

说明对于人口学等基线资料根据数据性质进行描述统计分析的具体方式。

(3)依从性和合并用药分析

对于依从性和合并用药的分析,说明所采用描述性统计分析的具体方式,并说明对依从性差、具有合并用药的受试者具体情况的描述方式。

(4)主要指标的分析

说明主要指标分析采用的统计分析方法和统计分析模型。分析模型的选择要注意考虑指标的性质及数据分布的特性。处理效应的估计应尽量给出效应大小、臵信区间和假设检验结果。有些基线特征变量在统计分析中可作为协变量处理,但必须在统计分析计划中事先说明。

在确证性试验中,只有统计分析计划中事先规定的统计分析内容才可以作为确证性试验的证据,其他的分析结果只能是探索性的。

(5)次要指标的分析

对于次要指标的统计分析,处理效应的估计也需要尽量给出效应大小、臵信区间和假设检验方法。

(6)安全性分析

安全性分析的资料主要来源于受试者的主诉、症状、体征以及实验室检查结果等,所有的安全性指标在分析中都需要高度重视,应考虑对不良事件采用统一的编码词典进行编码。对于安全

第 12 页 共 39 页

性数据的分析需说明所采用的统计学分析方法。

对不良事件的分析,应按事件发生的频数、频次和发生率描述,必要时进行组间发生率的比较。分析计划中需说明各种不良事件/反应的分类和汇总方式,以及所采用的具体不良事件编码词典名称及其版本号。

(7)其他分析

除以上的分析之外,有时还考虑期中分析、亚组分析、敏感性分析等。

期中分析的时点(包括日历时点或信息时点)、具体实施方式和所采用的α消耗函数等应当事先制订计划并在试验方案中阐明。对于确证性临床试验,原则上不得进行计划外期中分析,如由于特别情况进行了计划外的期中分析,则在研究报告中应解释其必要性以及破盲的程度和必要性,并提供可能导致偏倚的严重程度以及对结果解释的影响。

当涉及亚组分析时,需要对亚组给出明确定义。对于非预先规定的缺失数据的填补、离群值、亚组分析、不同数据集的分析、不同协变量的调整等,可进行敏感性分析,考察对试验结果的影响。

6.图表模板

统计分析结果通常以统计分析表或图的形式呈现,计划中应该以简明的格式、精炼的文字描述所有相关信息。

(三)统计分析报告的基本内容

统计分析报告是对临床试验的统计设计、分析、结果的总结,是临床试验报告的基础和依据,其基本内容包括:试验概述、统计分析方法、统计分析的结果与结论,一般采用统计表和统计图表示。统计分析报告中的所有结论应使用准确的统计学术语阐述。

第 13 页 共 39 页

1.试验概述

统计分析报告中的试验概述应与统计分析计划一致。 2.统计分析方法

统计分析报告中的统计分析方法应与统计分析计划一致。 3.统计分析结果 (1)受试者的分布

统计分析报告中应写明所有入组的受试者的分布情况,包括筛选例数、筛选失败例数及原因、参与随机化的例数、各组脱落或剔除受试者的例数、百分比等,以及方案偏离情况、各分析数据集的分布。除文字、表格描述外,应采用流程图的方式描述受试者的分布情况(流程图参见附录)。

详细描述每一位因脱落/剔除等原因未进入各分析数据集的受试者的情况,如受试者编号、中心、入组时间、脱落或剔除原因及时间等。

(2)人口学资料和基线特征分析

对于人口学资料、既往病史、家族史、药物过敏史以及疗效指标的基线值等数据常采用统计描述的方式进行可比性分析。计量资料一般用均数、中位数、标准差、四分位数、最大值和最小值等进行描述;计数及等级资料一般用频数和百分比描述。

(3)依从性和合并用药分析

根据依从性定义,报告各受试者完成试验的情况,包括研究时间、药物暴露时间、药物使用量等情况,列表描述依从性差的受试者、依从性差的具体原因及进入分析数据集情况。

对于合并用药分析,需列出合并药物的详细情况,如受试者编号、中心、组别、合并药物名称、使用原因、开始时间、结束

第 14 页 共 39 页

时间等,进行组间合并用药的比较。

(4)疗效分析

对于主要和次要疗效指标,需根据事先确定的统计分析方法进行统计描述和统计推断,可能包括指标基线情况、治疗后各访视点的测量值及前后变化情况,以及变化值组间差异的描述统计量、臵信区间和组间比较的检验统计量及P值等。

对于主要指标,应报告效应大小、臵信区间和假设检验结果,根据事先确定的标准,从统计学角度判断主要指标的优效性/非劣效性/等效性的假设是否成立。

(5)安全性分析

安全性分析应按统计分析计划给出统计分析结果。需要分类汇总各种不良事件/反应,包括一般的和严重不良事件/反应、重要不良事件、导致脱落的不良事件/反应的发生率、严重程度及可能进行的组间比较。并列表描述每位受试者每项不良事件/不良反应发生的详细情况,包括不良事件/反应的类型、严重程度、发生和持续时间、结局以及与试验药物及药物剂量的关系等。

对实验室指标的比较和评价,主要关注治疗前正常而治疗后异常的发生情况,以及治疗前异常但在治疗后加重的受试者,需列表描述上述两种情况。生命体征、心电图、体格检查以及其他安全性相关指标的分析与实验室检查指标的分析类似。必要时,进行实验室指标前后变化及组间比较。

4.统计学结论

根据主要指标的统计分析结果,结合研究的设计类型、样本量、试验实施情况、次要指标及敏感性分析结果等阐述证据的充分性和结果的稳健性,并给出统计学结论:明确针对主要指标的

第 15 页 共 39 页

统计假设是否成立,并简要描述安全性的主要统计结果。

5.报告附件

以下报告附件作为关键性文件,应视为统计分析报告不可缺少的内容。

(1)原始数据库、分析数据库及相应的变量说明文件(数据库应为SAS XPORT 传输格式,xpt格式)

(2)受试者分布流程图

(3)随机化方案(含随机分配表) (4)盲态审核决议

(5)补充正文的统计附图和附表 (6)SAS分析代码(必要时) (7)统计方法的发表文献(必要时) 四、名词解释

稽查轨迹(Audit Trail):是计算机系统(如数据管理系统)的基本功能。是指系统采用安全的和计算机产生的带有时间烙印的电子记录,以便能够独立追溯系统用户输入、修改或删除每一条电子数据记录的日期、时间,以及修改原因,以便日后数据的重现。任何记录的改变都不会使过去的记录被掩盖或消失。只要受试者的电子记录保存不变,这类稽查轨迹文档记录就应当始终保留,并可供监管视察或稽查员审阅和复制。

系统验证(SystemValidation):是指建立计算机化系统生命周期管理的文档化证据,以确保计算机化系统的开发、实施、操作以及维护等环节自始至终都能够高度满足其预设的各种系统技术标准、使用目的和质量属性,和处于监控的质量管理规程中,并能在其投入应用直至退役过程中都能高度再现和维护系统的

第 16 页 共 39 页

标准和功能符合监管要求。

权限控制(Access Control):是指按照临床试验电子系统的用户身份及其归属的某项定义组的身份来允许、限制或禁止其对系统的登录或使用,或对系统中某项信息资源项的访问、输入、修改、浏览能力的技术控制。

注释CRF(Annotated CRF):是对空白的CRF的标注,记录CRF各数据项的位臵及其在相对应的数据库中的变量名和编码。

逻辑核查(EditCheck):是指临床试验数据输入计算机系统后对数据有效性的检查。这种核查可以通过系统的程序逻辑,子程序和数学方程式等方法实现,主要评价输入的数据域与其预期的数值逻辑、数值范围或数值属性等方面是否存在错误。

用户接受测试(User Acceptance Testing,UAT):用户接受测试是由临床数据管理系统的用户进行的一种检测方式,检测记录可用以证明所设计系统经过了相关的验证过程。用户应全面检测所有正确和错误数据组合,记录检测结果。全面的检测文档应包括验证方案、测试细则记录、测试总结报告和验证总结报告等。

数据核查计划(Data Validation Plan,DVP):也称逻辑核查计划,是由数据管理员为检查数据的逻辑性,依据临床试验方案以及系统功能而撰写的系统设臵文件。

盲态审核(Blind Review):是指在试验结束(最后一位受试者最后一次观察)到揭盲之前对数据进行的核对和评估,以便最终确定统计分析计划。

方案偏离(Protocol Deviation):是指任何有意或无意偏离和不遵循未经IRB批准的试验方案规定的治疗规程,检查或数据收集程序的行为。一般来说,这种偏离只是逻辑的或管理性的

第 17 页 共 39 页

偏离试验方案,不会对受试者的安全和获益产生实质性的作用,也不会影响所收集数据的价值。

期中分析(InterimAnalysis):是指在正式完成临床试验前,按事先制订的分析计划,对处理组间的有效性和安全性进行比较的分析。

缺失数据(MissingData):是指按照研究方案要求收集但未观测到的数据。

离群值(Outliers) :是指严重偏离平均水平的观测数据。离群值可能由于变量的变异较大所致,也有可能由过失误差引起;若是后者,应说明原因后作为缺失数据处理。

亚组分析(Subgroup Analysis):是指对整体中根据某种因素分层的部分数据进行分析。

敏感性分析(Sensitivity Analysis):是指对非预先规定的试验中可能出现的各种情况进行分析,如缺失数据的填补、亚组分析、不同数据集分析、不同协变量的调整等,并将分析结果作为参考,与事先确定的分析结果进行比较,考察所得结果的一致性和稳定性。敏感性分析可以作为主要分析的附加支持,但不能作为结论的主要依据。

重要不良事件(Significant Adverse Event):指的是除严重不良事件外,发生的任何导致采用针对性医疗措施(如停药、降低剂量和对症治疗)的不良事件和血液学或其他实验室检查明显异常。

五、参考文献

1.CFDA:药物临床试验质量管理规范(GCP)。2003 2.CFDA:药物临床试验的生物统计学指导原则。2016

第 18 页 共 39 页

3.CFDA:临床试验数据管理工作技术指南。2016 4.CFDA:化学药物临床试验报告的结构与内容技术指导原则。2005

5.ICH E3: Structure and Content Of Clinical Study Reports. 1995

6.ICH E6: Guideline for Good Clinical Practice. 1996 7.ICH E9: Statistical Principles for ClinicalTrials. 1998 8.中国临床试验数据管理学组(CDMC):数据管理计划的结构和内容。药学学报,2015,50(11):1388-1392

9.中国临床试验数据管理学组(CDMC):数据管理总结报告。药学学报,2015,50(11):附录

第 19 页 共 39 页

六、附录

1.受试者分布流程样图

接受双盲治疗(N=…) 未接受治疗(N=…) 原因: ? 原因1(N=…) ? 原因2(N=…) 随机化(N=…) 筛选失败(N=…) 原因: ? 原因1(N=…) ? 原因2(N=…) 筛选(N=…) 退出试验( N=…) 原因: ? 原因1( N=…) ? 原因2(N=…) A组(N=…) B组(N=…) 退出试验(N=…) 原因: ? 原因1(N=…) ? 原因2(N=…) 完成(N=…) 完成(N=…)

第 20 页 共 39 页

2.统计报告的基线结果模板

分类变量和连续变量基线结果表格参考格式见下:

表2.1.1基线情况

指标 试验组 对照组 合计 统计量 P值

分类变量 类1 类2 合计 连续变量 N(Nmiss) Mean(SD) Median(Q1,Q3) Min,Max

3.统计报告的安全性分析结果模板

(1)安全性小结和结论 (2)受试者用药与暴露的程度

描述受试者在研究期间的用药持续时间与暴露量,如果有必要,可以分性别、分阶段(例如化疗周期)进行描述。表格参考格式见下:

表3.2.1受试者用药与暴露的程度

指标 试验组 对照组 合计 统计量 P值

分类变量 类1 类2 合计 连续变量 N(Nmiss) Mean(SD) Median(Q1,Q3) Min,Max

(3)不良事件

分组描述不良事件/反应、严重不良事件/反应、重要不良事件、导致脱落的不良事件/反应的发生例数与发生率。

分组描述各系统不良事件/反应、严重不良事件/反应、重要不良事件、导致脱落的不良事件/反应的发生例数与发生率。

根据不同严重程度和药物暴露量分组描述各系统不良事件/不良反应的发生例数与发生率。表格参考格式见下。

第 21 页 共 39 页

表3.3.1不良事件总结 不良事件 不良反应 严重不良事件 严重不良反应 重要不良事件 导致脱落的不良事件 导致脱落的不良反应 试验组 对照组 例次 例数 发生率 例次 例数 发生率 P值

表3.3.2 各系统不良事件发生情况 合计 SOC1 PT1 PT2 SOC2 … 例次 试验组 例数 发生率 例次 对照组 例数 发生率

表3.3.3各系统不良反应发生情况 合计 SOC1 PT1 PT2 SOC2 … 例次 试验组 例数 发生率 例次 对照组 例数 发生率

表3.3.4各系统严重不良事件发生情况

第 22 页 共 39 页

合计 SOC1 PT1 PT2 SOC2 … 例次 试验组 例数 发生率 例次 对照组 例数 发生率

表3.3.5各系统严重不良反应发生情况 合计 SOC1 PT1 PT2 SOC2 … 例次 试验组 例数 发生率 例次 对照组 例数 发生率

表3.3.6各系统重要不良事件发生情况 合计 SOC1 PT1 PT2 SOC2 … 例次 试验组 例数 发生率 例次 对照组 例数 发生率

表3.3.7各系统导致脱落的不良事件发生情况 合计 SOC1 PT1 PT2

试验组 例次 例数 发生率 第 23 页 共 39 页

对照组 例次 例数 发生率

SOC2 … 例次 试验组 例数 发生率 例次 对照组 例数 发生率

表3.3.8各系统导致脱落的不良反应发生情况 合计 SOC1 PT1 PT2 SOC2 … 例次 试验组 例数 发生率 例次 对照组 例数 发生率 第 24 页 共 39 页

表3.3.9 各系统不同严重程度不良事件发生情况 合计 SOC1 PT1 PT2 SOC2 … 轻 试验组 中 重 轻 对照组 中 重 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率

表3.3.10 各系统不同严重程度不良反应发生情况 合计 SOC1 PT1 PT2 SOC2 … 轻 试验组 中 重 轻 对照组 中 重 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率

第 25 页 共 39 页

表3.3.11 各系统不同暴露量不良事件发生情况 合计 SOC1 PT1 PT2 SOC2 … 暴露量1 试验组 暴露量2 … 暴露量1 对照组 暴露量2 … 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率

表3.3.12 各系统不同暴露量不良反应发生情况 合计 SOC1 PT1 PT2 SOC2 … 暴露量1 试验组 暴露量2 … 暴露量1 对照组 暴露量2 … 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 例次 例数 发生率 第 26 页 共 39 页

(4)临床实验室检查

采用前后交叉表的方式描述实验室检查结果。表格参考格式见下。

表4.1.1 临床实验室检查前后交叉表 组别 试验组 正常 异常无临床意义 异常有临床意义 未查 合计 异常无临床意义 异常有临床意义 未查 合计 治疗前 正常 治疗后 异常无临床意义 异常有临床意义 未查 合计 对照组 正常 (5)心电图

心电图描述参考实验室检查。表格参考格式见下。

表5.1.1 心电图检查前后交叉表 组别 试验组 正常 异常无临床意义 异常有临床意义 未查 合计 异常无临床意义 异常有临床意义 未查 合计 治疗前 正常 治疗后 异常无临床意义 异常有临床意义 未查 合计 对照组 正常 (6)其他安全性指标 包括生命体征、体格检查等。 ??

第 27 页 共 39 页

4.数据管理报告范例

数据管理报告范例

版本号:[列出方案版本号,如“V1.0”]

版本日期:YYYY-MM-DD

方案名称: [列出方案标题,如“临床试验CNS1234”] 方案代码: [列出方案编号,如“PHAMA- CNS1234”] 申办单位: [列出申办方名称,如“医药公司AB”]

数据管理单位: [列出数据管理单位,如“临床合同公司CD”]

第 28 页 共 39 页

报告签字页

我在此签字,申明已详细阅读了该报告,并确认该报告准确地描述了本临床试验的数据管理过程。

报告编制人 姓名:___XXX___ 签名:

数据管理负责人 姓名:___ZZZ____ 签名:

申办方数据管理负责人 姓名:___UUU___ 签名:

日期:YYYY-MM-DD

日期:YYYY-MM-DD

日期:YYYY-MM-DD 第 29 页 共 39 页

目录

1. 试验文件记录

2. 数据管理项目参与单位/部门及职责 3. 数据管理主要时间节点 4. CRF及数据库设计 5. 数据清理

5.1疑问的总体情况 5.2疑问的处理情况 5.3疑问管理中的主要问题 6. 医学编码 7. SAE一致性核查 8. 外部数据管理 9. 数据质控和稽查

9.1. 数据质量评估 9.2. 质控核查 9.3. 数据管理过程稽查 10. 提交锁定的数据集

11. 数据管理实际过程与数据管理计划不一致

第 30 页 共 39 页

临床试验过程中试验方案,病例报告表(CRF), 数据库及数据管理计划的制定与修正:

本次数据管理过程中,总共对试验方案进行n*次修正。 试验方案原始版本及日期: [版本号],YYYY-MM-DD 试验方案最终版本及日期: [版本号],YYYY-MM-DD

本次数据管理过程中,总共对CRF进行n 次修正。

CRF原始版本及日期:[列出CRF初始版本号和版本日期,如“EDCeCRF, Version_1.0_ CNS1234_01JUL2013 YYY-MM-DD”]

CRF最终版本及日期:[列出使用中的CRF终板版本号和版本日期,如“EDCeCRF, Version_2.0_CNS1234_28DEC2013 YYYY-MM-DD”]

本次数据管理过程中,总共对数据库进行n次修正。

数据库原始版本及日期:[列出数据库初始版本号和版本日期,如”V1.0,

YYYY-MM-DD”]

数据库最终版本及日期: [列出数据库终版版本号和版本日期,如”V2.0,

YYYY-MM-DD”]

本次数据管理过程中,总共对数据管理计划进行n次修正。

数据管理计划原始版本及日期:[列出数据管理计划初始版本号和版本日期,

如”PHAMA-CNS1234V1.0_ YYYY-MM-DD“] 数据管理计划最终版本及日期:[列出数据管理计划终稿版本号和版本日期,

如”PHAMA-CNS1234V3.0_YYYY-MM-DD”]

注:* n代表修正的具体次数

第 31 页 共 39 页

1.试验文件记录

试验方案 (列出试验方案名称,如PHAMA-CNS1234) …(根据实际方案版本增减行列数) CRF (列出CRF名称,如PHAMA-CNS1234) 版本号 (顺序列出所有版本,如V2.0) … 版本号 (顺序列出所有版本,如V2.0) 主要修正内容及修正理由 (顺序列出各版本修改内容和理由,如修正入组执行日期 (顺序列出各版本执行日期,如YYYY/MM/DD) … 主要修正内容及修正理由 4 增加入组条件选项。根据试验方案修正) …(根据实际CRF版本增减行列数) 数据库 (列出数据库名称,如CNS1234) …(根据实际数据库版本增减行列数) 数据库解锁 (列出被解锁的数据库名称,如CNS1234-02。如没有解锁发生,可以填“未发生”) …(根据实际解锁情况增减行列数) 数据管理计划 (列出计划名称,如PHAMA1234) … 版本号 (顺序列出数据库版本号,如DB20131228B1.1) … 版本号 (顺序列出所有再锁定版本号。如没有则不填) … 版本号 顺序列出所有版本,如V1.1) … 主要修正内容及修正理由 (顺序列出各数据库版本内容与修改理由,如外执行日期 条件) … (顺序列出各版本修改内容和理由,如CRF Page (顺序列出各版本执行日期,如YYYY-MM-DD) … 执行日期 (顺序列出各版本执行日期,如YYYY-MM-DD) … 解锁理由及参与人员 执行日期 (顺序列出各版本执行日期,如YYYY-MM-DD) … 主要修正内容及修正理由 执行日期 (顺序列出各版本执行日期,如YYYY-MM-DD) … … … 部数据导入测试后数据库版本改变) … (顺序列出各数据库版本解锁理由与参与人员名单。如未发生,可以不填) … (顺序列出各版本修改内容和理由,如逻辑核查文件修正) …(根据实际计划版本增减行列) …(根据实际文件条目增减行列数) ……… … … … … … … 第 32 页 共 39 页

2.数据管理项目参与单位/部门及职责

(注:可以在各项目下列出职责部门的角色,如负责,参与,告知,不适用,审核,批准等,下表为试验项目包括申办者、研究者和CRO三方的一个参考案例,实际中可根据情况进行调整。) 项目 CRF 设计 CRF填写说明 eCRF的测试 数据采集(EDC)系统上线 数据库建立及测试 数据核查计划 数据管理系统上线 数据管理计划 数据录入 外部数据管理 数据质疑 数据质疑管理 医学编码 期中分析数据 数据传输 数据质控 数据库锁定 数据文档保存 数据管理过程稽查 …… 数据管理单位/部门 统计分析单位/部门 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 负责 参与 ? 审核 审核 不适用 告知 审核 审核 告知 参与 不适用 参与 参与 不适用 告知 审核 参与 不适用 审核/批准 不适用 参与 ? 临床监查部门 审核 审核 参与 告知 不适用 参与 不适用 参与 告知 参与 参与 参与 不适用 参与 不适用 不适用 审核/批准 参与 参与 ? CRO 研究者 …… 项目管理部 告知 不适用 参与 告知 参与 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 告知 不适用 不适用 告知 告知 不适用 ? 医学部门 审核 参与 参与 告知 参与 参与 不适用 参与 不适用 不适用 参与 不适用 审核 参与 不适用 不适用 审核 参与 参与 ? …… QA质保部 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 不适用 负责 ? 告知 告知 参与 告知 不适用 不适用 不适用 不适用 参与 不适用 不适用 参与 不适用 参与 不适用 不适用 参与 参与 参与 ? 审核/批准 审核 审核 审核/批准 审核 审核/批准 审核/批准 审核/批准 告知 审核/批准 审核 审核 审核 审核/批准 审核/批准 审核 审核/批准 审核 参与 ? 申办者 第 33 页 共 39 页

3.数据管理主要时间节点

(注:可以根据各项数据任务条目名称分别列出相关信息,参考案例见表中。) 任务条目 开始日期 结束日期 备注 数据管理过程 数据录入 数据清理 外部数据管理 数据质控 数据的盲态审核 数据库锁库 数据文件存档 …(根据实际任务条目增减行列数) YYYY-MM-DD YYYY-MM-DD (如需说明,可以在此注明) YYYY-MM-DD YYYY-MM-DD (如需说明,可以在此注明) YYYY-MM-DD YYYY-MM-DD (如需说明,可以在此注明) YYYY-MM-DD YYYY-MM-DD (如需说明,可以在此注明) YYYY-MM-DD YYYY-MM-DD (如需说明,可以在此注明) YYYY-MM-DD YYYY-MM-DD (如需说明,可以在此注明) YYYY-MM-DD YYYY-MM-DD (如需说明,可以在此注明) YYYY-MM-DD YYYY-MM-DD (如需说明,可以在此注明) … … … 4.CRF及数据库设计

(注:根据与CRF相关的实际工作,列出相应环节信息和工作性质描述,参考案例见表中。) 执行工作 具体内容 eCRF 备注 选择数据采集工具 CRF填写指南交付 电子病例报告表(EDC) 在线帮助系统 电子化技术自动标注CDASH 依据CDISC和注释CRF 模拟CRF数据 5份;项目CRF数据0份 … 注释CRF 数据库设计 数据库测试 …(根据实际任务条目增减行列数) 见UAT计划,测试报告和结果 … 5.数据清理

5.1疑问的总体情况

(注:按实际分类顺序列出各类数据集的名称,各数据集的疑问数量,以及高疑问率的根源分析。参考案例见表中。) 疑问类型 人口学资料DM 入选/排除标准IE 生命体征VS 病史HX 研究用药EX 疑问数量 2 23 12 45 2 最高频率疑问产生原因 方案的入排条件把控培训不到位 方案的入组条件名列不清 第 34 页 共 39 页

不良事件AE 血常规 CH 心电图ECG 合并用药CM …(根据实际疑问类别增减行列数) 合计 平均(/受试者) 平均(/研究机构) 12 200 3 55 … 实验室测试单位换算错误 不良事件的合并用药对比 … (列出总的疑问数,如354) (列出按受试者计算平均疑问数,如4) (列出按参与的研究机构数量计算平均疑问数40) 5.2疑问的处理情况

疑问产生到答疑天数 中位天数 (天) (列出各类疑问生成到答疑的平均天数) 范围(天) (列出最短天数和最长天数范围) 5.3疑问管理中的主要问题

(注:根据实际情况列出数据疑问处理中各类主要问题的类别,所涉研究机构名称,实际问题发生的天数,和问题发生的实际原因分析。参考案例见表中。) 疑问重点问题 研究单位名称 PI001 PI001 … 时间/数量 120天 178(占总疑问50%) … 原因及说明 疑问回复时间最长研究机构及原因分析 疑问产生数量最高研究机构及原因分析 …(根据实际案例问题增减行列数)… 研究者之一离职 接任研究者培训不及时 … 6.医学编码

(注:按顺序列出完成编码的数据集名称,所用的相应编码字典名称和版本,以及各类数据集的编码总条数(包括手工编码和程序编码)。参考案例见表中。) 编码数据(数据集名称) 编码字典 MedDRA WHODrug MedDRA MedDRA … 编码字典版本 17.0 WHOdrug 15Jan2014 17.0 17.0 … 编码数量 不良事件AE 合并用药CM 医学诊断SG=Surgery or FA=Findings about Event 既往病史HX …(根据实际编码数据集条目增减行列数)… 第 35 页 共 39 页

7.SAE一致性核查

本试验过程中共观察到严重不良事件(SAE)N例,其中与试验药物相关的SAE _N_ 例;按N次/月的频率,共进行了N次一致性核查,其中有N例经核查不一致的SAE详见附表(SAE发生率列表附后)。 (注:N代表实际发生的次数)

第 36 页 共 39 页

8.外部数据管理

(注:按实际外部数据来源列出各类外部数据的名称,相应外部数据提供的单位名称,相应外部数据传输协议名称和版本号,传输频率和相应传输方式等。如果要求盲态,请将盲态管理规程作为附件提供;如果进行一致性核查,请将一致性核查结果报告作为附件提供,如果未进行一致性核查,请给出原因。参考案例见表中。) 外部数据类型 数据源单位 数据传输协议 传输频率 首次 ECG1 传输日期 末次 YYYY-MM-DD YYYY-MM-DD YYYY-MM-DD YYYY-MM-DD YYYY-MM-DD 盲态要求 是 否 是 一致性核查 否 传输方式 国际心电图中心 友好医院 有爱医院 爱家医院 全球药动实验室 … 2013.0630V1.0 2013.0630V1.0 20130715V1.0 20130801V1.0 20130810V1.1 … 每月二次 每月一次 每月一次 每月一次 试验结束 … YYYY-MM-DD YYYY-MM-DD YYYY-MM-DD YYYY-MM-DD YYYY-MM-DD) ? ? ? ? ? ? ? ? ? 在线传输 在线传输 在线传输 在线传输 CD … 化验室Labs-1 化验室Labs-2 化验室Labs-3 药代PK …(根据实际外部数据类型增减行列数) 未导入临床试验数据库 第 37 页 共 39 页

9.数据质控和稽查

9.1 数据质量评估

(注:根据实际质控步骤,列出数据流程中完成的数据项目评价名称,计划完成的时间或数量,实际完成的时间或数量。如果实际与计划有偏差,提供原因或说明;没有的话可以不填。如果质控评估过的条目没有预期计划,可以留空。参考案例见表中。) 核查项目 数据录入天数(针对纸质CRF) 方案不依从总数(件) 计划 实际发生(平均) 原因及说明 5–10 天 12 天 PI 研究员离职 20 2 入组条件 心电图数据导入不及时 严重方案不依从数(件) …(根据实际评估项目增减行列数) 9.2 质控核查

(注:根据实际发生的质控核查情况,顺序列出各次核查时受试者总例数、关键指标错误率、非关键指标的抽样例数、抽样比例及依据和错误率。参考案例见表中。) 核查次数 总例数 80 关键指标 错误率 0.3% 抽样例数* 9 抽样比例 11.18% 非关键指标 抽样比例依据 错误率 0.2% 0.05% 第一次 第二次 …(根据实际核查次数增减行列数) 总病例数小于100例,则抽取例数为总病例数的平方根 总病例数大于100,将随机抽取10%的病例 200 0.05% 20 10% *:每次核查不能重复抽样。

9.3 数据管理过程稽查

(注:按照稽查发生的时间顺序,列出负责稽查的单位名称和时间,相应各次稽查发现的问题及其相应各次发现问题的纠偏和防偏措施。发现问题请将稽查报告作为附件提供。参考案例见表中。) 稽查负责单位 稽查时间 2013-11-07 发现问题 纠正和预防措施 医药公司AB 试验方案修正了入组条件但是CRF和数据库没有及时更改 立即进行了CRF及数据库修改;相关人员进行SOP再培训。 … …(根据实际稽查事件增减行列数) … … 第 38 页 共 39 页

10.提交锁定的数据集

(注:根据实际数据集的提交情况,列出数据集名称,相应提交日期,提交的单位名称,提交的数据集格式,和提交的对象及其提交原因;对于提交后的原数据集和备份数据集,列出存储地点,相应数据集负责人及其对数据集的权限。参考案例见表中。) 提交提对提交日数据集 期 单位 原因 PHAMA-CNS1234.dataset.xpt 2014-04-06 合SAS-SDTM 申办https://datarepository.xx.xxx.com/ https://datarepository.yy.xxx.com/ 吴式 及交提交格象储存地点 备份地点 人权* 限 责任任人责原数据集 临同公司CD 者,锁库后的统计分析 柒 床信息技术经理 …(根据实际提交的数据集 情况增减行列数) *:除责任人外,其他人对数据集的所有权限均已被解除。

11.数据管理实际过程与数据管理计划不一致

请描述数据管理过程是否存在与数据管理计划的不一致,有任何不一致,需详细描述实际过程,发生原因。同时需要阐述此过程对数据质量的影响。

(注:根据实际情况予以描述。如果没有出现不一致的情况,则可以写成“不适用”等。)

第 39 页 共 39 页