首页 > 医疗新闻/ 正文
利用全人群行政数据链接开展罕见病患儿的纵向研究,是评估其长期健康与教育结局的重要途径。然而,数据保护法规和伦理委员会常出于数据最小化原则,限制研究可使用的未患病对照个体数量,即要求每个病例仅抽取有限数量的对照(SCn)。这种做法对统计推断质量的具体影响尚缺乏系统评估。与此同时,大规模全人群计算也面临日益增长的能耗压力,减少样本量成为兼顾环保与效率的潜在策略。 为明确不同抽样比例下研究结论的可靠性,研究团队以先天性甲状腺功能减退症(CHT)为范例,采用蒙特卡罗模拟方法构建了包含十万名儿童的虚拟队列,其中CHT患病率、性别比例和合并症(以唐氏综合征为代表)分布均参照英国北泰晤士地区的真实数据设定。合并症作为潜在的混杂因素,其人群患病率被设为四种水平(从五千分之一到二十分之一),而CHT在合并症个体中的相对风险则设为无合并症个体的1.5倍、5倍和10倍。 研究设计了三种典型结局变量:连续型变量为11岁数学标准化测试分数,二分类变量为是否达到预期数学水平,时间事件变量则为神经发育障碍的诊断月龄。对于CHT对结局的影响,分别设定了小、中、大三种效应量,其中小效应指标准化均差不超过0.03或对数比