返回首页

夏令时建模的方法论陷阱:一项关于美国昼夜节律研究的深度纠错

引言:一个看似简单的科学问题

每年春天,全球数十个国家的居民会在某个周日凌晨将时钟拨快一小时;到了秋天,再拨回来。这就是夏令时(Daylight Saving Time,DST)——一项起源于19世纪末、在两次世界大战中被广泛采用、至今仍在约70个国家实施的时间调整制度。

支持者认为,夏令时能让人们在夏季傍晚多享受一小时的自然光照,从而节约能源、促进户外活动。反对者则指出,人为地打乱社会时钟与生物时钟之间的对应关系,可能对心血管健康、代谢功能乃至心理健康造成不利影响。近年来,围绕"是否应当废除夏令时"或"是否应当永久保留夏令时"的争论愈演愈烈,政策制定者迫切需要高质量的科学证据来指导决策。

正是在这样的背景下,2025年,斯坦福大学的Lara Weed和Jamie Zeitzer在美国国家科学院院刊(PNAS)上发表了一项颇具影响力的研究。该研究声称,通过建立昼夜节律模型并将其与美国各县的健康数据进行交叉关联,他们发现夏令时暴露程度与肥胖症及中风的患病率之间存在显著的地理相关性。这项研究迅速引起了媒体关注,也被反夏令时阵营广泛引用。

然而,2026年6月17日,西班牙塞维利亚大学的José María Martín-Olalla和西班牙圣地亚哥·德·孔波斯特拉大学的Jorge Mira在上张贴了一篇措辞严厉的方法论批评报告。他们发现了Weed和Zeitzer研究中一个根本性的计算错误——一个符号反转错误,该错误直接导致美国东西轴线被完全颠倒,使得整个分析结论失去了经验基础。

研究背景:昼夜节律模型如何工作

要理解这篇批评文章的价值,首先需要了解昼夜节律建模的基本原理。

人类的生物钟——即昼夜节律系统——是一个以大约24小时为周期的内在计时机制。它调节着我们的睡眠-觉醒周期、体温波动、激素分泌和代谢活动。这个系统的核心参数是核心体温最低点(CBTmin),它通常出现在凌晨的某个时刻,标志着生理功能的"谷底"。

昼夜节律模型试图通过数学方程来模拟这个复杂系统的动态行为。模型输入通常包括:光照条件(自然光和人造光的时间分布)、社会作息(工作时间、就寝和起床时间)、以及地理参数(纬度和经度)。模型输出则包括CBTmin的逐日变化,进而可以计算出所谓的"年度昼夜节律负担"(yearly circadian burden),即全年CBTmin逐日变化量的累积绝对值。

在这个框架中,太阳时间和社会时间之间的关系至关重要。地球自西向东自转,使得同一时区内不同经度的地方存在太阳时差异。位于时区标准经线以西的地区,太阳正午发生在社会时钟的12:00之后;位于以东的地区则相反。这种经度差异必须被正确地纳入模型,否则所有后续分析都将建立在错误的地理基础之上。

Weed和Zeitzer研究的具体内容

Weed和Zeitzer的模型采用了一个标准化的作息方案:工作日早7点至晚10点为清醒时间,早9点至下午5点为工作时间,周末为自由活动时间。光照条件被设定为:工作场所500勒克斯,晚间120勒克斯,其余时间由环境光照决定,上限为10千勒克斯。

研究者使用365天的时间序列,以5分钟为步长进行模拟。在这个模型中,时间序列表示平均太阳时(ts),太阳亮度和预设光照条件通过昼夜节律的L过程和P过程方程来驱动系统的演化,最终得到CBTmin的逐日值。

纬度参数通过改变太阳亮度、正午太阳高度和日出日落时间来影响模型。太阳正午与社会时钟正午12:00之间的差异由经度偏移量to来描述,它等于当地经度λ减去时区标准经线λt,再除以地球自转角速度Ω(15°/小时):

to = (λ - λt) / Ω

这个公式是整个建模框架的基石。当to为负值时(位于时区西部),太阳正午发生在社会时钟的12:00之后,太阳时ts滞后于社会时tc。

致命错误:符号反转导致的东西颠倒

Martín-Olalla和Mira在仔细审查Weed和Zeitzer公布的MatLab代码后,发现了一个令人震惊的根本性错误。

在代码文件computeCircadianShifting.m的第41行,计算经度偏移to时,作者将经度偏移量除以了Ω = -15°/小时,而不是正确的Ω = 15°/小时。这个负号的引入,直接导致to的符号被反转。

这个看似微小的编程错误造成了灾难性的后果:它将美国的地理坐标系统完全颠倒了。具体来说,在正确的模型中,位于时区西部(经度更偏西)的地区,太阳时应该滞后于社会时——也就是说,在社会时钟显示早上9:00时,当地实际上还处于更早的太阳时。然而,由于符号反转,模型错误地将西部地区处理为太阳时超前于社会时。

用更直观的方式来说:这个错误使得模型中的"东"变成了"西","西"变成了"东"。当我们把真实的美国各县健康数据(肥胖症患病率、中风患病率等)与这个"翻转"后的地理模型进行交叉关联时,实际上是在用加州的疾病数据去匹配纽约的昼夜节律负担,用缅因州的健康指标去对应亚利桑那州的光照条件。

这种张冠李戴式的分析,其结论自然不具备任何科学意义。

第二个问题:太阳时间与社会时间的优先级错乱

除了符号反转这个核心错误之外,Martín-Olalla和Mira还指出了Weed和Zeitzer方法论中的另一个系统性问题。

在正确的方法论框架中,太阳条件应该被视为给定的不变量——同一个纬度上的所有地点,它们接收到的太阳光照是相同的。变化的是社会作息安排:不同经度的地方,由于时区标准化的原因,相同的太阳事件(如日出、正午)对应着不同的社会时钟读数。因此,布尔条件(如"工作时间内光照为500勒克斯")应该以社会时钟来设定,然后通过经度偏移量映射到太阳时间。

然而,Weed和Zeitzer的做法恰好相反。在代码中,光照条件(computeLux函数,第44行)被经度偏移量修正了,但定义光照食谱的布尔条件(第50行起)却被保持为统一值。这意味着,作者将太阳条件当作了可变因素,而将社会条件当作了固定因素——这与物理现实完全颠倒。

这种方法论上的错乱引入了一种虚假的"数据密度"感,掩盖了时间序列的离散性质,并阻碍了模型一致性的检验。打个比方,这就好比在研究不同地区的气温对人体健康的影响时,错误地让太阳的位置随着城市的不同而变化,却假设所有城市的作息时间完全一致。

年度昼夜节律负担:一个脆弱的指标

Weed和Zeitzer用"年度昼夜节律负担"Y作为核心指标,定义为全年CBTmin逐日变化量的绝对值之和:

Y = Σ|Δi|

其中Δi = CBTmin[i+1] - CBTmin[i]。

Martín-Olalla和Mira指出,这个指标在数学上存在一个根本性的缺陷:取绝对值使得该指标对Δi的符号不敏感。这意味着一个稳定的、被良好调节的昼夜节律相位,与一个不断单方向漂移的、不受调节的相位,只要它们的累积绝对值相近,就会产生相同的Y值。从生理学角度看,这两种情况代表着截然不同的健康状态,但Y指标无法区分它们。

作为替代方案,作者建议使用逐日变化量Δi的标准差(SD)。标准差不仅对信号的波动更为敏感,而且在统计学上更适合作为关联分析的预测变量。

即便接受Y指标的有效性,其数值本身也值得审视。Weed和Zeitzer报告的年度负担约为16分钟,平均到每天仅为2.63分钟,相当于一天的0.2%。Martín-Olalla和Mira质疑:如此微小的时间偏移,是否真的能够产生可被统计方法检测到的、具有公共卫生意义的健康效应?考虑到昼夜节律模型本身的简化假设和不确定性,以及流行病学数据中固有的混杂因素,这种量级的效应几乎不可能被可靠地分离出来。

此外,Y指标在参数空间中的表现也令人担忧。Martín-Olalla和Mira的分析显示,当经度偏移to或冬至日出时间WSR发生微小变化时,Y值会出现明显的波动,缺乏平滑性。这种不稳定性进一步削弱了Y作为公共政策决策依据的可靠性。

生态学谬误:个体与群体的混淆

除了计算错误和指标缺陷之外,Weed和Zeitzer的研究还面临着"生态学谬误"(ecological fallacy)的指控。生态学谬误是流行病学中一个广为人知的偏倚来源:它发生在研究者将个体层面的因果关系推断为群体层面的关联时。

在Weed和Zeitzer的分析中,昼夜节律模型模拟的是一个"典型个体"的生理响应——这个个体有着固定的作息时间、固定的光照暴露模式、固定的生理参数。然后,研究者将这个个体层面的模型输出(即CBTmin的逐日变化)与县级层面的群体健康数据(肥胖症患病率、中风患病率)进行关联分析。

这种分析策略隐含了一个假设:一个县的平均健康状况可以通过该县"典型居民"的昼夜节律负担来预测。然而,现实远比这复杂。同一个县内的居民在职业类型、作息习惯、光照暴露模式、年龄分布、社会经济地位等方面存在巨大的异质性。用一个统一的模型参数来代表数千人的昼夜节律状态,然后将其与聚合层面的健康指标进行关联,这种做法在方法论上是站不住脚的。

正确的建模方法论

基于以上分析,Martín-Olalla和Mira提出了一套系统的方法论框架,用于正确地进行夏令时的昼夜节律建模。

**第一,锚定物理现实。**太阳条件是给定的、不可改变的。同一纬度上的所有地点接收到相同的太阳光照。建模时,太阳时间序列应该被设定为基本输入,而不是社会时钟。

**第二,正确处理经度偏移。**时区标准化在社会时钟和太阳时之间引入了一道系统性的不连续线。位于时区西部的地点,太阳正午晚于社会时钟的12:00;位于东部的地点则相反。这个关系必须通过正确的符号约定来表达,任何符号错误都将导致地理坐标的系统性翻转。

**第三,合理进行空间离散化。**经度偏移to可以被离散化为5分钟的区间,以确保模型中的布尔条件在同一个时间步长内保持一致。纬度则可以通过冬至日出时间WSR来参数化,因为WSR是人类活动的一个自然同步器——在热带地区,全年日出时间变化很小,人们的作息相对稳定;在高纬度地区,冬夏季日出时间差异巨大,人们面临着更大的昼夜节律挑战。

**第四,选择稳健的统计指标。**年度昼夜节律负担Y的绝对值求和方式使其在数学上存在固有缺陷。标准差提供了更为稳健的替代方案,它不仅对信号的波动更为敏感,而且在统计推断中具有更好的性质。

**第五,警惕生态学谬误。**将个体层面的模型输出与群体层面的健康数据进行关联时,必须充分考虑聚合水平和个体水平之间的不对应关系。县级分析可能掩盖了县内巨大的异质性,使得任何因果推断都变得不可靠。

结果的重新解读

在建立了正确的方法论框架之后,Martín-Olalla和Mira重新运行了昼夜节律模型,得到了一系列具有启发性的结果。

首先,他们确认了年度昼夜节律负担Y在整体上是非常低的。在锁定时钟(非季节性时钟政策)下,Y的分布呈现出一种与纬度参数WSR高度耦合的模式:一条从西南到东北的低负担带清晰可见,对应着那些社会作息与太阳周期良好同步的地区。这表明,对于美国的地理特征而言,现行的社会作息方案(早9点至下午5点)与冬至日出时间之间大约存在1.5小时的合理偏移。

其次,在季节性时钟政策下,Y的分布与锁定时钟的基线情况大致相似。这是因为两种相反的效应在一定程度上相互抵消:从标准时间切换到夏令时确实通过提前社会作息降低了部分地区的负担,但半年一次的时钟转换又在过渡日期前后人为地推高了负担。这两种效应的净效果非常小。

第三,当比较永久夏令时与永久标准时间时,模型的结果更加微妙。从西南到东北的一条带状区域在永久夏令时下负担增加(在热图中显示为红色),这与标准时间下低负担带的分布形成呼应。然而,对于习惯于较早作息的个体而言,永久夏令时意味着负担的恶化。这种差异化的结果表明,用Y作为公共政策的唯一决策依据是不充分的。

学术争议的来龙去脉

这篇批评文章并非孤立事件,而是围绕Weed和Zeitzer研究展开的一系列学术回应的一部分。

2025年,Weed和Zeitzer的原始论文在PNAS发表后不久,Erren、Lewis和Morfeld便在同一期刊上发表了评论文章,指出了县级昼夜节律建模在时间政策辩论中面临的诸多挑战。几乎同时,Martín-Olalla和Mira也发表了他们的第一封"来信",质疑了将绝对昼夜节律偏移之和作为关联夏令时政策与健康问题的指标的合理性。

Weed和Zeitzer随后在PNAS上发表了回应,为他们的方法论进行了辩护。这场学术争论促使Martín-Olalla和Mira决定亲自下载并运行Weed和Zeitzer的原始代码。正如他们在论文末尾的"时间线"部分所述:"好奇心驱使我们去做了。"

代码运行耗时数天(处理3108个美国县级行政单位需要大量的计算资源),但这给了两位作者充足的时间来深入审视方法论的细节。他们首先注意到太阳时间与社会时间的优先级错乱问题——这个问题"就摆在明面上",但在最初阅读论文时,他们接受了作者的框架假设,没有进行彻底的方法论审查。

随后,在进一步检查代码的过程中,他们突然发现了符号反转错误。这个错误同样"就摆在明面上",藏在代码注释之间。代码的注释正确地指出"东方更早变亮",但由此得出的指令"因此要提前时钟"却产生了矛盾:在他们的模型中,西部地点在社会时钟9:00时的光照条件被错误地设定为比实际更亮。

此后,PNAS还发表了Weed和Zeitzer原始论文的更正声明(Anonymous, 2026),但根据Martín-Olalla和Mira的分析,这个更正并未触及核心的符号反转问题。

更广泛的意义

这篇批评文章的意义远不止于对一篇具体论文的纠错。它揭示了跨学科研究中几个普遍存在的陷阱。

**计算物理模型与流行病学数据的结合需要极端谨慎。**昼夜节律模型是一个高度简化的计算抽象,它用少数几个参数来描述一个极其复杂的生理系统。将这种模型的输出直接用于流行病学关联分析,需要对模型的假设、局限性和不确定性有透彻的理解。当模型中存在计算错误时,由此得出的任何流行病学结论都是不可靠的。

**代码审查应该成为计算科学的标准实践。**Weed和Zeitzer的符号反转错误藏在一个MatLab脚本的某一行中。如果他们公布代码时附带了详细的单元测试和边界条件验证,这个错误很可能在发表前就被发现。同样,如果同行评审人被要求实际运行代码并验证输出,而不是仅依赖论文中的文字描述,这个错误也不至于在发表后才被发现。

**政策相关的科学需要更高的方法论标准。**夏令时政策影响着数亿人的日常生活。如果政策决策基于存在根本性错误的科学证据,其后果将不可估量。这要求研究者在发表具有政策含义的科学结果时,必须采用比常规学术研究更为严格的方法论标准。

**符号错误是计算科学中最具破坏性的错误类型之一。**一个简单的负号就可以将整个坐标系统翻转,将东变成西,将正变成负。这种错误往往不会在模型的输出中留下明显的异常痕迹——翻转后的结果可能看起来"合理",只是地理上对应的是完全错误的地点。这使得符号错误比其他类型的编程错误更难被发现,也更难被识别。

方法论建议的具体细节

Martín-Olalla和Mira在报告中提供了若干具体的方法论建议,值得详细展开。

关于数据离散化,他们建议将经度偏移to离散化为5分钟的区间。这个选择并非随意的——它与模型的时间步长δ相匹配。在5分钟的分辨率下,to的离散化确保了布尔条件(如"工作时间内"或"就寝时间")在同一个时间步长内保持一致,避免了边界条件的模糊处理。

关于纬度参数化,他们引入了冬至日出时间WSR作为纬度的代理变量。WSR的计算公式为:

WSR(φ) = 12 - (1/Ω) × arccos(tan(φ) × tan(ε))

其中ε = 23.45°是地球的轴倾角。这个公式近似计算了太阳中心经过地平线的时刻,可以被反转。因此,将空间域划分为WSR的5分钟区间是合理的。

关于美国地理的特殊性,他们指出,在美国的经度范围内,共有207个不同的(to, WSR)组合区间,其中29个区间包含至少30个县级行政单位。这个密度为统计分析提供了足够的样本量,但前提是地理坐标的映射必须是正确的。

关于昼夜节律模型的三种时间类型(早型τ=24.0、中间型τ=24.2、晚型τ=24.4),他们发现Y负担随着时间类型的推迟而增加。这意味着晚型人群在现行的夏令时制度下面临更大的昼夜节律压力。这一发现与此前的独立研究结果一致,表明晚型人群可能更需要政策层面的保护。

对公共政策的启示

尽管Martín-Olalla和Mira反复强调他们"并不从这些结果中得出永久夏令时优于永久标准时间或现行季节性时钟的结论",他们的分析仍然提供了一些值得注意的政策线索。

第一,年度昼夜节律负担Y在整体上非常低,这意味着在当前的建模范式下,用Y来区分不同时钟政策的健康影响是极其困难的。任何声称能够通过Y来量化时钟政策健康效应的研究,都需要首先证明这种微小的信号能够在流行病学数据的噪声中被可靠地检测到。

第二,Y在参数空间中的不稳定性表明,它不适合作为公共政策的决策指标。政策决策需要基于稳健的、可重复的科学证据,而不是对参数微小扰动高度敏感的计算模型输出。

第三,虽然永久夏令时在某些纬度和时间类型组合下可能增加负担,但模型也显示,从现行的季节性时钟切换到永久标准时间,在某些地区可能改善负担。这种地理差异化的结果意味着,"一刀切"的全国性时钟政策可能不是最优解——至少在这个模型的框架下是如此。

第四,作者在结语中提出了一个深刻的观察:"现行的季节性时钟必须被理解为两种极端选择之间的适应性妥协。"这个观点超越了简单的"夏令时有害/无害"的二元对立,将时间政策定位为一个需要在多方利益之间寻求平衡的社会选择问题。

学术诚信与研究透明度

这篇文章的发表过程本身也是一个值得关注的学术诚信案例。

Martín-Olalla和Mira在报告末尾的"时间线"部分坦诚地记录了他们的研究过程。他们承认,在最初的评论文章中,他们"信任了作者的框架假设,没有彻底审查其方法论"。只有当他们决定亲自运行原始代码时,才发现了问题。这种自我反思的诚实态度,是科学自我纠错机制发挥作用的典范。

两位作者还公开致谢了他们使用的工具——包括大语言模型(用于语法和清晰度的润色)和MatLab 2025b(用于计算昼夜节律模型)。这种对工具的透明声明,符合当前计算科学领域日益增长的透明度要求。

从发表时间线来看,这篇文章的写作仅用了28个Emacs会话,从2026年6月17日17:40到21:08,大约三个半小时。考虑到文章的技术深度和方法论的严谨性,这个速度表明两位作者在昼夜节律建模领域有着深厚的积累——他们此前已经在这个课题上发表了多篇相关论文,包括关于人类初级活动的纬度趋势、工业化与前工业化社会的季节性同步、以及夏令时评估等方面的研究。

结语

科学的进步往往不是通过宏大的理论突破实现的,而是通过一个个具体的纠错、一次次方法论的改进、一场场学术争论来推动的。Martín-Olalla和Mira的这篇报告,正是这种科学自我纠错精神的生动体现。

他们的工作提醒我们:在计算科学时代,一个简单的编程错误——一个被放错位置的负号——就足以让一项看似严谨的研究走向完全错误的结论。而当这项研究的结论可能影响到数亿人的日常生活时,这种错误的代价就更加不可承受。

对于政策制定者而言,这篇文章传递了一个明确的信号:在基于昼夜节律模型制定时间政策之前,需要对支撑这些政策的科学证据进行更为严格的审查。对于科学研究者而言,它则是一记警钟:代码即论文,任何计算结果的可靠性都取决于其最薄弱的那个环节——而在Weed和Zeitzer的案例中,那个环节仅仅是一个负号。

正如作者在结语中所说:"这个方法论批评的最终启示是直截了当的:在科学语境中,必须始终将分析锚定在物理现实之上。太阳条件是给定的;是社会作息的灵活适应决定了两者之间的对齐。"

在时间政策的辩论中,我们需要的不是更多立场先行的倡导,而是更多这样脚踏实地的方法论工作。唯有如此,科学才能真正服务于公共利益。

评论