文献记录

能量消耗

Methodology of physical-activity and energy-expenditure assessment: a review

这类方法通过测量身体代谢的关键物理 / 化学指标,结合既定公式或比例关系计算能量消耗,是能量消耗测量的 “金标准” 类方案。

直接/间接测热法

双标记水法(DLW)

  • 核心逻辑:通过追踪体内稳定同位素(²H 和 ¹⁸O)的代谢衰减,计算二氧化碳(CO₂)产生量,再通过既定方程推导能量消耗。

  • 具体过程:受试者摄入含 ²H₂¹⁸O 的水后,同位素与体内水分混合;²H 仅随水分排出,¹⁸O 随水分和 CO₂共同排出(排出更快);通过质谱仪分析尿液中同位素浓度回落至初始水平的动力学过程,量化 CO₂产量,最终换算为 EE。

直接测热法

  • 核心逻辑:直接测量身体散发的热量,热量值即等于能量消耗值。

  • 具体过程:通过呼吸舱或水冷服装,持续监测流入 / 流出的水温、水流速度,计算身体的热损失,误差小于 1%。

间接测热法

  • 核心逻辑:基于 “营养氧化产热时,氧气(O₂)消耗与 CO₂产生量和热量成正比” 的原理(公式:营养 + O₂=CO₂+ 热量),通过测量 VO₂(摄氧量)和 CO₂产量估算 TEE。
  • 细分方式:
    • 闭合回路法:受试者在封闭系统中呼吸纯 O₂,CO₂被碱石灰吸收,通过气体体积减少速率计算 O₂消耗率,进而换算 EE(适用于基础代谢率 BMR 或静息代谢率 RMR);
    • 开放回路法(通风罩、道格拉斯袋、便携式热量计):测量吸入 / 呼出气体的流量、O₂和 CO₂浓度,通过气体交换差值计算 VO₂和 CO₂产量,最终估算 EE(适用于短时活动或现场测量,测量时长 1-5 小时)。

基于 “活动参数 × 能量成本” 的计算方式

这类方法通过记录身体活动的关键参数(时长、强度、步数等),结合预设的 “活动能量成本”(如 MET 值),间接推算能量消耗,操作更便捷

自我报告工具(问卷、日记 / 日志)

  • 核心逻辑:以 “活动时长 × 活动强度对应的能量成本” 为核心公式,量化不同场景下的 EE。
  • 具体应用:
    • PA 日记 / 日志:记录 1-7 天内具体活动(如步行、静坐)的时长,乘以该活动的预设能量成本(如 MET 值、Kcal/min),得到 EE(单位:Kcal、MET-min 等);
    • 定量历史问卷:通过收集活动的频率、强度、时长(覆盖职业、家庭、休闲等场景),计算连续变量形式的 EE(如 Kcal・kg⁻¹・week⁻¹),支持剂量 - 反应关系分析;
    • 回忆问卷:采用简化评分系统(如 MET-min・day⁻¹),通过活动强度分级(低 / 中 / 高)和时长估算 EE。

直接观察法

  • 核心逻辑:与自我报告工具一致,通过观察者记录受试者活动类型及持续时间,再乘以该活动的能量成本(如已发表的活动强度标准值),估算 EE。

大模型运用可能的方面

基于 “运动 / 生理信号转换” 的计算方式

这类方法通过运动传感器或生理监测设备捕捉身体信号,通过预设方程或关联模型转换为能量消耗值。

运动传感器

  • 计步器:仅记录垂直方向步数,可通过 “步数 × 平均步长” 转换为行走距离,再结合步行强度对应的能量消耗系数估算 EE;但无法区分步行、跑步等活动,默认每步能量消耗一致。

  • 加速度计(单轴 / 三轴):将身体运动的 “计数”(反映加速度变化)通过预设的预测方程,转换为 EE;其中单轴加速度计侧重垂直方向运动,三轴覆盖三维运动,换算更全面,但对上肢运动、爬坡等活动的 EE 可能低估(31%-67%)。

心率监测器

  • 核心逻辑:基于 “心率(HR)与摄氧量(VO₂)的线性关联” 估算 EE,关键采用 “FLEX HR 方法” 优化准确性。
  • 具体规则:
    • 设定 HR 阈值(HR FLEX 点,即运动时最低 HR 与静息时最高 HR 的平均值);
    • 高于阈值:HR 与 VO₂呈线性关系,用线性预测方程计算 VO₂,再换算为 EE;
    • 低于阈值:HR 与 VO₂关联不稳定,采用静息状态下的平均 HR 值估算 EE;
    • 优化方案:需通过间接测热法同步测量个体 HR 与 VO₂,建立个性化校准曲线,减少情绪、温度等非运动因素的干扰。

精准卡式公式
这是运动生理学经典公式,结合性别、心率储备、耗氧量,精准度更高,分男女版本:

  • 第一步:先算「心率储备(HRR)」(核心,代表运动的心率负荷)
    HRR = 最大心率(MHR) - 静息心率(RHR)✅ 最大心率估算:MHR=220 - 年龄(通用款,简单好用;体能好的人可微调为 218-0.6× 年龄)

  • 第二步:算「运动耗氧量(VO₂)」
    🔹 男性:VO₂ = [(AHR-RHR)÷HRR]×0.6×(MHR-70)+3.5

    🔹 女性:VO₂ = [(AHR-RHR)÷HRR]×0.5×(MHR-70)+3.5

  • 第三步:算热量消耗(核心:1L O₂=5kcal)
    热量(kcal)= VO₂ × 体重 (kg) × 运动时长 (h) × 5 ÷ 1000

男性耗氧量:

女性耗氧量:

Assessment of physical activity and energy expenditure: an overview of objective measures

能量消耗的组成

  1. REE(静息能量消耗)

    • 定义:禁食状态下、热中性环境中静息时的能量消耗(略高于基础代谢率 BMR)
    • 主要影响因素:年龄(随年龄增长降低)、性别(女性比男性低 5-10%)、体型(体量大者更高)、体成分(去脂体重是核心决定因素)
  2. TEF(食物热效应)

    • 定义:食物消化、吸收、代谢过程中消耗的能量,约占 TEE 的 10%
  3. PAEE(身体活动能量消耗)

    • 定义:PA 产生的额外能量消耗,是 TEE 中最具变异性的部分
    • 计算方式:PAEE = 0.9×TEE - REE(假设 TEF 占 10%)

Branched equation modeling of simultaneous accelerometry and heart rate monitoring improves estimate of directly measured physical activity energy expenditure

本研究以 12 名训练有素的年轻男性(22.7-30.0 岁,BMI 20.6-25.2 kg/m²)为对象,旨在评估分支方程模型结合加速度计(CSA)心率监测(HR) 估计身体活动能量消耗(PAEE)的精度,对比了个体校准(IC)和组校准(GC)的效果。研究通过 22 小时全身量热法获取实测 PAEE,将 CSA 和 HR 数据按不同权重(P₁₋₄)构建先验和事后分支模型,结果显示:所有分支模型的估计误差(先验 IC:4.4±29%、GC:3.5±20%;事后 IC:1.5±13%、GC:0.1±9.8%)显著低于单一 CSA(≤45%)、单一 HR(≥39%)及非分支组合(≥25.7%),且个体校准在分支建模中并非必需,该方法为 PAEE 的精准估计提供了更有效的手段。

算法

通过融合 HR(反映生理负荷)和 CSA(反映运动幅度)的同步数据,解决单一传感器的误差局限,实现 PAEE 的估计

数据采集与预处理

  • HR 数据:通过 Polar 心率监测仪每 15 秒采集 1 次,换算为分钟均值,再减去 “静息心率(RHR)”(睡眠时第 10 个最低 HR 值),得到 “超静息心率”(消除个体基础差异)。
  • CSA 数据:髋部佩戴 4 个 CSA 加速度计,分别以 15 秒和 60 秒为周期采样,取 4 个设备的分钟均值(减少设备差异和佩戴位置影响),单位为 “计数 / 分钟(counts/min)”。
  • 参考标准:通过 22 小时全身量热法实测总能量消耗(TEE),结合静息能量消耗(REE)、饮食诱导产热(DIT),计算真实 PAEE(PAEE=TEE-REE-DIT),作为算法验证的金标准。

定义

  • 身体活动强度(PAI):单位为 kJ・kg⁻¹・min⁻¹,是 PAEE 的核心中间变量,由摄氧量(VO₂)减去 REE 计算得出(1 升氧 = 20.35 kJ,假设脂肪和碳水供能各占 50%)。

  • 关键阈值

    • x:CSA 阈值(区分 “低运动幅度” 与 “高运动幅度”);
    • y:走跑转换 HR(区分 “步行” 与 “跑步” 的生理负荷);
    • z:Flex HR(区分 “活动” 与 “非活动” 的临界 HR,计算方式:10+(RHR+3km/h 步行时平均 HR)/2)

基础校准(将原始数据转化为 PAI)

分支模型的输入是 “HR-PAI” 和 “CSA-PAI” 的校准关系,需通过跑步机实验提前推导,分为 3 类校准方程:

1. CSA→PAI 校准(线性回归)

因 CSA 在 “低强度运动” 和 “中高强度运动” 的 PAI 关联不同,采用分段线性回归

  • 先定义 “CSA Flex 点”:3km/h 步行时 CSA 均值的 50%(组水平为 497 counts/min);
  • 当 CSA>497 counts/min(中高强度):PAI = 0.053×CSA + 47.88;
  • 当 CSA ≤497 counts/min(低强度 / 静息):PAI = 0.15×CSA。

    2. HR→PAI 校准(二次回归)

    HR 与 PAI 呈非线性关系,采用二次回归(强制过原点,即 HR=RHR 时 PAI=0):

  • 仅使用 3-16 km/h 速度区间的数据(覆盖步行和中速跑步);

  • 方程:PAI = 0.011×HR² + 5.82×HR(HR 为 “超静息心率”)。
  • 方程中的 CSA 是原始值(单位:counts/min),HR 是预处理后的 “超静息心率”(非原始 HR,也不是换算后的 HR-PAI) —— 两者均为传感器原始数据经过简单处理后的形式

    3. 非分支组合校准(多元线性回归,对照组)

    作为分支模型的对比基准,直接加权融合 HR 和 CSA 数据:

  • 方程:PAI = 0.028×CSA + 4.04×HR - 38.3;

  • 局限:仅简单加权,未利用 HR 与 CSA 的同步时序特征,泛化性差(误差≥25.7%)

这个方程是组水平的非分支组合校准方程,通过 “跑步机校准实验 + 多元线性回归拟合” 推导得出,核心是将加速度计(CSA)与心率(HR)数据线性融合,用于预测身体活动强度(PAI)

这是研究中的对照组模型(非分支组合模型),用于对比分支方程模型的优越性。其本质是 “加权平均式” 融合 CSA(运动幅度)和 HR(生理负荷)数据,未利用两者的同步时序特征,是传统的双传感器数据组合方法。

  • 自变量:CSA(原始计数 / 分钟)、HR(超静息心率,即 HR - RHR);
  • 因变量:上述计算的真实 PAI;
  • 拟合方法:在组水平(12 名受试者的合并数据)进行多元线性回归,强制拟合线性方程 PAI = a×CSA + b×HR + c(a、b 为权重系数,c 为常数项);
  • 系数确定:通过最小化 “预测 PAI 与真实 PAI 的误差”,最终拟合得到系数:a=0.028、b=4.04、c=-38.3,即方程 PAI = 0.028×CSA + 4.04×HR - 38.3
  • 最小化 “预测 PAI 与真实 PAI 的误差” 采用最小二乘法(Least Squares Method),通过数学优化求解回归方程系数,使误差平方和最小。最小化 “每个数据点的真实 PAI 与预测 PAI 的误差平方和”(而非直接最小化误差和,避免正负误差相互抵消)
  • 设PAI = a×CSA + b×HR + c,其中 a(CSA 权重系数)、b(HR 权重系数)、c(常数项)为待求解的未知参数,也是优化的核心对象,
  • 数据输入:将跑步机校准实验(3-9 km/h 速度区间)的所有数据点(含不同速度、不同受试者、2 次重复校准的 CSA、HR 及对应真实 PAI)代入目标函数。
  • 求解系数:通过最小二乘法的数学推导(解线性方程组),找到使误差平方和最小的 a、b、c。解方程组核心逻辑:对误差平方和分别求 a、b、c 的偏导数,令偏导数为 0,得到 3 个线性方程,联立求解即可。

分支方程模型(融合 HR 与 CSA)

传统融合方法(如多元线性回归)的核心缺陷是 “一刀切”—— 无论活动类型(如步行、骑行、静坐)如何,均对 HR 和 CSA 数据进行固定权重加权

分支方程模型的设计逻辑正是针对场景动态调整权重:通过预设 / 优化的 “CSA 阈值(x)” 和 “HR 阈值(y/z)”,将复杂的身体活动划分为 4 类典型场景,为每类场景分配 HR 与 CSA 的最优贡献权重,实现 “该用 HR 时用 HR,该用 CSA 时用 CSA,两者都适用时按比例融合”。

权重参数(分配贡献的 “比例”)

权重参数(P1−4)代表 HR-PAI(心率推导的活动强度)在总 PAI 中的贡献比例,对应的(1-P1−4)则是 CSA-PAI 的贡献比例,先验预设遵循 “场景适配性” 原则:

权重符号 先验预设值
P1 1(100%)
P2 0.5(50%)
P3 0.5(50%)
P4 0(0%)

通过 “CSA 是否>x” 和 “HR 是否>y/z” 的双重判断,将所有活动划分为 4 个场景,每个场景对应固定 / 优化的权重

各场景的典型活动与权重适配性示例:
场景 典型活动 权重适配逻辑
Box1 跑步、快速骑行 高运动幅度(CSA>5)+ 高 HR(> 走跑转换 HR),HR 能精准反映高强度负荷,故 P₁=1
Box2 快走、爬缓坡 高运动幅度(CSA>5)+ 中低 HR(≤走跑转换 HR),CSA 反映步幅 / 速度,HR 反映疲劳度,故各占 50%
Box3 慢骑、举重 低运动幅度(CSA≤5)+ 高 HR(>Flex HR),CSA 无法捕捉静态负荷,需 HR 补充,故各占 50%
Box4 静坐、慢走 低运动幅度(CSA≤5)+ 低 HR(≤Flex HR),HR 易受非运动因素干扰,CSA 更稳定,故 P₄=0

对量热计实验中采集的 “每分钟 HR 和 CSA 数据”,按以下流程计算融合 PAI:

  1. 数据预处理
    • HR:将原始 HR(beats/min)减去静息心率(RHR),得到 “超静息心率”(消除个体基础差异);
    • CSA:取髋部 4 个 CSA 加速度计的分钟均值(减少设备误差和佩戴位置影响)。
  2. 场景判断:按 “CSA 是否>x”→“HR 是否>y/z” 的顺序,确定当前分钟数据所属场景(Box1-4);
  3. 权重融合:根据场景对应的权重(P1−4),计算融合 PAI:.

PAEE 计算 —— 时间积分(从强度到总量)

PAEE 是 “12.5 小时清醒期(07:30-20:00)内 PAI 的累积总和”,每分钟的PAI为积分的单元,计算公式为:

模型的参数优化:从 “先验” 到 “事后” 的精度提升

模型分为 “先验模型” 和 “事后模型”,核心差异在于 “阈值与权重是否优化”—— 先验模型用预设参数,事后模型通过最小化误差优化参数,进一步提升精度:

先验模型(参数预设,快速应用)
  • 优化目标:最小化 “估计 PAEE 与量热计实测 PAEE 的标准误(SEE)”,公式为
  • 参数来源:基于生理常识和预实验设定(如 x=5 counts/min,P1=1);
  • 优势:无需优化,操作简单,适合大规模流行病学研究(无需复杂计算);
  • 精度:个体校准(IC)误差 4.4±29%,组校准(GC)误差 3.5±20%,已显著优于单一方法(CSA 误差≤45%,HR 误差≥39%)。
  • 优化参数:x(0-60 counts/min)、y(24-105 beats/min)、z(5.5-34 beats/min)、P1−4(0-100%,且P1≥P2≥P3≥P4,保证权重逻辑合理性);
  • 约束条件:参数范围基于 “先验值 ±50%” 扩展(如 y 的范围是 “走跑转换 HR±50%”),避免出现生理上不合理的参数(如 x=100 counts/min,远超日常活动 CSA 值);
  • 优化结果:组校准误差降至 0.1±9.8%,个体校准误差降至 1.5±13%,精度接近量热计实测水平(±2%)。
优化后参数的关键变化(与先验对比):
  • x(CSA 阈值):组校准优化为 35 counts/min(先验 5),说明群体层面 “低运动幅度” 的界定需更高 CSA 值;
  • P4(Box4 权重):组校准优化为 0.1(先验 0),说明低运动幅度 + 非活动状态下,HR 仍有 10% 的贡献(如静坐时轻微情绪波动导致 HR 小幅升高);
  • HR/CSA 贡献占比:优化后 HR 贡献 18-22%,CSA 贡献 78-82%,验证 “CSA 在日常活动中更稳定,HR 仅在特定场景补充”。

总结

这篇文章主要就是讲的用回归模型来计算热量,主要采集了两个数据,一个是csa计步器数据,一个是心率。先测量了金标准,然后以此计算误差。

总共用了两种方法,第一种是比较简单的回归模型,PAI = 0.028×CSA + 4.04×HR - 38.3;这个是按每分钟算的,CSA和HR都是每分钟的平均数据,按时间把每分钟的PAI求和就是总的PAEE;

第二种也是文章提出的核心改进,说白了就是加了几个分类讨论,文章是分了4类,给csa数据和hr分别设了阈值,根据情况来计算csa转换的PAI和hr转换的PAI,不同情况对应不同的系数;这些系数体现了csa和hr对PAI的贡献的权重;然后根据情况用csa转换的PAI和hr转换的PAI来计算每分钟的PAI,最后也是按时间加起来得到总的PAEE。在这里,这些阈值和系数是先验预设的(就是提前随便设置或者简单换算的初始值,和实验数据无关)

然后进行了参数优化,就是利用实验数据和金标准来调整系数,这样系数就和实验数据有关了,类似反向传播吧,提高准确率。

文章的结论就是分类讨论之后,准确度要提高了,相比单一 CSA(≤45%)、单一 HR(≥39%)及非分支组合(≥25.7%)。

核心就是用了更复杂的非线性拟合,这种非线性拟合可以拆分为简单的线性方程和非线性方程的加权组合

Detection of Type, Duration, and Intensity of Physical Activity Using an Accelerometer

PA 检测技术的发展脉络

(一)活动类型检测的发展

  1. 传统加速度计的局限:早期加速度计基于「任意加速度单位(AAU)/ 分钟」测量,仅能反映 PA 的模式、持续时间和强度,进而估算能量消耗,但无法识别具体活动类型(如区分步行和骑行),且时间分辨率低(1 分钟 epoch),难以精准捕捉短时间、不连续的日常活动。
  2. 多传感器检测阶段:近几十年,分类算法与加速度计结合推动技术进步,早期采用多个加速度计(佩戴在胸、腿、脚等不同身体部位),分类准确率达 85%-95%,甚至能识别 32 种动作和姿势,但多传感器可能增加受试者负担,实用性受限。
  3. 单传感器检测阶段:为提升便捷性,后续研究转向「单加速度计」,佩戴于腰或胸部,可识别姿势(躺、坐、站)和常见运动(步行、跑步、骑行、划船等),分类准确率 71%-91%。
  4. 核心技术支撑:分类算法是关键,主流包括决策树、神经网络、贝叶斯分类器、隐马尔可夫模型,核心逻辑是将加速度信号分割为固定长度的「片段(segments)」,提取片段的信号特征进行活动类型判别;片段大小影响检测效果:采样频率固定时,片段越长,包含的信号样本越多,特征越丰富,但时间分辨率越低;片段越短,时间分辨率越高,理论上更易识别短活动,但需保证分类性能稳定。

(二)活动强度检测的发展

  1. 强度分类标准:动态活动(步行、骑行等)的强度(轻、中、剧)主要由运动速度决定(依据 Ainsworth 等的研究,结合 MET 值划分)。
  2. 传统强度检测的局限:早期通过 AAU 关联能量消耗来评估强度,但 AAU 与能量消耗的线性关系仅适用于单一活动类型,且只能测量 1 分钟以上的活动,无法满足多样化日常活动的强度评估需求。
  3. 技术改进方向:① 用躯干加速度计提取信号特征,估算步行速度及步态参数(步长、步频);② 结合 GPS 与加速度计,成为日常步行、跑步、骑行速度检测的最精准方法,但 GPS 设备佩戴性差、成本高,不适合大规模研究。

数据处理

文章的Data processing(数据处理) 是连接原始加速度信号与后续建模(活动分类、速度估计)的核心环节,目的是从原始数据中提取有意义的特征,为模型提供有效输入。

一、数据隔离:筛选有效活动信号

首先对原始加速度信号进行「提纯」,确保仅分析每个活动任务的稳定状态数据:

  1. 信号分割依据:根据实验中秒表记录的「活动开始时间」和「活动结束时间」,从连续的加速度数据流中,截取对应活动的信号片段(比如仅提取「户外步行」这段时间的信号,排除其他活动的干扰)。
  2. 排除过渡数据:为了避免活动启动 / 停止时的不稳定信号(比如从站立到步行的衔接阶段)影响分析,最终保留的有效数据是「开始后 5 秒」到「结束前 5 秒」的片段。这一 5 秒延迟的设置,是通过可视化观察数据确定的,核心是只保留活动的「稳态阶段」。

二、分段处理:设置不同时间分辨率的分析窗口

由于研究的核心目标之一是「找到兼顾分类准确率和时间分辨率的最优段大小」,数据处理中采用了「非重叠分段」策略,具体设计如下:

  1. 段大小(Segment Size)设置

    :将提纯后的活动信号,分割为 6 种不同长度的非重叠片段,对应 6 种时间分辨率:

    • 段大小:0.4、0.8、1.6、3.2、6.4、12.8 秒
    • 对应样本数:由于加速度计的采样频率是 20Hz(每秒采集 20 个数据点),因此各段的样本数为「段大小 ×20」,即 8、16、32、64、128、256 个样本。
  2. 分段目的:不同段大小直接影响特征的稳定性和时间分辨率 —— 段越大,包含的信号信息越丰富,特征越稳定,但时间分辨率越低(难以识别短时间活动);段越小,时间分辨率越高,但特征的 intraclass 变异性(同一活动类型内部的特征差异)越大,可能降低分类准确率。后续通过对比 6 种段大小的建模效果,最终筛选出最优值。

三、特征提取:从时域和频域提取关键信号属性

这是数据处理的核心,针对每个分段后的信号片段,提取「时域特征」和「频域特征」(均在 x、y、z 三个轴上分别计算,x = 垂直方向、y = 中外侧方向、z = 前后方向),这些特征能够反映活动的运动模式差异。

1. 时域特征(直接从原始信号中计算,反映信号的时间分布特性)

特征名称 定义与作用
均值(aˉ) 一段信号中加速度值的平均值,反映活动的整体运动强度(比如静态活动的均值更稳定,动态活动的均值波动大)。
标准差(σ 加速度值的离散程度,反映运动的剧烈程度(比如跑步的标准差远大于静坐)。
峰峰值($a^{pp}$) 一段信号中最大加速度与最小加速度的差值,体现运动的幅度(比如跳跃的峰峰值大于步行)。
同轴互相关(Rαβ 计算同一轴上「连续两个分段信号」的相似度(公式 1、2),反映运动的连续性(比如步行的步频稳定,同轴互相关值高;不规则活动的互相关值低)。
轴间互相关(Rαβ 计算同一时间段内「不同轴信号」的相似度(公式 1、2),反映运动在三维空间的协同性(比如骑行时前后方向与垂直方向的运动协同性强,轴间互相关值高)。

2. 频域特征(通过信号转换提取,反映信号的频率分布特性)

需先通过「快速傅里叶变换(FFT)」将时域信号转换为频域信号,得到「功率谱密度(P)」(反映不同频率成分的能量分布),再基于 P 提取以下特征:

特征名称 定义与作用
主频率(Dominant Frequency) 功率谱密度(P)最大值对应的频率,反映运动的主导频率(比如步行的步频对应特定主频率,跑步的主频率更高)。
谱峰幅度(A) 功率谱密度(P)的最大值,反映主导频率成分的能量强度(比如跑步的谱峰幅度大于步行)。
频域熵(J) 衡量频率分布的均匀性(公式 3),熵值越低,频率分布越集中(比如规律运动如骑行的频域熵低;不规则运动如洗碗的频域熵高)。

文章的 Modeling and statistics(建模与统计) 部分是实现研究核心目标(活动类型分类、活动强度 / 速度估计)的关键环节,核心逻辑是「针对不同研究目标选择适配的建模方法,通过严格的统计验证保证结果可靠性」。整个部分可分为 两大建模任务(活动分类 + 速度估计) + 统计检验方法,以下结合研究细节逐模块拆解:

数据处理 :活动类型分类(基于决策树模型)

目的是通过加速度特征,将受试者的活动精准划分为 7 类(躺、坐、站、动态站立、步行、跑步、骑行),并找到兼顾分类准确率和时间分辨率的最优参数。

1. 建模前准备:活动类别定义

先将实验中 20 项具体活动「归类」,形成决策树的目标分类标签(避免类别过多导致模型复杂):

归类后类别 包含的具体活动
躺(lie) 床上平躺
坐(sit) 椅子静坐、电脑办公
站(stand) 静止站立
动态站立(DS) 站立洗碗(静态姿势下的动态动作)
步行(walk) 走廊步行、上下楼、户外步行
跑步(run) 户外跑步
骑行(cycle) 户外骑行

2. 输入特征:时域 + 频域加速度特征

模型的输入是从加速度信号中提取的「量化特征」,均在三轴(x = 垂直方向、y = 中外侧方向、z = 前后方向)上计算,核心特征及作用如下(筛选后最关键的 5 个特征):

特征名称 类型 核心作用
中外侧方向标准差(σᵧ) 时域 区分「静态活动」(躺、坐、站)和「动态 /ambulatory 活动」(DS、步行、跑步、骑行):静态活动 σᵧ小,动态活动 σᵧ大
垂直方向加速度均值(aₓ) 时域 识别「躺」:躺姿时身体与重力方向平行,aₓ与坐姿、站姿差异显著
前后方向同轴互相关(R_z) 时域 区分「坐」和「站」:坐姿时身体静止,前后方向信号相似度高(R_z 大),站姿略低
垂直方向标准差(σₓ) 时域 识别「跑步」:跑步时垂直方向冲击力强,σₓ远大于其他动态活动
前后方向标准差(σ_z) 时域 区分「步行」「骑行」「DS」:步行时 σ_z 呈周期性波动,骑行时 σ_z 稳定,DS 时 σ_z 幅度小
频域熵(J) 频域 辅助区分不规则活动(如 DS):不规则活动频率分布均匀,J 值高;规律活动(步行、骑行)J 值低

3. 关键参数:6 种段大小(时间分辨率)

为了平衡「分类准确率」和「时间分辨率」,模型针对 6 种不同的「段大小」(信号分割的时间窗口)分别构建,参数如下:

段大小(s) 对应样本数(个) 核心特点
0.4 8 时间分辨率最高,但特征变异性大,分类准确率最低(90.4%)
0.8/1.6/3.2 16/32/64 准确率逐步提升,但仍低于最优值
6.4 128 最优:准确率 93.1%,且时间分辨率最高(可识别短时间活动)
12.8 256 准确率 93.0%(与 6.4 秒无差异),但时间分辨率低,无法精准捕捉短活动

模型构建流程(C4.5 算法)

所有决策树均采用C4.5 算法

C4.5算法

C4.5 算法是经典的决策树分类算法,由机器学习学者 Ross Quinlan 在 ID3 算法基础上改进而来,核心用于解决 “基于特征的多类别分类问题”。它在文章的决策树模型中起到了特征筛选、分支规则构建、避免过拟合的作用

决策树的本质是 “通过特征不断分割数据,让每个分支的数据越来越‘纯粹’(即同一类别占比越来越高)”。C4.5 算法的核心是用 “信息增益比” 判断特征的分割效果,选择最优特征作为每个节点的分支依据。

决策树的节点阈值不是手动设定的,而是算法通过「遍历所有可能分割点 + 计算信息增益比」自动筛选的 —— 核心目标是找到能让数据分类 “最纯粹”(信息增益比最大)的那个值,作为该节点的判别阈值。

阈值计算的核心原理

对某一连续特征(如文章中的 σᵧ、aₓ),C4.5 算法会通过以下逻辑确定最优阈值:

  1. 本质:将连续特征转化为 “二分类离散特征”(如 σᵧ > T 或 σᵧ < T),T 即为阈值;
  2. 核心准则:选择使「信息增益比(GainRatio)」最大的 T 作为最优阈值;
  3. 关键逻辑:分割后的数据 “类别纯度提升越多”,信息增益比越大,阈值的区分效果越好。
阈值计算的具体步骤(以文章中 σᵧ特征为例)

假设我们要为根节点的 σᵧ(中外侧方向标准差)计算阈值,步骤如下:

  1. 收集特征值并排序:提取训练集中所有样本的 σᵧ数值,按升序排列(如:0.1, 0.2, 0.3, 0.5, 0.7);

  2. 生成候选分割点:取相邻两个特征值的中点作为候选分割点(避免遗漏最优阈值),上述示例的候选分割点为:0.15, 0.25, 0.4, 0.6;

  3. 对每个候选分割点计算信息增益比

    • 按分割点 T 将样本分为两组(S₁:σᵧ < T;S₂:σᵧ ≥ T);
    • 计算两组的信息熵、信息增益、分裂信息;
    • 最终得到该分割点的信息增益比;
  4. 选择最优阈值:比较所有候选分割点的信息增益比,取最大值对应的 T 作为该节点的阈值(如示例中 T=0.4 时信息增益比最大,即为根节点阈值)。

涉及的核心公式
1. 信息熵(Entropy)

衡量样本集的类别混乱度:

  • $S$:当前样本集;
  • $C$:类别总数(本文$C=7$,对应7类活动);
  • $p(c)$:样本集$S$中类别$c$的占比($p(c) = \frac{\text{类别}c\text{的样本数}}{|S|}$)。
2. 信息增益(Gain)

以2类分割举例,分割后信息熵的降低量:

  • $A$:目标连续特征(如$\sigma_y$);
  • $T$:候选分割点;
  • $S_1$:$A < T$ 的样本子集,$S_2$:$A ≥ T$ 的样本子集;
  • $|S|、|S_1|、|S_2|$:对应样本集的样本数量。
3. 分裂信息(SplitInfo)

修正特征分割的分布偏向:

4. 信息增益比(GainRatio)

最终优化指标:

速度估计

多元线性回归模型,最小二乘法求解最终系数,方法和上一篇算ee的类似

模型类型 核心自变量(筛选后) 变量类型(时域 / 频域 / 身体特征) 关键说明
步行速度模型(R²=96.3%) 1. ln (σₓ):垂直轴标准差的自然对数2. R_yz:中外侧轴(y)与前后轴(z)的轴间互相关3. 身高(H)4. aₓ:垂直轴加速度均值5. Jₓ:垂直轴频域熵 1. 时域;2. 时域;3. 身体特征;4. 时域;5. 频域 自变量解释力逐步提升,Jₓ最终将 R² 提升至 96.3%(表 3 中 Partial r² 逐步增大)
跑步速度模型(R²=70.2%) 1. a_z^pp:前后轴加速度峰峰值2. R_zn:前后轴(z)与垂直轴(x)的轴间互相关3. A_z:前后轴功率谱密度谱峰幅度4. A_y:中外侧轴功率谱密度谱峰幅度 1. 时域;2. 时域;3. 频域;4. 频域 以时域 + 频域特征为主,无身体特征(可能因跑步速度与身体特征相关性弱)
骑行速度模型(R²=86.6%) 1. σ_z:前后轴加速度标准差2. σₓ:垂直轴加速度标准差3. J_z:前后轴功率谱密度主频率

总结

这篇论文主要讲了单传感器的活动分类方法,用的是决策树。

把采集的总的数据分割为固定长度的片段,然后用每个片段计算标准差等各种指标。这些指标用来计算决策树各个节点的阈值。

阈值的计算方法是c4.5算法,就是遍历计算各个分割的信息增益比,选择最小化信息增益比的那个分割的值作为判别的阈值。经过决策树的所有节点的判决,最后分类出结果。

速度的估计就是多元线性回归,系数用最小二乘法算,和上面算ee的类似。

和豆包的讨论

Improving assessment of daily energy expenditure by identifying types of physical activity with a single accelerometer

这篇文章和决策树分类活动的是同一个作者,用了活动分类来做能量计算。

这篇文章的核心是用单台三轴加速度计 + 分类树模型识别 6 类日常身体活动,结合 MET(代谢当量)值计算日均代谢当量(MET_D),最终显著提升了总能量消耗(TEE)、活动相关能量消耗(AEE)和身体活动水平(PAL)的估算精度

受试者与研究流程

  • 15 名健康成人(9 男 6 女),监测 5 天 PA(加速度计),同时用双标记水测量 2 周 TEE。
  • 加速度计佩戴于下背部,20Hz 采样,切分为 6.4 秒非重叠片段(平衡分类准确率和时间分辨率)

核心技术:活动识别 + MET_D 计算

MET(代谢当量):衡量活动强度的标准单位,1 MET = 安静坐姿下的代谢率(约 3.5 ml O₂・kg⁻¹・min⁻¹),数值越高强度越大(如躺 = 1 MET,跑步 = 11 MET)。

MET_D 的本质:不是单一活动的 MET 值,而是 “每日所有活动的强度 × 时长” 的综合体现,能客观反映个体一天的整体活动强度水平。

分类树模型:识别 6 类活动
  • 输入特征:三轴加速度的时域(均值、标准差、峰峰值)和频域(主频率)特征。
  • 分类目标:躺(Lie)、坐 / 站(Sit-Stand)、动态站立(AS,如洗碗)、步行(Walk)、跑步(Run)、骑行(Cycle)。
  • 模型性能:整体分类效果优异(表 1),其中 “躺”“跑步” 敏感性 100%,“步行” F 分数 99%,仅 “动态站立(AS)” 敏感性 69%(易与坐 / 站混淆)。
MET_D 计算:量化活动强度
  • 逻辑:以 “活动持续时间” 为权重,结合每类活动的标准 MET 值(来自 PA 代谢当量手册),计算日均加权 MET 值。
  • 关键:步行、跑步、骑行的 MET 值根据实测平均速度匹配(如步行 4.2km/h 对应 MET=3,跑步 10.6km/h 对应 MET=11)。

总结

这篇就是一个简单的加权求和,算每种活动的持续时间,然后用持续时间乘以这种活动的单位时长平均消耗的能量来计算一种活动的MET,最后加起来算一天的$MET_D$,最后用这个$MET_D$结合BMI、体重等参数,构建回归模型来算最终的能量消耗

单位时长平均消耗的能量是 Ainsworth 等发布的《身体活动代谢当量手册》给出的

Activity recognition using a single accelerometer placed at the wrist or ankle

SVM(支持向量机)做活动识别

一、分类器选择与配置

研究最终选定支持向量机(SVM) 作为核心分类器,具体配置和选择依据如下:

1. 分类器选择依据

文档明确提到 “SVM 分类器是理想选择”,核心原因有两点:

  • 优化特性:SVM 的优化准则是凸优化,意味着训练过程中不会陷入局部最优解,能找到全局唯一最优解,结果稳定性更强;
  • 工程实用性:存在成熟的开源工具包(本研究使用 LibSVM 工具包),无需从零实现,且适配小样本、高维特征(如本研究的时频特征、统计特征组合)的分类场景。

2. 关键配置参数

为了达到最优分类效果,研究通过预实验确定了 SVM 的核心参数:

  • 核函数:采用「径向基函数(RBF)核」,适合处理非线性数据(加速度计信号的时频特征与活动类型间存在非线性关联);
  • 超参数
    • 复杂度惩罚项 C=100(控制模型对训练数据的拟合程度,避免过拟合);
    • 核函数参数 γ=0.1(控制 RBF 核的 “影响范围”,平衡模型的泛化能力和拟合精度)。

3. 分类流程

  1. 对预处理后的加速度计数据(信号幅值向量 SMV),按指定窗口长度(2s/4s/12.8s)分割为独立样本;
  2. 对每个窗口提取特征(如时频分析特征、统计特征),形成特征向量;
  3. 将特征向量输入训练好的 SVM 模型,输出该窗口对应的活动类别(ambulation/cycling/sedentary/other)。

Using Deep Learning for Energy Expenditure Estimation with Wearable Sensors

研究概述

  • 核心目标:解决现有可穿戴传感器 EE 估算模型依赖手工特征、精度有限或离线运行的问题,通过深度学习(CNN)实现准确、在线的 EE 估算,支持个人健康管理和慢性病预防。
  • 关键创新:首次将 CNN 应用于 EE 估算,自动提取传感器原始数据特征,替代传统手工特征工程,提升模型泛化能力和精度。

研究方法

1. 数据预处理
  • 传感器数据:三轴加速度计(50Hz 采样率),采用 256 样本滑动窗口(约 5.12 秒)转换为输入向量;
  • 基准数据同步:COSMED K4b2 提供 EE 和心率数据(0.5Hz),通过插值与加速度数据匹配,每个窗口的平均 EE 作为基准值;
  • 特征集
    • 传感器特征:加速度数据自动提取特征 + 平均心率;
    • 人体测量特征:年龄、身高、体重、基础代谢率(BMR,基于修正 Harris-Benedict 公式计算)。

(1)加速度数据窗口化

  • 采用「半滑动窗口(half sliding window)」策略:窗口大小为 256 个样本,对应实际时间约 5.12 秒(256 样本 ÷ 50Hz);
  • 半滑动意味着窗口重叠 50%(相邻窗口共享 128 个样本),既保证数据连续性,又避免信息冗余;
  • 处理后,连续的加速度轨迹被转换为序列式输入向量,每个向量对应一个 CNN 输入层节点。

(2)EE/HR 数据与加速度数据同步

  • 问题:COSMED K4b2 的采样频率(0.5Hz)远低于加速度计(50Hz),时序不匹配;
  • 解决方案:
    1. 同步对齐:将每个 EE/HR 样本映射到加速度轨迹中最接近的时间点;
    2. 插值填充:对两个相邻 EE/HR 样本之间的所有加速度窗口,通过插值法估算对应的 EE 和 HR 值;
    3. 标签分配:每个加速度窗口的「平均 EE」作为该窗口的 “真实 EE 值(ground truth)”,「平均 HR」作为该窗口的动态特征。

(3)特征整合与标签处理

  • 最终输入特征包含两类:
    1. 动态特征:窗口化加速度数据(后续由 CNN 自动提取特征)、平均 HR;
    2. 静态人体测量特征:年龄、身高、体重、基础代谢率(BMR)——BMR 通过「修正 Harris-Benedict 公式」计算,需纳入性别因素;
  • 活动标签:根据数据采集时的人工标注,为每个窗口分配活动类型标签(如 “行走”“跑步”);若窗口包含多种活动(活动过渡时期),则分配 “过渡标签”。

简而言之,最后模型的输入是一段加速度的时间序列、平均HR(动态标量,对应的这一段时间序列期间的平均HR)和年龄 / 身高 / 体重 / BMR这些静态标量

2. CNN 模型架构
模块 细节描述
输入层 3 通道向量,对应三轴加速度计窗口化原始数据
特征提取器 2 层级联结构,每层包含:- 滤波:捕捉时间局部相关性(第 1 层 8 个 5 尺寸滤波器,第 2 层 4 个 5 尺寸滤波器);- 激活:tanh 函数引入非线性;- 平均池化:池化因子 2,降维并增强鲁棒性
MLP 回归层 - 隐藏层:400 个节点,移除 sigmoid 激活(提升线性转换效果);- 输出层:线性回归层,输出 EE 数值预测
模型训练 损失函数:RMSE(均方根误差);优化算法:随机梯度下降;参数初始化:特征提取器和 MLP 隐藏层随机初始化,输出层初始化为 0
实现工具 Theano 深度学习框架

该网络是整个 EE(能量消耗)估算模型的核心,核心设计逻辑是适配三轴加速度计的时序数据 + 融合多维度特征 + 定制化回归任务,最终实现 “自动提取运动特征→融合人体信息→精准预测 EE 数值” 的完整流程。

image-20260103141553235

每个输入的通道对应加速度传感器的xyz的一个轴,

多通道特征提取器(Feature Extractor):自动提炼运动特征

这是 CNN 的核心部分,采用「两层级联结构」(L1+L2),每个通道都配备一套完全相同的特征提取器(参数独立训练),每层包含 “滤波→激活→平均池化” 三个不可缺少的阶段。

阶段 原文参数 核心作用 具体实现逻辑
滤波(Filter) 8 个滤波器,每个滤波器大小 = 5 捕捉短时间内的局部相关性 - 滤波器是 “滑动窗口”:每个滤波器(5 个权重 + 1 个偏置)沿着 256 个样本的时序数据滑动;- 滑动时计算 “滤波器权重 × 对应样本值 + 偏置”,得到局部特征响应(比如捕捉 “5 个连续样本的加速趋势”);- 8 个滤波器对应 8 种基础特征(如 “快速波动”“缓慢上升”“周期性震荡” 等);- 输出维度:每个通道经过滤波后,得到 8 个「(256-5+1)×1」=252×1 的特征图(共 3 通道 ×8=24 个特征图)。
激活(Activation) tanh 函数 引入非线性,捕捉复杂模式 - 为什么选 tanh?:sigmoid 函数在输入值较大 / 较小时梯度接近 0(梯度消失),而 tanh 的梯度范围更广,适合深层网络;- 运算逻辑:对每个特征图的每个元素,计算 h = tanh(滤波输出),让特征图从 “线性响应” 变成 “非线性特征”(比如区分 “走路的缓慢波动” 和 “跑步的剧烈波动”)。
平均池化(Average Pooling) 池化因子 = 2,非重叠池化 降维 + 增强鲁棒性 - 把 252×1 的特征图,按 “每 2 个连续元素为一组” 分成 126 组,每组取平均值作为输出;- 输出维度:每个特征图从 252×1 压缩为 126×1(3 通道 ×8=24 个特征图);- 核心作用:① 减少后续计算量;② 避免过拟合(忽略微小波动的干扰,比如走路时偶然的身体晃动);③ 保留核心特征(比如 “平均加速趋势” 比单个样本的波动更有意义)。

这个滤波就是类似卷积的操作

  • 每个通道对应一个加速度轴,滤波操作就是对单个轴的时序数据,用可训练权重的滤波器逐段提取局部特征;
  • 滤波器的权重是核心可训练参数,通过迭代优化适配 EE 预测任务,这是 CNN 能自动提取复杂特征、超越传统手工特征模型的关键;
  • 最终训练好的权重,本质是 “模型学到的、与 EE 最相关的运动模式探测器”,支撑了后续高精度的 EE 估算
flatten

其实就是对提取出来的特征做一些操作,把特征图拼接和转换成一维的,这里就是732个点,每个点有一个值。把 12 个特征图(3 通道 ×4 个)按顺序拼接成一个一维向量,维度计算:3 通道 ×4 个特征图 ×61 个元素 = 732 维;再加上静态标量(身高体重等)也是拼在这个732个点后面,变成737个,然后把这个东西送进MLP

MLP

MLP 就是多层感知机,是整个 EE(能量消耗)估算模型的 “最终预测模块”,核心任务是将 “CNN 提取的运动特征 + 人体标量特征” 融合后,通过定制化的神经网络结构,精准输出 EE 的具体数值

隐藏层处理

隐藏层是 MLP 的 “核心计算层”,论文中设置为「400 个节点」,且做了关键的定制化修改(区别于分类任务的 MLP):

  1. 核心操作

    • 矩阵乘法:737 维输入向量 × 隐藏层权重矩阵(维度:737×400) + 隐藏层偏置向量(维度:400×1);
      • 权重矩阵:737×400 意味着 “每个输入特征都要和 400 个节点建立关联”,通过权重大小调节不同特征的重要性(比如 “平均 HR” 对 EE 预测更重要,对应权重会更大);
      • 偏置向量:给每个节点的输出加一个 “偏移量”,增加模型的拟合能力;
    • 无激活函数:论文明确移除了分类任务中常用的「sigmoid 激活函数」—— 这是针对回归任务的关键修改!
  2. 为什么移除 sigmoid?

    • sigmoid 的作用是 “将输出压缩到 [0,1] 区间”,适合输出 “类别概率”(比如分类任务中 “是跑步的概率 0.8”);
    • 但 EE 预测是 “数值回归任务”(EE 值可能是 0.5~5 kCal/min,是连续的实数),sigmoid 的压缩会导致 “无法输出大的 EE 值”(比如跑步的高消耗),还会造成梯度消失,影响训练效果;
    • 移除后,隐藏层本质是 “线性转换 + 隐含的非线性关联”(由前面 CNN 的 tanh 激活提供非线性),更适合将 737 维输入映射为 “与 EE 强相关的核心特征”。
  3. 输出结果:400 个节点对应 400 个实数(每个节点是输入向量经权重 + 偏置计算后的结果),形成「400 维中间特征向量」—— 这个向量是对 “运动 + 人体” 融合特征的进一步提炼,只保留和 EE 预测最相关的信息。

输出层处理 —— 线性回归(直接预测 EE 数值)

输出层是 MLP 的 “结果输出层”,同样针对回归任务做了定制化修改,彻底区别于分类任务:

  1. 核心操作

    • 矩阵乘法:400 维中间特征向量 × 输出层权重矩阵(维度:400×1) + 输出层偏置(维度:1×1);
    • 线性输出:无任何激活函数,直接输出计算结果 —— 这就是「线性回归层」的核心逻辑;
  2. 为什么用线性回归层?

    • 分类任务的输出层是 “逻辑回归层”(输出类别概率),而 EE 预测需要 “具体的数值”(比如 2.3 kCal/min);
    • 线性回归层的输出是 “连续的实数”,能完美匹配 EE 的数值范围,不会被激活函数限制;
  3. 输出结果:1 个实数(比如 1.8、2.5、3.2 等)—— 这个数值就是模型对该加速度窗口(≈5.12 秒运动)的「EE 预测值」,单位是 kCal/min(和 ground truth 的单位一致)。

MLP用了两个全连接层,用来对提取出来的特征做最后的整合,给出一个最终的预测值,这里的整合表现为矩阵乘法和降维,最终735个点,经过MLP的权重矩阵的相乘变成1个点,这个点的数值就是预测结果

降维就是通过矩阵乘法,a×b的矩阵乘以b×c的矩阵得到a×c的矩阵,这样就可以对数据进行升维和降维处理

这些权重矩阵的权重也是可训练的

参数学习与优化(Parameter Learning with Gradient Descent)
  1. 可训练参数:
    • 特征提取器:各层滤波器的权重 Wᵏ和偏置 bᵏ;
    • MLP 层:隐藏层的权重 / 偏置、线性回归层的权重 / 偏置
  2. 损失函数:采用均方根误差(RMSE),衡量预测 EE与真实 EE的偏差
  3. 优化算法:随机梯度下降(SGD),最小化 RMSE,训练流程分三阶段:
    • 前馈(Feed-forward):输入向量通过网络,生成 EE 预测值;
    • 反向传播(Backpropagation):计算 RMSE 误差,沿网络反向传播,分配各层误差贡献;
    • 梯度更新(Gradient Applied):各层根据误差调整参数,贪心最小化整体误差;
  4. 参数初始化:
    • 特征提取器和 MLP 隐藏层:随机初始化;
    • MLP 线性回归层:初始化为 0(避免初始偏差过大);

常见的反向传播的方法

总结

一个简单的cnn的预测方式,先对数据预处理,包括对齐,插值等操作,使数据符合神经网络的格式

神经网络进行数据特征提取,展平,然后用MLP做降维和最终预测,然后用这个误差做反向传播调整权重参数

可训练的参数有卷积的权重和偏执,MLP全连接层的权重矩阵的权重和偏置

Deep Learning-Based Optimal Smart Shoes Sensor Selection for Energy Expenditure and Heart Rate Estimation

实验材料与方法

类别 关键细节
被试信息 10 名健康成年男性,无肌肉骨骼 / 神经系统异常;年龄 22.5±1.8 岁,身高 172.9±3.5cm,体重 69.3±4.9kg,脚长 264±4.6mm
实验设备 1. 智能鞋:左右脚各 6 个传感器(共 20 通道),含 4 点压力传感器 / 三轴加速度计(BMI160)/ 三轴陀螺仪;2. 参考设备:K4b2 calorimeter(EE 测量)、Polar H10 胸带(HR 测量);3. 辅助设备:电动跑步机、笔记本电脑、智能手机(采集传感器数据)
实验流程 1. 被试穿戴设备后,在跑步机上以 3-10kph 速度跑步,每 2 分钟提速 1kph,总计 16 分钟;2. 同步记录传感器数据(33.3Hz)、EE(呼气时记录)、HR 数据
数据预处理 1. 线性插值:匹配 EE/HR 与传感器数据的采样率;2. 标准化:零均值单位方差,减少异常值影响;3. 样本生成:10s 窗口 + 1s 重叠,共 9600 个样本

模型

image-20260103160531307

整体架构

  • 输入:智能鞋的 20 通道传感器数据(左右脚各 4 个压力传感器 + 1 个三轴加速度计 + 1 个三轴陀螺仪,共 4×2+3×2+3×2=20 通道),数据格式为时序序列(长度 t 为 10 秒采样点,即 33.3Hz×10s≈333 个时间步),记为 S**in∈Rt×i(i=20 为通道数)。
  • 核心组件:通道注意力层(Channel-wise Attention)→ 1D DenseNet → 双向门控循环单元(Bi-GRU)→ 全局平均池化(GAP)层。
  • 输出:10 秒窗口内的平均 EE(单位:KCal/min)和 HR(单位:bpm),为连续值回归任务。

通道注意力

多通道传感器数据中存在冗余信息(部分传感器对 EE/HR 估计贡献低),传统模型平等对待所有通道,会降低学习效率。该层通过计算各通道的注意力权重,强化高贡献通道的信号强度,抑制低贡献通道的干扰,实现 “最优传感器选择”。

DenseNet

Bidirectional Gated Recurrent Unit

Global Average Pooling

实验结果

(1)EE 估计性能

输入类型 RMSE MAE
Acc+Gyro+Pr(有注意力) 1.05±0.13 0.83±0.12 0.922±0.005
Acc+Gyro+Pr(无注意力) 1.17±0.24 0.95±0.20 0.923±0.120
  • Bland-Altman 分析:有注意力模型的 LOA 为 [-1.56,1.93],均值差 0.19,优于无注意力模型(LOA [-2.42,3],均值差 0.29)。
  • 最优传感器:A_LZ(0.5155)、G_LZ(0.5148)、G_LY(0.5137)等(加速度计 / 陀螺仪 Z 轴为主)。

(2)HR 估计性能

输入类型 RMSE MAE MAPE
Acc+Gyro+Pr(有注意力) 7.81±1.12 6.12±0.86 0.897±0.017 5.40
Acc+Gyro+Pr(无注意力) 9.19±3.16 7.72±3.67 0.878±0.037 -

无论是 EE 还是 HR 估计,有注意力机制的模型在 RMSE、MAE 上均显著优于无注意力模型(p<0.05),且结果更稳定(标准差更小)

参考文献

  1. Valanou E M, Bamia C, Trichopoulou A. Methodology of physical-activity and energy-expenditure assessment: a review[J]. Journal of Public Health, 2006, 14(2): 58-65.
  2. Hills A P, Mokhtar N, Byrne N M. Assessment of physical activity and energy expenditure: an overview of objective measures[J]. Frontiers in nutrition, 2014, 1: 5.
  3. Brage S, Brage N, Franks P W, et al. Branched equation modeling of simultaneous accelerometry and heart rate monitoring improves estimate of directly measured physical activity energy expenditure[J]. Journal of applied physiology, 2004.
  4. Bonomi A, Goris A H, Yin B, et al. Detection of type, duration, and intensity of physical activity using an accelerometer[J]. Medicine and science in sports and exercise, 2009, 41(9): 1770-7.
  5. Bonomi A G, Plasqui G, Goris A H C, et al. Improving assessment of daily energy expenditure by identifying types of physical activity with a single accelerometer[J]. Journal of applied physiology, 2009, 107(3): 655-661.
  6. Mannini A, Intille S S, Rosenberger M, et al. Activity recognition using a single accelerometer placed at the wrist or ankle[J]. Medicine and science in sports and exercise, 2013, 45(11): 2193.
  7. Zhu J, Pande A, Mohapatra P, et al. Using deep learning for energy expenditure estimation with wearable sensors[C]//2015 17th International Conference on E-health Networking, Application & Services (HealthCom). IEEE, 2015: 501-506.
  8. Eom H, Roh J, Hariyani Y S, et al. Deep learning-based optimal smart shoes sensor selection for energy expenditure and heart rate estimation[J]. Sensors, 2021, 21(21): 7058.