新刊速递|长春理工大学计算机科学技术学院李修军副教授团队:基于贝叶斯优化WGAN-GP的fNIRS数据增强与情绪识别

长春理工大学计算机科学技术学院李修军副教授团队在《郑州大学学报(理学版)》上发表题为：“基于贝叶斯优化WGAN-GP的fNIRS数据增强与情绪识别”的研究型论文。

Cite: LI Xiujun, GE Xiongxin, YANG Jingjing. fNIRS Data Enhancement and Emotion Recognition Based on Bayesian Optimization WGAN-GP. Journal of Zhengzhou University(Natural Science Edition), 2026, 58(3): 17-24.

01 研究背景与意义

情绪在人类大脑的高级认知和加工中起着关键作用，深刻影响着人们的日常生活和工作，对人的社会互动和心理健康起着重要的导向作用。近年来，功能性近红外光谱技术（Functional Near-Infrared Spectroscopy，fNIRS）凭借其非侵入性、便携性、高空间分辨率以及较强的抗运动干扰能力，被广泛应用于情绪识别研究。fNIRS通过监测氧合血红蛋白（HbO₂）和脱氧血红蛋白（HbR）浓度变化，实现对大脑局部神经活动状态的刻画，为情绪解码提供了可靠的神经生理基础。

然而，fNIRS情绪数据采集过程复杂、耗时较长，需要严格控制实验环境和受试者状态，因此高质量样本往往较为稀缺。有限的数据规模不仅限制了深度学习模型的训练效果，也容易导致模型泛化能力不足。如何在不增加高昂实验成本的前提下扩充数据规模、提升数据质量，成为fNIRS情绪识别领域亟待解决的重要问题。

生成对抗网络（generative adversarial network，GAN)作为一种典型的数据增强方法，能够通过学习真实数据分布生成高质量样本。然而，传统GAN存在训练不稳定、梯度消失以及模式坍塌等问题，在复杂脑信号数据生成任务中表现受限。针对这一挑战，本文提出一种基于贝叶斯优化的WGAN-GP数据增强方法（BO-WGAN-GP），利用贝叶斯优化自动搜索最佳学习率参数，并结合梯度惩罚机制生成高质量fNIRS情绪数据，从而提升情绪识别性能。

02 文章亮点

提出BO-WGAN-GP数据增强框架，实现高质量fNIRS样本生成，针对传统GAN训练不稳定的问题，引入Wasserstein距离和梯度惩罚机制，构建WGAN-GP模型。同时利用贝叶斯优化自动搜索生成器与鉴别器的关键超参数，实现学习率的动态优化，有效提升模型训练稳定性与生成样本质量。

构建自动超参数优化机制，减少人工调参成本，将贝叶斯优化引入生成模型训练流程，通过高斯过程代理模型与期望改进（EI）采样策略，在超参数空间中自动寻找最优解。相比传统经验调参方式，能够更加高效地获得最佳学习率组合，提高模型泛化能力。

多分类模型验证生成数据有效性，为了验证生成数据的泛化能力，不仅在自建TDERM情绪识别模型上开展实验，还分别在DBJNET和CNN-Transformer模型上进行数据增强测试。实验结果表明，经BO-WGAN-GP增强后的数据均能显著提升不同模型的分类性能，证明了生成数据的有效性与迁移价值。

情绪识别准确率达到领先水平，实验结果显示，在HbO₂指标下，加入504个生成样本时分类准确率达到97.92%；在HbR指标下，加入1008个生成样本时分类准确率达到99.31%。相比未增强数据集均实现明显提升，验证了BO-WGAN-GP在fNIRS情绪识别任务中的优越性能。

03 文章简读

本文围绕“数据稀缺限制fNIRS情绪识别性能”这一核心问题，提出了一种融合贝叶斯优化与WGAN-GP的数据增强框架BO-WGAN-GP。

首先，研究基于自建fNIRS情绪数据集开展实验，共采集28名受试者观看情绪诱发视频过程中的脑血氧信号。经过运动伪影校正、漂移去除、频率滤波及滑动窗口切分等预处理流程，最终获得6048个样本，每个样本尺寸为32×277。

随后，构建BO-WGAN-GP模型。在WGAN-GP基础上引入贝叶斯优化机制，对生成器和鉴别器学习率进行自动寻优，使模型能够更加稳定地学习真实数据分布。相比传统GAN依赖经验调参的方式，该方法能够有效提升训练效率与样本生成质量。

在分类阶段，采用自主设计的TDERM（Temporal Dynamics Emotion Recognition Model）作为情绪识别器。该模型融合CNN-MSA空间特征提取模块、LSTM-MSA时间特征提取模块以及全局时间特征模块，实现对fNIRS脑信号时空特征的联合建模。

实验结果表明，随着生成样本逐步加入训练集，模型分类性能整体呈提升趋势。进一步的消融实验验证了贝叶斯优化模块的重要作用：加入贝叶斯优化后，TDERM在HbO₂和HbR上的分类准确率分别提升至96.69%和98.50%，明显优于未使用贝叶斯优化的WGAN-GP。

此外，与GAN、WGAN、DCGAN、StyleGAN3以及Trans-CNN GAN等主流生成模型相比，BO-WGAN-GP在多数实验设置下取得了最佳或最稳定的分类表现，展现出优异的数据增强能力和跨模型泛化能力。

04 图表导读

图1 BO-WGAN-GP整体架构图。该图展示了本文提出的数据增强框架整体流程。模型由生成器、鉴别器、梯度惩罚模块以及贝叶斯优化模块组成。贝叶斯优化模块实时调整生成器与鉴别器学习率，通过Wasserstein距离和梯度惩罚共同约束训练过程，提高生成样本与真实fNIRS数据分布的一致性。

图2 TDERM情绪识别模型结构。图中展示了研究构建的TDERM分类器。模型同时融合CNN-MSA模块、LSTM-MSA模块以及全局时间特征提取模块，分别学习空间特征、时间特征和全局动态信息，并通过特征融合实现三分类情绪识别。该结构充分挖掘了fNIRS脑信号的时空信息。

图3 鉴别器损失的学习曲线(HbO2)。

图4 鉴别器损失的学习曲线(HbR)。图3与图4分别表示了在HbO₂和HbR指标下，不同情绪类别的鉴别器损失变化过程。可以看到，损失值在训练初期快速下降，随后逐步趋于稳定并接近0，说明生成数据分布不断逼近真实数据分布，模型具有良好的收敛性与训练稳定性。梯度惩罚机制在抑制梯度爆炸和梯度消失方面发挥了重要作用。

表1 数据增强后平均分类准确率

单位：%

该表展示了逐步增加生成样本后的情绪分类结果。对于HbO₂数据，当每类情绪增加504个生成样本时准确率最高，达到97.92%；对于HbR数据，当每类增加1008个生成样本时准确率达到99.31%。结果说明适量的数据增强能够显著提高模型性能，但样本数量并非越多越好。

表2 不同生成模型的平均准确率

单位：%

研究将BO-WGAN-GP与GAN、WGAN、DCGAN、StyleGAN3及Trans-CNN GAN进行对比。在多数实验条件下，本文方法取得最佳结果。其中在HbR指标下生成1008个样本时，分类准确率达到99.31%，为所有方法中的最高值。实验充分验证了BO-WGAN-GP在fNIRS数据增强与情绪识别任务中的先进性和实用价值。

05 作者简介

第一作者：李修军副教授

长春理工大学计算机科学技术学院

研究方向：主要从事计算机与脑信息学研究

E-mail：lixiujun@cust.edu.cn

06 文章链接

引用格式：

李修军, 葛雄心, 杨菁菁. 基于贝叶斯优化WGAN-GP的fNIRS数据增强与情绪识别. 郑州大学学报(理学版), 2026, 58(3): 17-24.

LI Xiujun, GE Xiongxin, YANG Jingjing. fNIRS Data Enhancement and Emotion Recognition Based on Bayesian Optimization WGAN-GP. Journal of Zhengzhou University(Natural Science Edition), 2026, 58(3): 17-24.

扫描上方二维码，或点击文末“阅读原文”查看文献。

https://html.rhhz.net/ZZDXXBLXB/html/20260303.htm

郑州大学学报（理学版）

● 中国中文核心期刊

● 中国高校优秀科技期刊

● Scopus、EBSCO、CA、JST等国际知名数据库收录

● 中国科技论文与引文数据库（CSTPCD）来源期刊

《郑州大学学报（理学版）》是郑州大学主办的自然科学类综合性学术刊物。主要刊登信息与计算机科学、数学、物理学、化学、生物工程科学、材料科学与电气工程科学等自然科学各学科的基础研究及应用研究方面的学术论文。本刊所发表的论文已被《中国数学文摘》、《中国物理文摘》、荷兰《Scopus数据库》、美国《数学评论》、俄罗斯《文摘杂志》及波兰《哥白尼索引》等国内外多家权威文摘杂志及数据库收录或评论，致力于促进自然科学领域的学术交流与发展。

点击下方 “阅读原文” 获取期刊内容

点击下方 “阅读原文” 获取期刊内容