目标是验证 ear-EEG 是否能在更接近真实 cocktail party 的 four spatially separated speakers 场景中解码 attended speaker(Abstract/Intro; PDF p. 1)。
论文同时比较 simultaneous scalp-EEG 与 ear-EEG,并分析 electrode placement/quantity 对 AAD accuracy 的影响(Intro/Methods; PDF pp. 1-3)。
另一个目标是测试 auditory spatial attention detection (ASAD) 深度模型 STAnet 是否可迁移到 ear-EEG database(Intro/ASAD; PDF pp. 1-4)。
硬件系统
Ear-EEG: 两片 cEEGrids,每片 C-shaped flex-printed sensor array,10 electrodes,双面胶贴在耳周(Fig. 1; PDF p. 2)。
放大器: TMSi SAGA 32+/64+ amplifier,Polybench 1.34 acquisition software,ear-EEG 采样 500 Hz 并离线分析(EEG acquisition; PDF p. 2)。
皮肤/导电: abrasive gel 和 alcohol 处理皮肤,electrolyte gel GT5 applied to electrodes(EEG acquisition; PDF p. 2)。
Ground: 额外 electrode attached to the wrist 作为 ground;ear-EEG offline re-referenced to common average reference(EEG acquisition/preprocessing; PDF p. 2)。
Scalp-EEG: 同步数据来自已有 four-talker EEG database,64-channel NeuSen Recorder,1000 Hz;本文复用其 scalp data 结果和重分析(EEG acquisition; PDF p. 2)。
电极点位 / 布局
cEEGrid 左右耳各 10 electrodes,围绕耳廓形成 C-shape;论文图示右耳照片和左右耳 electrode positions(Fig. 1; PDF p. 2)。
TRF 可视化仅选取两个 cEEGrid electrodes 展示 attended/unattended TRF 差异;SR/AAD 使用完整 ear-EEG 布局(Fig. 2; Methods/Results; PDF pp. 2-3)。
Scalp layout comparison 包含 59 usable scalp electrodes、20 electrodes closest to cEEGrids、20 central scalp electrodes、20 widespread electrodes,用于分离 electrode count 与 spatial placement 的影响(Fig. 4; PDF pp. 3-4)。
实验设计
被试: 16 名北京大学被试,6 female,19-27 岁,普通话母语,normal hearing,无脑损伤或认知缺陷病史;通过 Peking University IRB(Subjects; PDF p. 2)。
环境: anechoic room,舒适椅坐姿,头位固定,视觉注视屏幕白色 crosshair(Stimuli/procedure; PDF p. 2)。
刺激: 中文材料来自《海底两万里》,四路 speech segments 同时经四个 Dynaudio BM 6A loudspeakers 播放,位置为 +30, -30, +90, -90 degrees,声级 55 dBLAeq,扬声器在 1.6 m half-circle 上(Stimuli/procedure; PDF p. 2)。
任务: 被试关注目标方向 speech,忽略其它三路;每 trial 后回答 4 个 attended speech 内容问题(Stimuli/procedure; PDF p. 2)。
信号处理流程
SR preprocessing: scalp 与 ear EEG 均 band-pass 2-8 Hz,baseline correction,downsample to 64 Hz;使用 EEGLAB on MATLAB(Preprocessing; PDF p. 2)。
TRF: mTRF toolbox,reverse correlation + ridge regression,time delays -50 ms to 450 ms(TRFs estimation; PDF pp. 2-3)。
Stimulus reconstruction: backward decoder 从 EEG 重构 speech envelope,用 correlation 判定 attended speech;不同 decision window 下评估 accuracy(SR; PDF pp. 3-4)。
ASAD: 测试 CNN-baseline、SAnet、TAnet、STAnet 四个模型;SAnet/TAnet 分别移除 STAnet 的 temporal 或 spatial attention 模块,用于评估注意力模块贡献(ASAD; PDF pp. 3-4)。
结果
TRF: attended speech TRF response 高于三个 unattended speech TRFs,符合 four-talker scalp-EEG 既有发现(Fig. 2; Results; PDF p. 3)。
Ear-EEG SR accuracy 随 decision window 增长: 1 s 27.5%, 2 s 28.5%, 5 s 29.8%, 10 s 31.1%, 20 s 35.0%, 30 s 36.4%, 60 s 41.3%;chance level 为 25%,均显著高于 chance(Fig. 3; Results; PDF p. 3)。
Scalp-EEG 59 channels 在 60 s window accuracy 77.50%;20 scalp electrodes closest to cEEGrids 为 75.47%,20 central scalp channels 为 67.50%,20 widespread electrodes 为 75%(Fig. 4; Results; PDF pp. 3-4)。
作者认为 ear-EEG 相对 scalp-EEG 的性能下降主要来自 electrode placement/spatial coverage,而不只是 electrode number;靠近 cEEGrid 的 temporal scalp electrodes 保持较高 accuracy(Discussion; PDF p. 4)。
ASAD: CNN-baseline、SAnet、TAnet、STAnet 在 1 s window 的平均 accuracy 分别为 84.5%, 92.4%, 92.9%, 93.1%;三个 attention variants 显著高于 CNN-baseline,但彼此无显著差异(ASAD results; PDF p. 4)。
局限
场景仍是 four-speaker classification;真实环境有更多声源、噪声和 reverberation,复杂度会更高(Limitations; PDF p. 4)。
实验在 anechoic room 中完成,缺少真实房间混响和移动因素;作者明确指出 reverberation 可能削弱 speech cortical tracking(Limitations; PDF p. 4)。
ASAD 深度模型 interpretability 较低;作者还引用近期研究指出同一 trial EEG 可能包含 trial-specific features,导致模型学习 trial information 而非真正 auditory attention,从而 inflated results(ASAD discussion/Limitations; PDF p. 4)。
Using Ear-EEG to Decode Auditory Attention in Multiple-speaker Environment
Year
2024
Category
06_recent_preprints_comparisons
Route
ear-EEG
Stage
multi-speaker AAD
Status
processed
Source integrity
ok
Pages
5
OCR status
not_needed
Evidence Groups
Group
Hits
Pages
hardware
12
p. 1, p. 2, p. 3
electrode_layout
12
p. 1, p. 2, p. 3, p. 4
experiment
12
p. 1, p. 2
signal_processing
12
p. 1, p. 2
results
12
p. 1, p. 2
limitations
8
p. 1, p. 2, p. 3, p. 4
Local Evidence Sources
Source PDF path: US-pdf/Using Ear-EEG to Decode Auditory Attention in Multiple-speaker Environment.pdf
Public PDF path: /papers/22-zhu-2024.pdf
Categorized PDF path: library/pdfs_by_category/06_recent_preprints_comparisons/22_2024_zhu_et_al_using_ear_eeg_to_decode_auditory_attention_in_multiple_speaker_environment.pdf
Extracted text path: library/texts/06_recent_preprints_comparisons/22_2024_zhu_et_al_using_ear_eeg_to_decode_auditory_attention_in_multiple_speaker_environment.txt