一種基于語音、文本和表情的多模態(tài)情感識別算法

打印
收藏

收藏成功

微博 QQ空間微信

打開文本圖片集

摘要針對當(dāng)前多模態(tài)情感識別算法在模態(tài)特征提取、模態(tài)間信息融合等方面存在識別準(zhǔn)確率偏低、泛化能力較差的問題，提出了一種基于語音、文本和表情的多模態(tài)情感識別算法。首先，設(shè)計(jì)了一種淺層特征提取網(wǎng)絡(luò)（Sfen）和并行卷積模塊（Pconv）提取語音和文本中的情感特征，通過改進(jìn)的Inception-ResnetV2模型提取視頻序列中的表情情感特征;其次，為強(qiáng)化模態(tài)間的關(guān)聯(lián)性，設(shè)計(jì)了一種用于優(yōu)化語音和文本特征融合的交叉注意力模塊;最后，利用基于注意力的雙向長短期記憶（BiLSTM based on attention mechanism，BiLSTM-Attention）模塊關(guān)注重點(diǎn)信息，保持模態(tài)信息之間的時(shí)序相關(guān)性。（剩余19994字）

試讀結(jié)束

購買全文6.00元下一篇決策形式背景基于OE-協(xié)調(diào)性的屬性約簡

西北大學(xué)學(xué)報(bào)（自然科學(xué)版）

2024年02期

￥30.00/本

悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

一種基于語音、文本和表情的多模態(tài)情感識別算法

一種基于語音、文本和表情的多模態(tài)情感識別算法