金融界2024年8月22日消息,天眼查知識產權信息顯示,上海元夢智能科技有限公司取得一項名為“多模態情感識別方法、裝置、電子設備和存儲介質“,授權公告號CN112418034B,申請日期為2020年11月。
專利摘要顯示,本發明涉及語音識別和圖像處理技術領域,本發明提供多模態情感識別方法、裝置、電子設備和存儲介質,其方法包括步驟:對待識別對象的視頻數據進行去重,獲取所述待識別對象的人臉時序圖像數據;在獲取所述待識別對象的視頻數據時,實時獲取所述待識別對象的文本數據;將對齊后的所述人臉時序圖像數據和所述文本數據輸入至多模態情感識別模型,以進行所述待識別對象的多模態情感識別。本發明通過實時獲取虛擬人在和用戶對話過程中用戶的表情以及對話的文本內容,通過圖像和文本信號聯合輸入的方式,獲取多維度的豐富特征,來提升情感分類和檢測的準確性和魯棒性。特別在正話反說,反諷等場景具有較高的準確率。
來源:金融界
版權聲明
本文僅代表作者觀點,不代表B5編程立場。
本文系作者授權發表,未經許可,不得轉載。