融合对抗训练与ERNIE 的短文本情感分析模型
    点此下载全文
引用本文:刘婷,杜奕,曹晓夏,侯淏文.融合对抗训练与ERNIE 的短文本情感分析模型[J].上海第二工业大学(中文版),2024,41(1):79-87
摘要点击次数: 43
全文下载次数: 10
作者单位
刘婷 上海第二工业大学a. 计算机与信息工程学院
b. 人工智能研究院, 上海201209 
杜奕 上海第二工业大学a. 计算机与信息工程学院
b. 人工智能研究院, 上海201209 
曹晓夏 上海第二工业大学a. 计算机与信息工程学院
b. 人工智能研究院, 上海201209 
侯淏文 上海第二工业大学a. 计算机与信息工程学院
b. 人工智能研究院, 上海201209 
基金项目:国家自然科学基金(41672114, 41702148), 中国教育部科发中心产学研创新基金(2021ZYA03008) 资助
中文摘要:使用深度学习技术进行文本情感分类是近年来自然语言处理领域的研究热点, 好的文本表示是提升深度学习模型分类性能的关键因素。由于短文本蕴含情感信息较少、训练时易受噪声干扰, 因此提出一种融合对抗训练的文本情感分析模型PERNIE RCNN。该模型使用ERNIE 预训练模型对输入文本进行向量化, 初步提取文本的情感特征。随后在ERNIE 预训练模型的输出向量上添加噪声扰动, 对原始样本进行对抗攻击生成对抗样本, 并将生成的对抗样本送入分类模型进行对抗训练, 提高模型面临噪声攻击时的鲁棒性。实验结果表明, PERNIE RCNN 模型的文本分类性能更好, 泛化能力更优。
中文关键词:短文本情感分析  深度学习  对抗训练  文本分类
 
A Short Text Affective Analysis Model Combining AdversaryTraining and ERNIE
Abstract:Text sentiment classification using deep learning techniques is a hot research topic in the field of natural language processing in recent years, and good text representation is a key factor in improving the classification performance of deep learning models. A text sentiment analysis model PERNIE RCNN that includes adversarial training is proposed, as short texts contain little sentiment information and are susceptible to noise interference during training. The model uses the ERNIE pre-trained model to vectorize the input text and initially extract the sentiment features of the text. The model then adds noise perturbations to the output vector of the ERNIE pre-training model to generate adversarial samples against the original samples, and feeds the generated adversarial samples into the classification model for adversarial training to improve the robustness of the model against noise attacks. The experimental results show that the PERNIE RCNN model has better text classification performance and better generalisation ability.
keywords:short text sentiment analysis  deep learning  adversarial training  text classification
查看全文  查看/发表评论  下载PDF阅读器
上海第二工业大学学报编辑部 版权所有
地址:中国 上海市 浦东新区金海路2360号 邮编:201209
电话:021-50216814,传真:021-50216005  京ICP备09084417号