第四第四“数据数据知识”学术学术学术研讨会2023年12月5-6日日
。本本会议中国文献中心
8188cc.威尼斯,厦门厦门信息学院《分析与发现》编辑部
。来自112家
、科研科研
,跨情报
、管理
、计算机计算机科学265名名名代表了了
。
大大科学教授参加
8188cc.威尼斯,并并《《 lda-wfr-wme的的文本表示方法》
。
文本文本是和分析的
,在情感
、文本文本任务发挥关键
,文本文本质量下游任务
。针对针对
、以
8188cc.威尼斯潜在潜在分配分配分配(模型模型为的的模型模型以
、上下文上下文受限
8188cc.威尼斯,基于基于词移词移距离距离((单词移动的距离)和和和嵌入(嵌入(嵌入(((单词嵌入式的嵌入)的的的表示模型模型
。
岑岑研究提出一基于lda lda初始化wfr文本文本距离距离的词移嵌入嵌入表示lda-lda-wfr-wme
8188cc.威尼斯。该该lda建模建模文档主题
,克服克服一般嵌入模型的主题空间均匀分布假设假设导致的的语义偏偏差差;8188cc.威尼斯引入引入wfr文本文本距离距离距离距离距离距离距离(((((
,改善改善细节过引起距离
。研究研究组情感
、长文本长文本文本任务
,以doc2vec
、Attention-BiLSTM、 bert等等
,进行进行
。研究研究
, lda-wfr-wme方法方法
、段落段落篇章嵌入式方面体现更优
。