图书馆杂志

图书馆杂志 ›› 2018, Vol. 37 ›› Issue (4): 95-101.

• 情报研究 • 上一篇    下一篇

高质量用户生成内容主题分布特征研究

阮光册 夏 磊   


  • 出版日期:2018-05-15 发布日期:2018-05-18
  • 作者简介:阮光册 博士,华东师范大学经济与管理学部信息 管理系,副教授,硕士生导师。研究方向:信息 分析、文本挖掘。E-mail:rgc1976@126.com 上 海 200241 夏? 磊 女,上海图书馆会展中心副主任,副研究 馆员。研究方向:公共图书馆服务。

Study of Topic Distribution Features of User Generated Comments of High Quality

Ruan Guangce, Xia Lei   

  • Online:2018-05-15 Published:2018-05-18

摘要: 随着社会化媒体的发展,识别海量高质量的用户生成内容在电子商务等领域具有很多的 实际意义。本文将主题模型应用到高质量用户生成内容的识别,从语义层面挖掘高质量用户生成 内容所具有的特征。本文首先通过对社交平台用户评论特征的分析,构建了基于LDA的用户生成内 容主题模型,对主题模型计算结果,采用TFIDF识别高概率主题词的权重,探讨高质量用户生成内 容的主题分布特征。最后通过亚马逊网上书店的网络用户评论进行试验,分析了高质量用户评论 的主题分布特征。

关键词: 用户生成内容?, 高质量, ? TFIDF, ? 主题模型

Abstract: With the development of the social media, it is important to identify the user generated comments of high quality. In this paper, the author used the topic model to identify the high quality users’ comments and to mine the topic feature. The author first put forward the topic model in high quality users’ comments, then calculated the topic model and discussed the topic distribution features. Based on the analysis of the users’ comments on the social platforms, the author established LDA subjects model, and used the users’ comments in Amazon bookstore for testing. Finally, the author drew a conclusion on the topic distribution feature on high quality users’ comments.

Key words: Users’ comments, High quality, TFIDF, Topic model