图书馆杂志

图书馆杂志 ›› 2019, Vol. 38 ›› Issue (5): 71-78.

• 信息管理 • 上一篇    下一篇

基于主题层次关系的文献检索结果可视化应用研究

阮光册 任金玥    

  • 出版日期:2019-05-15 发布日期:2019-05-16
  • 作者简介:阮光册 博士研究生,华东师范大学信息管理系, 副教授,硕士生导师。研究方向:信息分析,文本 挖掘。作者贡献:论文选题,hLDA程序实现,论文修 改。E-mail:rgc1976@126.com 上海 200241 任金玥 女,硕士研究生,华东师范大学信息管理 系。研究方向:信息分析。作者贡献:数据下载,数 据清洗,完成论文初稿撰写。 上海 200241

Application of Information Retrieval Results Visualization Based on Hierarchical Topic Model

 Ruan Guangce, Ren Jinyue   

  • Online:2019-05-15 Published:2019-05-16

摘要: 文献检索结果中隐藏着知识的层次关系,本文采用hLDA模型抽取检索结果数据集中隐藏
的主题树结构,揭示研究主路径等信息,进而为用户提供高效的知识服务。首先,构建领域专业
知识库,实现对检索结果的预处理;其次,通过合理的hLDA超参抽样,获得主题树结构;最后,
结合可视化技术,识别检索问题下学术信息的知识层次结构。实验表明,本文采用的方法可以提
供有效的检索结果可视化分析,相比经典的层次聚类方法,结果的可读性更高。

关键词: hLDA , 主题模型 , 检索结果,  可视化

Abstract: In the retrieval results, the hierarchical relationship of knowledge is hidden. We use hLDA
model to analyze the hierarchical topic, reveal the path of the topic in the retrieval results, and thus
provide knowledge service of high quality. First, we realize the preprocessing of the retrieval results by
building the professional knowledge database. Secondly, we obtain the hierarchical topic structure through
reasonable super parameter sampling. Lastly, combined with visualization technology, we describe the
hidden knowledge of academic information retrieval. Experiments show that this method is effective for
visual analysis of retrieved results. Compared with the classical hierarchical clustering method, the results
are more readable.

Key words: hLDA, LDA, Retrieval results, Visualization