项目介绍 利用多种计算文本相似度的方式进行文本聚类 文件介绍 static_data 包含停用词文件、训练数据、测试数据等文件 tools 包含分词、获取离线实体等基础工具 learn_weight 一个独立的模块,利用GCN学习 meta-path 的权重 可以根据这个权重文件,将不同的 meta-path 构造的相似度矩阵合并为一个相似度矩阵, 然后根据这个矩阵,进行聚类 settings.py 设置文件路径