Skip to content

v1.2 测试版

Pre-release
Pre-release
Compare
Choose a tag to compare
@jsksxs360 jsksxs360 released this 25 Feb 02:20
· 38 commits to master since this release

传统机器学习方法已经在产业界大规模运用多年,技术日趋成熟,因此 AHANLP 基于目前已经稳定的 HanLP v1.7.6 (最后的武士) 推出了 1.2 版本,同时确定下对外接口。

  • 修复 splitSentence 分隔句子后丢失分隔标点符号的问题
  • NLP分词 NLPSegment 后台更换为感知机模型,进一步提高准确率
  • 增加 seg2sentence 分词断句功能
  • 几乎所有接口都支持自定义分词器,可以指定速度更快的标准分词,或者准确率更高的NLP分词
  • 优化 NER、TextRankKeyword 等模块代码,进一步提高处理速度
  • 完善接口说明,其他细节优化

注意

  • splitSentence 接口发生变更,取消自定义分隔符参数,只允许自定义是否断句为最细的子句(将逗号、分号也视作分隔符)
  • splitWordInSentences 接口发生变更,返回格式统一为 Term,同时包含词语和词性,增加 segType 参数,可以指定分词器类型

适配基础数据包 AHANLP_base-1.2 (提取码 3jq3)