You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

40 lines
2.4 KiB

  1. #本配置文件中的路径的根目录,根目录+其他路径=完整路径(支持相对路径,请参考:https://github.com/hankcs/HanLP/pull/254)
  2. #Windows用户请注意,路径分隔符统一使用/
  3. root=/opt/data/nlp/hanlp/
  4. #root=/Users/mountain/Documents/nlp/hanlp/
  5. #root = D:/opt/data/nlp/hanlp
  6. #好了,以上为唯一需要修改的部分,以下配置项按需反注释编辑。
  7. #核心词典路径
  8. #CoreDictionaryPath=data/dictionary/CoreNatureDictionary.txt
  9. #2元语法词典路径
  10. #BiGramDictionaryPath=data/dictionary/CoreNatureDictionary.ngram.txt
  11. #自定义词典路径,用;隔开多个自定义词典,空格开头表示在同一个目录,使用“文件名 词性”形式则表示这个词典的词性默认是该词性。优先级递减。
  12. #所有词典统一使用UTF-8编码,每一行代表一个单词,格式遵从[单词] [词性A] [A的频次] [词性B] [B的频次] ... 如果不填词性则表示采用词典的默认词性。
  13. CustomDictionaryPath=data/dictionary/custom/CustomDictionary.txt; 现代汉语补充词库.txt; 全国地名大全.txt ns; 人名词典.txt; 机构名词典.txt; 上海地名.txt ns;data/dictionary/person/nrf.txt nrf;
  14. #停用词词典路径
  15. #CoreStopWordDictionaryPath=data/dictionary/stopwords.txt
  16. #同义词词典路径
  17. #CoreSynonymDictionaryDictionaryPath=data/dictionary/synonym/CoreSynonym.txt
  18. #人名词典路径
  19. #PersonDictionaryPath=data/dictionary/person/nr.txt
  20. #人名词典转移矩阵路径
  21. #PersonDictionaryTrPath=data/dictionary/person/nr.tr.txt
  22. #繁简词典根目录
  23. #tcDictionaryRoot=data/dictionary/tc
  24. #HMM分词模型
  25. #HMMSegmentModelPath=data/model/segment/HMMSegmentModel.bin
  26. #分词结果是否展示词性
  27. #ShowTermNature=true
  28. #IO适配器,实现com.hankcs.hanlp.corpus.io.IIOAdapter接口以在不同的平台(Hadoop、Redis等)上运行HanLP
  29. #默认的IO适配器如下,该适配器是基于普通文件系统的。
  30. #IOAdapter=com.hankcs.hanlp.corpus.io.FileIOAdapter
  31. #感知机词法分析器
  32. #PerceptronCWSModelPath=data/model/perceptron/pku199801/cws.bin
  33. #PerceptronPOSModelPath=data/model/perceptron/pku199801/pos.bin
  34. #PerceptronNERModelPath=data/model/perceptron/pku199801/ner.bin
  35. #CRF词法分析器
  36. #CRFCWSModelPath=data/model/crf/pku199801/cws.txt
  37. #CRFPOSModelPath=data/model/crf/pku199801/pos.txt
  38. #CRFNERModelPath=data/model/crf/pku199801/ner.txt
  39. #更多配置项请参考 https://github.com/hankcs/HanLP/blob/master/src/main/java/com/hankcs/hanlp/HanLP.java#L59 自行添加