第二次修改后中文分词程序的分词速度
分词方法:逆向最大匹配分词法,只对中文字符进行分词

词库大小:73,226 个词(增加了 29,289 个词,但去除了单字和四字以上的词语)

编写语言:PHP

分词速度:

99% 中文 —— 211 KB —— 16s —— 13.18KB/s (+ 10.08KB/s)

45% 中文 —— 2, 100 KB —— 73s —— 28.76KB/s (+ 23.82KB/s)

00% 中文 —— 413 KB —— 7s —— 59.00KB/s (- 9.83KB/s)
Current language: 中文 (简体)
Leave a Comment
Name (required)
E-mail (required, will not be published)
Website (optional)
Comment
A syntax system which is similar to wiki markup is available, see the guide