中文维基百科的搜索
今天在中文维基百科搜索“土人”,没有匹配的条目。搜索“风土人情”,找到了徐霞客这一条目,其内容含有“...业、手工业、交通运输、名胜古迹、风土人情,仍然具有很高的科学和文学价值。”

看来中文维基百科使用了中文分词技术,但不知是 zh.wikipedia.org 自己增加的独有功能还是 MediaWiki 中就有的功能。如果 MediaWiki 中就有此技术,那么假期时就可以参考一下它的程序了。

不过话说回来,除了搜索引擎,很少有搜索有中文自动分词技术的,做不成这个功能也无所谓。

后记:在自己机器上装的 MediaWiki 上测试了一下,结果是——不支持中文自动分词。
当前语言: 中文 (简体)
1 条留言
Mumu.
2012-02-07 13:08 +0800
冒昧地想问下博主是本科生还是研究生?动手实践能力好强的样子!
发表留言
昵称 (必需)
邮件 (必需,不会被发布出来)
网站 (可选)
留言
可以使用类似维基标记的语法,参看指南