接下来主要有三个工作要做:
1. 相关项目查找。为资料编制索引,以便在必要时查找相关项目。
2. 可识别人名的中文分词。实际应用时,能不能识别人名对相关项目查找的效果有很大影响。现在打算在 Fast Chinese Word Segmentation 中增加一个方法,允许用户添加词条(主要为了姓名识别,来添加已知人名)。而对于 MP Chinese Word Segmentation,则需要在词库中增加姓氏、姓名的概率,来识别人名。
3. 图片注释工具。这是一个用 XML 存储数据的,JavaScript 控制客户端编辑的,利用 VML 或 SVG 显示注释的一个工具。
1. 相关项目查找。为资料编制索引,以便在必要时查找相关项目。
2. 可识别人名的中文分词。实际应用时,能不能识别人名对相关项目查找的效果有很大影响。现在打算在 Fast Chinese Word Segmentation 中增加一个方法,允许用户添加词条(主要为了姓名识别,来添加已知人名)。而对于 MP Chinese Word Segmentation,则需要在词库中增加姓氏、姓名的概率,来识别人名。
3. 图片注释工具。这是一个用 XML 存储数据的,JavaScript 控制客户端编辑的,利用 VML 或 SVG 显示注释的一个工具。
Current language: Chinese (Simplified)