Gender Guesser v0.05.0 已发布
从 PHP Classes 下载:
http://www.phpclasses.org/package/2701-PHP-Guess-the-gender-of-Chinese-names.html

更新日志:
  • 该版本起仅支持 PHP 5 环境,且需要开启 mbstring 扩展
  • 词典数据改为以 PHP 序列化数据方式存储
  • 默认词典由 20,933 个姓名性别数据生成 (上一版本为 5,561 个)
  • 默认词典同时包含简体中文和繁体中文的字符

演示地址:
http://demo.wudilabs.org/lab/gender_guesser/
当前语言: 中文 (简体) · also available in: English
8 条留言
吾乐吧软件站
2014-09-06 23:31 +0800
请问老大,那个LEX字段用什么工具制作的?我用什么打开他呢(TXT打开的话看不懂啥意思)
吾乐吧软件站
2014-09-07 01:00 +0800
上面的问题解决了,原来那个是PHP的序列化结果。
还有个问题,请问那些数值如何计算出来的呢?例如:

旸=0.25
珉=6.3333333333333
旖=-6.3333333333333

这些字跟数值是什么关系的?
Wudi
2014-09-08 01:12 +0800
@吾乐吧软件站:
那个 .lex 的词典文件也是用 PHP 脚本生成的,只不过这个训练用的脚本因为代码还没整理过,就一直没随着 class 发布过。
具体数值是怎么计算出来的,下个版本更新时应该就有文档说明了。目前这个 v0.05.0 的算法和上一个 v0.02.0 的就不一样了。
PS, 下个版本的更新会很快,因为除了文档都准备好了,大概就这个月内发布吧。
吾乐吧软件站
2014-09-09 22:02 +0800
感谢答复,先谢谢了,期待!
Artmis
2014-09-25 04:18 +0800
樓主您好
最近剛好需要分析大量的姓名判斷性別
但是演示的限制30個 請問要如何修改呢
拜託您解答了(有2萬多個姓名要分析)
Wudi
2014-09-26 23:31 +0800
@Artmis:
两万多个姓名要处理的话,需要自己写个小程序了
那个演示页面的程序是通过网页上的文本框提交的,两万个的数据量太大了
写程序可以参考 Readme.htm 里的示例代码
吾乐吧软件站
2014-10-06 13:21 +0800
老大,已经发布了么?
Wudi
2014-10-08 14:15 +0800
@吾乐吧软件站:
今天刚发出来,杂事挺多一下就到十一后了。
现在有一个 PDF 的幻灯片可以下载。
发表留言
昵称 (必需)
邮件 (必需,不会被发布出来)
网站 (可选)
留言
可以使用类似维基标记的语法,参看指南