Gender Guesser v0.05.0 has been released
Download from PHP Classes:
http://www.phpclasses.org/package/2701-PHP-Guess-the-gender-of-Chinese-names.html

Changelog:
  • Supports PHP 5 environment only, and the mbstring extension need to be enabled.
  • Lexicon data stores in PHP serialization format now.
  • The default lexicon came from 20,933 name-gender records (5,561 records in previous version).
  • The default lexicon contains characters of both Simplified Chinese and Tranditional Chinese.

Demo:
http://demo.wudilabs.org/lab/gender_guesser/
Current language: English · 其他语言: 中文 (简体)
8 Comments
吾乐吧软件站
Sat, 06 Sep 2014 23:31 +0800
请问老大,那个LEX字段用什么工具制作的?我用什么打开他呢(TXT打开的话看不懂啥意思)
吾乐吧软件站
Sun, 07 Sep 2014 01:00 +0800
上面的问题解决了,原来那个是PHP的序列化结果。
还有个问题,请问那些数值如何计算出来的呢?例如:

旸=0.25
珉=6.3333333333333
旖=-6.3333333333333

这些字跟数值是什么关系的?
Wudi
Mon, 08 Sep 2014 01:12 +0800
@吾乐吧软件站:
那个 .lex 的词典文件也是用 PHP 脚本生成的,只不过这个训练用的脚本因为代码还没整理过,就一直没随着 class 发布过。
具体数值是怎么计算出来的,下个版本更新时应该就有文档说明了。目前这个 v0.05.0 的算法和上一个 v0.02.0 的就不一样了。
PS, 下个版本的更新会很快,因为除了文档都准备好了,大概就这个月内发布吧。
吾乐吧软件站
Tue, 09 Sep 2014 22:02 +0800
感谢答复,先谢谢了,期待!
Artmis
Thu, 25 Sep 2014 04:18 +0800
樓主您好
最近剛好需要分析大量的姓名判斷性別
但是演示的限制30個 請問要如何修改呢
拜託您解答了(有2萬多個姓名要分析)
Wudi
Fri, 26 Sep 2014 23:31 +0800
@Artmis:
两万多个姓名要处理的话,需要自己写个小程序了
那个演示页面的程序是通过网页上的文本框提交的,两万个的数据量太大了
写程序可以参考 Readme.htm 里的示例代码
吾乐吧软件站
Mon, 06 Oct 2014 13:21 +0800
老大,已经发布了么?
Wudi
Wed, 08 Oct 2014 14:15 +0800
@吾乐吧软件站:
今天刚发出来,杂事挺多一下就到十一后了。
现在有一个 PDF 的幻灯片可以下载。
Leave a Comment
Name (required)
E-mail (required, will not be published)
Website (optional)
Comment
A syntax system which is similar to wiki markup is available, see the guide