Skip to content

一些应用场景

wainshine edited this page Jan 23, 2018 · 2 revisions

一些我想到的,但暂时没能力做出来的功能。 至于做不出来的原因嘛,因为咱可是产品经理啊,产品经理最大的本事就是——没有本事!口亨!

1、成语取名

词典“ChengYu_Corpus(5W).txt”收录了5万个常用成语,只要简单处理一下,就可以做出一个成语取名应用。当然前提是,有词频,并去除情感为负的字词。词频可以去抓取某度指数,毕竟5万个还是比较好抓的,或是自己分词统计。情感分析自己想办法。

2、诗词取名

诗词类语料GitHub上已经有不少成熟的了,大家搜“全唐诗”或“全宋词”即可以找到,我就不重复造轮子了。对诗词语料进行分词,提取出词频,再简单处理下,就可以做出一个诗词取名应用。

3、取名字典

虽然人名语料库中的低频用字已经被我删掉了,但同样的不吉利的字也被我删掉了啊,所以剩下的都是些还不错的字呢(一不小心说出了核心竞争力)。只要简单统计一下词频,你就可以得到一份很好的“人名常用字表”了。

为什么要做中文人名语料库

这个我在“最美名字4年小记”中写了一部分,主要还是机缘巧合。但也有一个原因是:被市面上千篇一律的“五格取名法”烦了,希望通过“中文人名语料库”的开源,能刺激出一批新的、不一样的产品产生。

以上。与大家共勉!

Clone this wiki locally