数据源为 coca词频表,共6万词,其中包含了每个词的词频,按词频从大到小排列。于是在excel中用了几个简单的函数做统计,计算出,在实际应用中,如果到达到一定百分比的认识率,需要多少词汇量。当然,这并不很准确,但即便如此还是有参考意义的。
原始数据表示例
[……]
这是fengyqf的博客
数据源为 coca词频表,共6万词,其中包含了每个词的词频,按词频从大到小排列。于是在excel中用了几个简单的函数做统计,计算出,在实际应用中,如果到达到一定百分比的认识率,需要多少词汇量。当然,这并不很准确,但即便如此还是有参考意义的。
原始数据表示例
[……]
这只是个无聊的小把戏。
最近又看到关于qwerty键盘布局的讨论,有提到好的键盘布局标准之一:把连续的按键分散在左右两手上,这样第一只手击键的同时,第二只手可以提前做好准备,提高效率。
于是从网上找了一批古典英文小说的txt电子版,写了个傻傻的脚本,统计其中连续两个字母的频次(忽略大小写[……]