Skip to content

评测数据

下列技术测试采用的词频为个人统计得到的社交媒体词频(语料来源:GitHub 仓库)经 jieba 默认词典分词得到的词频。

离散能力

以单音节词最长编码为 4 码(无韵尾音节补 o),统计《通用规范汉字表》中的 8105 字共 8773 字音,得到如下分布:

单音节词长度字音数频率
一键1617.01%
二键217062.91%
三键351012.69%
四键411235.57%
页内选重535241.74%
翻页选重634450.07%
总和8773

可见,即使不使用辅助码,单音节词的选重率也不到 2%,翻页率不到 0.1%。一键、两键占比 80%,前三键占比 92%。

以多音节词最长编码为 6 码,统计雾凇拼音词库中的词频前六万词,得到如下分布:

多音节词长度词音数频率
三键3264058.25%
四键42375826.18%
五键51716711.40%
六键6123293.63%
页内选重740920.54%
翻页选重8140.00%
总和60000

手感

单音节词当量为 1.286,多音节词当量为 1.333,总当量为 1.318。用指分布如图所示。除 a 键使用频率较高外,其余均较为合理。

采用 VitePress 构建