同音字读音相同, 写法和意义不同的一组汉字。同音字又分声韵调完全相同的 “绝对同音字”和声韵相同调不同的 “相对同音字”。累积汉字达6万个,汉语带调音节只有1300个,平均每个带调音节所含绝对同音字高达46个, 如果不计声调,416个音节平均每个音节的同音字高达144个。 即使在国家标准 《信息导换用汉字编码字符集——基本集》所收6763个汉字的范围内, 绝对同音字平均高达5个, 相对同音字也高达16个。由于同音字实际分布的不平均,个别音节,像ji、 jian、 yi等都高达数十甚至上百个。这给汉字字音编码输入以及语音识别与合成带来很大的困难。 目前, 主要采用建立词库的办法, 解决单字同音字过多的问题。
|