汉字转换成拼音。
最近在设计一款中文输入方案,有个步骤需要将汉字转换成拼音。
虽然找到很多的转换工具,但是绝大多数的转换工具转换后的拼音都带有声调。 而唯一能找到 (也可能是我的信息检索能力不好) 不带声调的转换工具连《通用规范汉字表》都不能覆盖。
所以 Fork 了一份 mozillazg/pinyin-data 拼音数据, 自己动手做一个汉字转拼音工具。
- 支持转换汉字到拼音
- 转换多个汉字需要保存汉字在纯文件文件中,每行一个汉字
- 支持转换汉字到 unicode 编码
- 转换多个汉字需要保存汉字在纯文件文件中,每行一个汉字
- 支持转换汉字到带声调/不带声调的拼音
Usage: hz2py [input file] [options] [arguments]
Options:
-h, --help Displays this help
-v, --version Displays version information
- kHanyuPinyin
- Unihan Database 中 kHanyuPinyin 部分的拼音数据
- 来源于《漢語大字典》的拼音数据
- kXHC1983
- Unihan Database 中 kXHC1983 部分的拼音数据
- 来源于《现代汉语词典》的拼音数据
- kHanyuPinlu
- Unihan Database 中 kHanyuPinlu 部分的拼音数据
- 来源于《現代漢語頻率詞典》的拼音数据
- kMandarin
- Unihan Database 中 kMandarin 部分的拼音数据
- 普通话中最常用的一个读音。以 zh_CN 为主,如果 zh_CN 中没有则使用 zh_TW 中的拼音
- kMandarin_overwrite
- 手工纠正 kMandarin.txt 中有误的拼音数据
- GBK_PUA
- Private Use Area 中有拼音的汉字,参考 GB 18030
- nonCJKUI
- 不属于 CJK Unified Ideograph 但是却有拼音的字符
- kanji
- 日本自造汉字 的拼音数据
- kMandarin_8105
- 《通用规范汉字表》(2013 年版) 里 8105 个汉字最常用的一个读音
- overwrite
- 手工纠正的拼音数据
- pinyin
- 合并上述文件后的拼音数据
- zdic
- 汉典网 的拼音数据
- 支持多种拼音词典
- 词典自动补位搜索
- 当所选词典没对应汉字的拼音时自动检索其它词典
- Unicode 码反查汉字
- 带声调/不带声调的拼音反查汉字