Skip to content

Latest commit

 

History

History
47 lines (35 loc) · 2.98 KB

README.md

File metadata and controls

47 lines (35 loc) · 2.98 KB

IshisashiEncoding

本项目收集各个编码与 UCS 的对应关系,以及关于 UCS 的那些事儿。

仓库很大,谨慎 Clone。(正论)

正由于仓库过大,网页分化到 IshisashiEncoding-Website,以便于进行部署。

术语说明

UCS/Unicode

在 ISO/IEC 10646 中,字符集部分称作为「UCS」。

但是在 Unicode 中,字符集部分被称为「Unicode」。

本项目为了保持中立,称字符集部分为「UCS」。

GB 与 GB/T

部分 GB 强制标准在现在已经降级为了 GB/T,因此本项目内称为 GB/T。如 GB/T 2312。

区位表示

在 JIS X 0208 等标准中,区位的表示在一个标准内都显得不够统一。

本项目采取 GB/T 2312 的表示,将区位表示成「(X)X-XX」格式。

对于面区位,由于是区位扩展而来,因此表示成「(X)X-(X)X-XX」格式。

兼容字准则

对于编码映射来说,尊重编码规范原文的映射,可能映射至兼容字。

但对于区位表等明确字符的文本来说,使用 SVS 表示,并在注释里附上惯用的兼容字。

所收编码