很多语言,包括英语在内,都使用沉音字符(accented character)。因为这些字符不属于 ASCII 字符集,所以假如不查看 Unicode 值也不使用 Unicode 编辑器并将其转成一个已知字符集,就很难编写使用这些字符的代码。 Oracle9i 引入了 COMPOSE 函数,该函数接受一串 Unicode 字符并规则化其文本。这就意味着它可以接受一个字母和一个组合标记,比如说‘a'(Unicode 字符0097)和沉音符(Unicode 字符0300),然后创建一个单独的由两个标记组合而成的字符。COMPOSE 使用非凡的组合标记,而没有使用 ASCII 中相应的音节标记,它所使用的非凡的组合标记是 Unicode 标准 的一部分。上面的例子的结果应该是 Unicode 字符00E0(有一个沉音符的小写拉丁字母‘a')。 在 ANSI 中最常见的组合字符有: · U+0300:沉音符(grave accent)( ` )。 · U+0301:重音符(acute accent)( ' )。 · U+0302:抑扬音符号(circumflex accent)(^)。 · U+0303:颚化符号(tilde)(~)。 · U+0308:元音变音...[ 查看全文 ]