# 10.10.7.2 gb18030字符集

在MySQL中gb18030字符集对应于“中国国家标准GB 18030-2005:信息技术” — “中国编码字符集”,这是中华人民共和国(PRC)的官方字符集。

# MySQL gb18030字符集的特点
  • 支持GB 18030-2005标准定义的所有代码点。范围(GB+8431A439,GB+90308130)和(GB+E3329A36,GB+EF39EF39)中的未分配代码点被视为'?'(0x3F)。未分配代码点的转换返回'?'.

  • 支持所有GB18030代码点的上下转换。还支持Unicode定义的大小写折叠(基于折叠箱-6.3.0。txt).

  • 支持数据与其他字符集之间的转换。

  • 支持SQL语句,例如定名.

  • 支持比较gb18030字符串,以及gb18030字符串和其他字符集的字符串。如果字符串具有不同的字符集,则会进行转换。还支持包含或忽略尾随空格的比较。

  • Unicode中的专用区域(U+E000,U+F8FF)映射到gb18030.

  • (U+D800,U+DFFF)和GB18030之间没有对应关系。尝试转换此范围内的代码点返回'?'.

  • 如果传入序列非法,则返回错误或警告。如果在中使用了非法序列CONVERT(),则返回一个错误。否则,将返回警告。

  • 为了与utf8utf8mb4,鞋帮不支持结扎。

  • 当使用gb18030_unicode_520_ci整理。

  • 如果一个字符有多个大写字符,则选择的大写字符是其小写为字符本身的字符。

  • 最小多字节长度为1,最大为4。字符集使用前1或2个字节确定序列的长度。

# 支持的排序规则
  • gb18030_-bin:二进制排序规则。

  • gb18030_中文_ci:默认排序规则,支持拼音。非中文字符的排序基于原始排序键的顺序。原始的排序键是GB(上(ch))如果上(ch)存在。否则,原始排序键为GB(ch).汉字根据Unicode通用语言环境数据存储库(CLDR 24)中定义的拼音排序规则进行排序。非汉字排在汉字前面,但GB+FE39FE39,这是代码点的最大值。

  • gb18030_unicode_520_ci:Unicode排序规则。如果需要确保连字正确排序,请使用此排序规则。