字符集
seekdb 默认的字符集是 utf8mb4。
seekdb 目前支持如下字符集:
-
binary -
gbk -
gb18030 -
utf16 -
utf8mb4/utf8mb3信息为支持无缝迁移,seekdb 在语法上将
UTF8视为UTF8MB4的同义词。utf8mb3是utf8mb4的别名。 -
latin1 -
gb2312 -
gb18030_2022 -
ascii -
tis620 -
ujis -
euckr -
eucjpms -
cp932 -
utf16le -
sjis -
dec8 -
hkscs -
hkscs31 -
big5 -
cp850 -
hp8 -
macroman -
swe7
seekdb 当前版本不支持 gb18030 与 gb18030_2022 的 隐式转换,但用户可以通过 CONVERT 将一个 gb18030 的字符串的字符集显式转换为 gb18030_2022。该转换没有经过 Unicode,采取了保留编码的方法。如下示例中,‘龴’ 的编码在转换前后都为 0xFE59,没有发生变化。
SELECT HEX(CONVERT(_gb18030 0xFE59 USING gb18030_2022)), HEX(CONVERT(_gb18030_2022 0xFE59 USING gb18030));
返回结果如下:
+--------------------------------------------------+--------------------------------------------------+
| HEX(CONVERT(_gb18030 0xFE59 USING gb18030_2022)) | HEX(CONVERT(_gb18030_2022 0xFE59 USING gb18030)) |
+--------------------------------------------------+--------------------------------------------------+
| FE59 | FE59 |
+--------------------------------------------------+--------------------------------------------------+
1 row in set (0.001 sec)