各种常见乱码的产生原因

木头的喵喵拖孩

先引入一张我个人认为比较在理的图,总结的很完善

根据途中所示,乱码分为下面这几种常见原因:

乱码名称示例特点产生原因
古文码见图大都为不认识的古文,并加杂日韩文以GBK方式读取UTF-8编码的中文
口字码见图大部分字符为小方块以UTF-8的方式读取GBK编码的中文
符号码见图大部分字符为各种符号以ISO8859-1方式读取UTF-8扁码的中文
拼音码见图大部分字符为头顶带有各种类似声调符号的字母以ISO8859-1方式读取GBK编码的中文
问句码见图字符串长度为偶数时正确,长度为奇教时最后的字符变为问号以GBK方式读取UTF-8编码的中文,然后又用UTF-8的格式再次读取
锟拷码见图全中文字符,且大部分字符为“锟斤拷”这几个字符以UTF-8方式读取GBK编码的中文,然后又用GBK的格式再次读取

最后,知道了产生乱码的原因,就能解决乱码问题了

  • 标题: 各种常见乱码的产生原因
  • 作者: 木头的喵喵拖孩
  • 创建于: 2024-06-11 17:27:06
  • 更新于: 2024-06-11 17:46:17
  • 链接: https://blog.xx-xx.top/2024/06/11/各种常见乱码的产生原因/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
此页目录
各种常见乱码的产生原因