输入原文或 Unicode
1
处理结果
1
使用说明与 Unicode 知识点
如何使用本工具
- Unicode 转中文:在输入框中输入包含
\uXXXX格式的 Unicode 字符串,点击“Unicode转中文”,将其还原为可读的中文字符。 - 中文转 Unicode:在输入框中输入普通文本,点击“中文转Unicode”,将其转换为
\uXXXX格式。可以通过勾选“英文数字是否转义”来控制是否对 ASCII 字符进行转义。 - 中文符号转英文:一键将文章中的中文标点(如,。!?)替换为对应的英文标点。
- 示例:点击绿色的“示例”按钮可以快速填充测试数据。
- 拖拽调节:您可以按住输入框底部的灰色横条左右拖动,以自由调节左右区的宽度。
Unicode 基础知识
- 什么是 Unicode?Unicode(统一码、万国码)是计算机科学领域里的一项业界标准,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。
\uXXXX格式:这是一种常见的在代码(如 JavaScript、Java、Python、JSON)中表示 Unicode 字符的转义序列格式。\u后面紧跟 4 个十六进制数字,表示该字符的 Unicode 码点。例如\u4e2d\u6587代表“中文”。- 为什么需要转义?在某些不支持 UTF-8 直接存储的环境中,或者在 JSON 数据序列化时,为了防止乱码,通常会将非 ASCII 字符(如中文)转义为
\uXXXX的纯 ASCII 形式进行安全传输和存储。 - 代理对 (Surrogate Pairs):对于超出基本多语言平面(BMP,即
\u0000到\uFFFF)的字符(比如一些生僻字或 Emoji 表情),Unicode 会使用两个 16 位的码元(即两个\uXXXX)组合来表示,这被称为代理对。本工具可以完美支持代理对字符的解析转换。
