数据安全提示: 所有文本数据均在您的浏览器本地处理,不会上传到服务器,确保您的数据安全。

Unicode转换工具

Unicode 15.0
当前操作:字符 → Unicode编码 (JavaScript格式)

输入字符

字符数: 0 码点数: 0

多语言字符示例

Unicode支持全球所有主要文字系统,包括中文、英文、阿拉伯文、梵文、表情符号等。

U+4E2D

中文汉字

A

U+0041

拉丁字母

أ

U+0623

阿拉伯字母

😀

U+1F600

表情符号

Unicode编码结果

转换结果将显示在这里...
等待输入...

使用示例

"中" → Unicode编码
\u4E2D
"Hello World" → Unicode编码
\u0048\u0065...
"😀👍🌟" → Unicode编码
\uD83D\uDE00...
"\u4E2D..." → 解码
中文测试

Unicode算法原理

1. 什么是Unicode?

Unicode是一种字符编码标准,为世界上所有书写系统中使用的每个字符、符号和表情符号分配一个唯一的数字(码点)。 Unicode码点范围从 U+0000U+10FFFF,共1,114,112个可能的码点。

2. Unicode码点表示

// Unicode码点表示方式
U+4E2D → "中"
\u4E2D → "中" (JavaScript)
0x4E2D → 十六进制
20013 → 十进制

Unicode平面

Unicode字符被组织成17个平面(plane),每个平面包含65,536个码点。

平面0: BMP

基本多文种平面

范围:U+0000 - U+FFFF,包含大多数现代语言的字符。

平面1: SMP

补充多文种平面

范围:U+10000 - U+1FFFF,包含历史文字、音乐符号、表情符号等。

平面2: SIP

补充表意文字平面

范围:U+20000 - U+2FFFF,包含CJK统一表意文字扩展。

Unicode编码方案

UTF-8

变长编码,1-4字节。兼容ASCII。

"中" → E4 B8 AD

UTF-16

2或4字节,BMP用2字节,补充平面用代理对。

"中" → 4E2D

UTF-32

固定4字节,简单但空间效率低。

"中" → 00004E2D

快速提示

  • 本地处理,数据安全
  • 多语言支持
  • 支持表情符号
  • 一键复制结果
  • Ctrl+Enter快速转换

技术信息

码点总数:1,114,112
已分配字符:149,813
最新版本:Unicode 15.0

需要其他编码工具?

免费为您开发定制化工具