원본 텍스트 또는 Unicode 입력
1
처리 결과
1
사용 설명 및 유니코드(Unicode) 지식
도구 사용 방법
- Unicode 변환 (디코딩): 입력 상자에
\uXXXX형식의 유니코드 문자열을 입력하고 "Uni -> 한글/텍스트"를 클릭하면 사람이 읽을 수 있는 문자로 복원됩니다. - 텍스트 -> Unicode (인코딩): 입력 상자에 일반 텍스트를 입력하고 "한글/텍스트 -> Uni"를 클릭하면
\uXXXX형식으로 변환됩니다. "영문 및 숫자 이스케이프 여부"를 체크하여 ASCII 문자를 이스케이프할지 제어할 수 있습니다. - 전각 기호 변환: 원클릭으로 텍스트의 전각 문장 부호(예: ,。!?)를 해당하는 반각 영문 문장 부호로 대체합니다.
- 예제: 녹색 "예제" 버튼을 클릭하면 테스트 데이터를 빠르게 채울 수 있습니다.
- 드래그 조절: 입력 상자 하단의 회색 가로 막대를 잡고 좌우로 드래그하여 양쪽 영역의 너비를 자유롭게 조절할 수 있습니다.
유니코드 (Unicode) 기본 지식
- 유니코드란 무엇인가요? 유니코드(Unicode, 만국 코드)는 컴퓨터 과학 분야의 업계 표준으로, 텍스트 변환 및 처리를 위한 언어와 플랫폼의 장벽을 극복하기 위해 세계의 모든 문자에 대해 일관되고 고유한 이진 인코딩을 설정합니다.
\uXXXX형식: 코드(예: JavaScript, Java, Python, JSON)에서 유니코드 문자를 나타내는 일반적인 이스케이프 시퀀스(Escape Sequence) 형식입니다.\u뒤에 4개의 16진수 숫자가 오며, 이는 해당 문자의 유니코드 코드 포인트(Code Point)를 나타냅니다. 예를 들어\uD55C\uAE00은 "한글"을 나타냅니다.- 왜 이스케이프가 필요한가요? UTF-8 직접 저장을 지원하지 않는 일부 환경이나 JSON 데이터를 직렬화(Serialization)할 때 글자 깨짐(Garbled Text)을 방지하기 위해 비-ASCII 문자(예: 한글, 한자)를 안전한 전송 및 저장을 위해
\uXXXX형태의 순수 ASCII 형식으로 이스케이프(Escape)하는 경우가 많습니다. - 서로게이트 페어 (Surrogate Pairs): 기본 다국어 평면(BMP, 즉
\u0000에서\uFFFF까지)을 벗어나는 문자(예: 이모지(Emoji) 또는 희귀 한자)의 경우, 유니코드는 두 개의 16비트 코드 단위(즉, 두 개의\uXXXX) 조합을 사용하여 표현하며 이를 서로게이트 페어라고 합니다. 이 도구는 서로게이트 페어 문자의 파싱 및 변환을 완벽하게 지원합니다.
