原文または Unicode を入力
1
処理結果
1

使用方法と Unicode の基礎知識

このツールの使い方

  • Unicode から中国語/日本語へ:入力ボックスに \uXXXX 形式の Unicode 文字列を入力し、「Uniから中/日へ」をクリックすると、読み取り可能な文字に復元されます。
  • 中国語/日本語から Unicode へ:入力ボックスにプレーンテキストを入力し、「中/日からUniへ」をクリックすると、\uXXXX 形式に変換されます。「英数字をエスケープするかどうか」をチェックすることで、ASCII 文字をエスケープするかどうかを制御できます。
  • 全角記号から半角記号へ:文章中の全角の句読点(,。!?など)を対応する半角の句読点にワンクリックで置換します。
  • サンプル:緑色の「サンプル」ボタンをクリックすると、テストデータをすばやく入力できます。
  • ドラッグで調整:入力ボックスの下部にある灰色の横棒を左右にドラッグすることで、左右の領域の幅を自由に調整できます。

Unicode の基礎知識

  • Unicode とは?Unicode (ユニコード、万国コード) は、コンピュータ科学分野の業界標準であり、クロス言語およびクロスプラットフォームのテキスト変換と処理の要件を満たすために、すべての言語のすべての文字に統一された一意のバイナリエンコーディングを設定します。
  • \uXXXX 形式:これは、コード (JavaScript、Java、Python、JSON など) で Unicode 文字を表すためによく使用されるエスケープシーケンス形式です。\u の直後に 4 桁の 16 進数が続き、その文字の Unicode コードポイントを表します。たとえば、\u4e2d\u6587 は「中文」を表します。
  • なぜエスケープが必要なのですか?UTF-8 の直接保存をサポートしていない環境、または JSON データをシリアル化する場合、文字化けを防ぐために、非 ASCII 文字 (中国語や日本語など) は通常、安全な送信と保存のために純粋な ASCII 形式の \uXXXX にエスケープされます。
  • サロゲートペア (Surrogate Pairs):基本多言語面 (BMP、つまり \u0000 から \uFFFF) を超える文字 (一部の珍しい文字や絵文字など) の場合、Unicode は 2 つの 16 ビットコード単位 (つまり 2 つの \uXXXX) の組み合わせを使用して表します。これはサロゲートペアと呼ばれます。このツールは、サロゲートペア文字の解析と変換を完全にサポートできます。