リアルタイム文字コード変換／解析ツール

使い方

調査したい文字を入力してください。文字の種類によって色分けされ、文字コードと文字数がともに表示されます。

入力

出力

文字数カウント

オプション

ヒント

基本動作

入力した内容はブラウザ内で処理され、サーバーへ送信されません
コピーボタンで作成したtsv形式のテキストはエクセルに貼り付けが出来ます
URLに解析内容を記録しており、他のユーザーへURLを渡すことで展開が可能です
文字化けや不具合になりそうな文字は、特に目立つように色付けされます例： 高渾你貛髙①😀\¥☺︎ヷあ゙禰󠄀👨‍👩👍🏻🏴󠁫󠁨󠀱󠀰󠁿🇦🇧🇨

文字数カウント

グラフェム：人が「1文字」と認識する単位で数えた文字数
文字コード：プログラムが認識する単位で数えた文字数例：👍🏻はグラフェムでは1文字だが、プログラム上では複数の文字で構成
推定横幅：テキストの横幅を以下のロジックで推定したものを表示
0.0文字幅換算： 複数の要素を結合する場合
0.5文字幅換算： ASCII、半角カタカナ、Regional Indicator 文字
1.0文字幅換算： 上記以外

漢字判定の備考表示

備考に表示される漢字関連の診断結果
常： 2010年時点の常用漢字
人：常用漢字に含まれていない2017年時点の人名用漢字
第1水準： 日常的に使われる基本的な漢字
第2水準： 人名・地名などで使われることの多い追加の漢字
第3水準： 主に人名用として追加された比較的使用範囲の限られる漢字
第4水準： 旧字体や異体字など互換性を重視して追加された漢字
IBM拡張： IBM拡張文字で追加された文字（漢字含む）
異体字： 1つ前の文字（漢字含む）を異体字セレクタで変換する制御用文字
サ： 2つのUTF-16で表すサロゲートペアが必要な文字（漢字含む）
見分不可： 通常の漢字と見分けが付かない部首文字
※上記の表示がない漢字もあります。詳細はCJK漢字分類を確認ください。

CJK漢字分類

漢字の系統を元に、その文字がどの種類の漢字に属するかを表示
統合： 中国・日本・韓国などで共通して使われる、基本的な漢字
統合拡張A： 統合漢字に含まれなかった、比較的早い段階で追加された漢字
統合拡張B： 人名・地名・歴史資料などで使われる、画数や字形の多い漢字
統合拡張C〜J： 文献・研究用途などを中心に、後から段階的に追加された漢字
互換： 過去の文字コードとの互換性を保つために用意された漢字
互換補助： 互換漢字を補完するために追加された漢字
部首（基準）： 康熙字典を基準とした、漢字を分類するための部首
部首（補助）： 部首の異体や略形などを補助的に収録した文字