使い方

調査したい文字を入力してください。文字の種類によって色分けされ、文字コードと文字数がともに表示されます。

入力
出力
文字数カウント
オプション
ヒント
基本動作
  • 入力した内容はブラウザ内で処理され、サーバーへ送信されません
  • コピーボタンで作成したtsv形式のテキストはエクセルに貼り付けが出来ます
  • URLに解析内容を記録しており、他のユーザーへURLを渡すことで展開が可能です
  • 文字化けや不具合になりそうな文字は、特に目立つように色付けされます 例: 高渾你貛髙①😀\¥☺︎ヷあ゙禰󠄀👨‍👩👍🏻🏴󠁫󠁨󠀱󠀰󠁿🇦🇧🇨
文字数カウント
  • グラフェム: 人が「1文字」と認識する単位で数えた文字数
  • 文字コード: プログラムが認識する単位で数えた文字数 例:👍🏻はグラフェムでは1文字だが、プログラム上では複数の文字で構成
  • 推定横幅: テキストの横幅を以下のロジックで推定したものを表示
  • 0.0文字幅換算: 複数の要素を結合する場合
  • 0.5文字幅換算: ASCII、半角カタカナ、Regional Indicator 文字
  • 1.0文字幅換算: 上記以外
漢字判定の備考表示
  • 備考に表示される漢字関連の診断結果
  • 常: 2010年時点の常用漢字
  • 人: 常用漢字に含まれていない2017年時点の人名用漢字
  • 第1水準: 日常的に使われる基本的な漢字
  • 第2水準: 人名・地名などで使われることの多い追加の漢字
  • 第3水準: 主に人名用として追加された比較的使用範囲の限られる漢字
  • 第4水準: 旧字体や異体字など互換性を重視して追加された漢字
  • IBM拡張: IBM拡張文字で追加された文字(漢字含む)
  • 異体字: 1つ前の文字(漢字含む)を異体字セレクタで変換する制御用文字
  • サ: 2つのUTF-16で表すサロゲートペアが必要な文字(漢字含む)
  • 見分不可: 通常の漢字と見分けが付かない部首文字
  • ※上記の表示がない漢字もあります。詳細はCJK漢字分類を確認ください。
CJK漢字分類
  • 漢字の系統を元に、その文字がどの種類の漢字に属するかを表示
  • 統合: 中国・日本・韓国などで共通して使われる、基本的な漢字
  • 統合拡張A: 統合漢字に含まれなかった、比較的早い段階で追加された漢字
  • 統合拡張B: 人名・地名・歴史資料などで使われる、画数や字形の多い漢字
  • 統合拡張C〜J: 文献・研究用途などを中心に、後から段階的に追加された漢字
  • 互換: 過去の文字コードとの互換性を保つために用意された漢字
  • 互換補助: 互換漢字を補完するために追加された漢字
  • 部首(基準): 康熙字典を基準とした、漢字を分類するための部首
  • 部首(補助): 部首の異体や略形などを補助的に収録した文字