リアルタイム文字コード変換/解析ツール
漢字コード/絵文字チェック
使い方
調査したい文字を入力してください。文字の種類によって色分けされ、文字コードと文字数がともに表示されます。
入力
content_paste
paste
出力
content_copy
copy
文字数カウント
オプション
ヒント
基本動作
入力した内容はブラウザ内で処理され、サーバーへ送信されません
コピーボタンで作成したtsv形式のテキストはエクセルに貼り付けが出来ます
URLに解析内容を記録しており、他のユーザーへURLを渡すことで展開が可能です
文字化けや不具合になりそうな文字は、特に目立つように色付けされます
例:
高渾你貛髙①😀\¥☺︎ヷあ゙禰󠄀👨👩👍🏻🏴🇦🇧🇨
文字数カウント
グラフェム
: 人が「1文字」と認識する単位で数えた文字数
文字コード
: プログラムが認識する単位で数えた文字数
例:
👍🏻
はグラフェムでは1文字だが、プログラム上では複数の文字で構成
推定横幅
: テキストの横幅を以下のロジックで推定したものを表示
0.0文字幅換算:
複数の要素を結合する場合
0.5文字幅換算:
ASCII、半角カタカナ、Regional Indicator 文字
1.0文字幅換算:
上記以外
漢字判定の備考表示
備考に表示される漢字関連の診断結果
常:
2010年時点の常用漢字
人:
常用漢字に含まれていない2017年時点の人名用漢字
第1水準:
日常的に使われる基本的な漢字
第2水準:
人名・地名などで使われることの多い追加の漢字
第3水準:
主に人名用として追加された比較的使用範囲の限られる漢字
第4水準:
旧字体や異体字など互換性を重視して追加された漢字
IBM拡張:
IBM拡張文字で追加された文字(漢字含む)
異体字:
1つ前の文字(漢字含む)を異体字セレクタで変換する制御用文字
サ:
2つのUTF-16で表すサロゲートペアが必要な文字(漢字含む)
見分不可:
通常の漢字と見分けが付かない部首文字
※上記の表示がない漢字もあります。詳細はCJK漢字分類を確認ください。
CJK漢字分類
漢字の系統を元に、その文字がどの種類の漢字に属するかを表示
統合:
中国・日本・韓国などで共通して使われる、基本的な漢字
統合拡張A:
統合漢字に含まれなかった、比較的早い段階で追加された漢字
統合拡張B:
人名・地名・歴史資料などで使われる、画数や字形の多い漢字
統合拡張C〜J:
文献・研究用途などを中心に、後から段階的に追加された漢字
互換:
過去の文字コードとの互換性を保つために用意された漢字
互換補助:
互換漢字を補完するために追加された漢字
部首(基準):
康熙字典を基準とした、漢字を分類するための部首
部首(補助):
部首の異体や略形などを補助的に収録した文字