ASCII文字コードを中心に、すでに解説したが、以下に要点のみ再掲する。
方策1:日本語文字を含む部分の直前と直後に目印を入れて区別する。
61 61 61 1b 24 42 61 61 1b 28 42
a a a ESC $ B a a ESC ( B
~~~~~~ この部分が日本語(2バイトで「瘁」を表す)
上図と右図は「aa瘁」と書いたファイル(をJISエンコーディングで保存したもの)の詳細(ダウンロードして自分で16進ダンプしてみて下さい)。
方策2:文字コードそのものに印をつける
といった感じ(けっこう複雑ですよね)。