arison.jp arison.jp blog - 現在をたのしく、未来をたのしむ。日常の思い出兼備忘録。

【文字化け】文字化けの結果から文字コードを想定

文字化けに関するトラブルシューティング。
文字化け結果から原文を想定する。
文字化けには癖がある。
その癖がわかれば元の文字コードがわかる。

参考サイトでは、サンプルも含めて紹介してくれています。

半角カナが多い場合は EUC-JP なのにシフトJISとして表示しちゃってる場合。

画数の多い漢字の中に半角カナが少々混じるのは、UTF-8 をシフトJISとして表示しちゃってる場合。

$ や % が1文字置きに現れるのは ISO-2022-JP の ESC が落ちたか、EUC-JP の 8bit目が落ちた場合。
ISO-2022-JP の場合は $B や (B が現れる。

変換に伴って欠落してしまうデータはあるものの、文字化けしたデータから元データを復元するのはそんなに難しくありません。

マジですか!

ちなみに「・」は変換できなかった文字の場合にでたりします。

http://b.hatena.ne.jp/entry/tmtms.hatenablog.com/entry/2014/05/25/mojibake#tw?u=Arisona>
「文字化けに関するトラブルシューティング」 –

@tmtms のメモ
http://tmtms.hatenablog.com/entry/2014/05/25/mojibake

About arison

大都会岡山の南部にある玉野市生まれ。 大都会岡山のIT会社(目標は大都会No.1)でコンピュータとお客を相手に日夜格闘中。 関東出張中はグルメブログ。 基本的に遊び人のおっさん。 ライフハックとガンダム好き。ギガフロート玉野を浸透中。

26. 5月 2014 by arison
Categories: 仕事, プログラミング | Tags: , | Leave a comment

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください