文字コードを調べる方法 - 妄想科學倶樂部

miでファイルを作成中、しばしば「(文字コード)で保存できない文字が含まれていたため、UTF-8で保存しました」と強制的に文字コードが変更されることがある。とりわけWinユーザの送ってきたファイルから文字列をコピー&ペーストしたときに問題を生じ易い。htmlの場合、宣言した文字コードと実際の文字コードに相違があると文字化けするので、これは困る。
いや、それならそれで最初からutf-8を宣言すれば済みそうなものなのだが、どうやらIEは(またIEか!)utf-8を正常に認識できないようだ。とりわけShift_JISのページからutf-8のページにリンクすると覿面に文字化けする。

仕方ないので Shift_JISで表示できないらしい文字を探して書き直すわけだが、当該文字を簡単に発見する方法がないというのが目下の悩み。経験的に、中黒(・)や波ダッシュ(〜)あたりが問題を生じ易いことは判っているのだが、一括置換しようにも当該文字をサンプリングしなければ置き換えようがないという矛盾。
どうやったら、問題のある文字を素早く発見して書き直すことができるだろうか。