まだまだハマるよ。(環境依存文字)

むむむむむむむ。

http://snowland.net/nucleus/item/3355

カッコ株はiso-2022-jpにありませんよ。
って話。よく使われる文字だけ変換テーブルに掛けるべか。

って、思ったんだけど、
http://route477.net/d/?date=20110119
お、、、、

もっと簡単な方法がある。String#encodeにオプションを渡すと、不正なバイト列の扱いを指定することができる。
例えば以下のようにすると、不正なバイト列や変換が未定義のバイト列は適当な記号で置き換えられる。

html = open(url, "r:euc-jp").read.encode("utf-8", :invalid => :replace, :undef => :replace)


これでこの件も解決かなぁ。