curlでEUC-JPのサイトをUTF-8に変換してファイルにダウンロードする
curlでページをファイルにダウンロード
文字コードがutf-8のサイトならこれだけ。
| 1 | $ curl https://example.com/ > sample.html | 
文字コードがeuc-jpだと文字化けするのでiconv(文字コードを変換)をかませる。
| 1 2 3 4 5 | $ curl https://example.com/ | iconv -f EUCJP -t UTF8 > sample.html オプション -f: --from-code= -t: --to-code= | 
検索結果のページなどでパラメーターがたくさんついているurlでは&を”&”と文字列として指定してやる。
| 1 | $ curl https://example.com/search?name=hoge"&"age=35"&"sex=male > sample.html | 
コメント
コメントはありません。