webから画像をダウンロード

tensorflowで学習させる画像を手に入れよう思い, pythonのコードを色々試すもなかなかうまくいかなかった.

目的: google画像検索の結果をダウンロードしたい

requests

requests

codabledays.hatenablog.com

で単品のダウンロードはできたんだけど, 一気にダウンロードするにはhtmlの解析の必要あり.

urllib, beautifulSoup4

urllib, beautifulSoup4もなぜかうまく行かず.

automator

以前はmacautomator

www.ivyhc.com

をやってみたけど,

  • リンク先の画像が何故かダウンロードできない
  • 途中で落ちる
  • 貼ってある画像をダウンロードのモードにするとサムネイルなので画像が小さい
  • いちいちsafariを開くのが面倒くさい
  • 画像が一度に25個しかダウンロードできなかった

という感じであんまり使い勝手が良くなく...

今からhtmlのソースを解析するコードを自作で書くのも面倒だった
(そもそも今やりたいことはそれではない)
ので, どうしたものかと思ってたんですが, 結局
この方 shimarisu.webcrow.jp のがよさそうです.

元はwin, linux用トのことですがMacでも動いてます.

f:id:ksumiya0318:20161025125243p:plain