Page Last

戻る勉強部屋 > 画像収集

画像収集

目的

  • 検索した画像を「名前を付けて画像を保存」する作業を何回も繰り返したくない

  • ダウンロードツールを使うといらない画像が大量に混ざっていたり、欲しい画像がなかったりする

利用するツール

  • 画像検索サイト:目的の画像を探すサイト

  • Wireshark:パケットキャプチャツール

  • 極窓:ファイル形式判別ツール

手順

  1. 画像検索サイトで目的の画像のページの一歩手前まで進めておく(大量にタブを開いておく)

  2. Wiresharkを起動してパケットキャプチャを開始(インターフェースはローカル接続など)

  3. 用意しておいた各ページを目的の画像ページにそれぞれ進める(タブを切り替えながらクリック)
    左手で「Ctrl」+「Tab」、右手でクリックをすると楽

  4. WiresharkでHTTPオブジェクトを一括保存
    「File」>「Export Objects」>「HTTP」>「Save All」

  5. HTTPオブジェクトを保存したフォルダを開き、いらないファイルを削除
    ファイルサイズでソートし、小さいものを削除
    画像検索サイトによって画像ファイル名に規則性があるので参考にする(経験則)

  6. 保存した画像ファイルは拡張子がついていない場合が多いので、極窓を利用して適切な拡張子を付ける
    保存した画像ファイルをドラッグ&ドロップして、一括拡張子変換(全選択してF3)

重複画像削除

目的

  • 重複している画像をなるべく簡単に削除したい

手順

  • ファイル名だけ違う場合:
    サイズでソートして目視で削除