본문 바로가기

프로그래밍/Python

python google-images-download 로 이미지를 다운로드할 수 없을 때.

728x90

2020년 5월 확인한 내용임. 이 글을 읽는 시점이 작성시점에서 많이 떨어져있다면, 아래 제시한 내용이 동작하지 않을 가능성이 있습니다.

파이썬 google-images-download 로 구글 이미지 검색의 이미지를 다운받으려 했다. pip install google-images-download 로 최신버전의 패키지를 깔고, 예제 코드를 실행했다. 그러나, 

Unfortunately all 100 could not be downloaded because some images were not downloadable 

과 같은 에러메시지가 나오고, 이미지파일이 다운로드 되지 않았다.

검색을 하여, 구글검색이 아닌 bing 이미지 검색 결과를 다운로드해 주는 fork 를 사용하는 방법을 발견했다.

https://github.com/hardikvasa/google-images-download/issues/301

 

Unfortunately all 20 could not be downloaded because some images were not downloadable · Issue #301 · hardikvasa/google-images-d

Hello, does the framework work? I just have installed it on Ubuntu 18.04 by the pip (inside the virtualenv) and when I'm trying with or without the chromimdriver I'm receiving the same mess...

github.com

 

더보기

@cli0 @Jiho-korea @utterworks I've updated the Bing scraper with a few improvements in the repo below. Pass a --chromedriver path for all searches, and optionally --download.

https://github.com/ultralytics/google-images-download

$ git clone https://github.com/ultralytics/google-images-download
$ cd google-images-download
$ python3 bing_scraper.py --search 'honeybees on flowers' --limit 10 --download --chromedriver /Users/glennjocher/Downloads/chromedriver

 

  1. ultraytics 의 github 에서 google-images-download 레포를 클론하고, 
  2. 클론한 디렉토리로 이동하여
  3. bing_scraper.py 를 원하는 검색어와 옵션을 주고 실행한다.
  4. chromedriver 를 미리 다운로드 받아 놓아야 하고,
  5. tqdm, selenium 이 미리 설치되어 있어야 한다.