TIL_2020년 10월 01일 (목)

최대 1 분 소요

목차

1.오늘 한 일

  1. 자바스크립트 정리 및 TIL 작성
  2. 스파르타코딩클럽 파이썬 추석특강
    • 셀레니움과 dload를 이용하여 연예인 사진 자동으로 다운받기
    • 아래는 아이유의 사진을 모으는 코드입니다.
     import dload
     from bs4 import BeautifulSoup
     from selenium import webdriver
     import time
        
     driver = webdriver.Chrome('./chromedriver') # 웹드라이버 파일의 경로
     driver.get("https://search.daum.net/search?w=tot&DA=YZR&t__nil_searchbox=btn&sug=&sugo=&sq=&o=&q=%EC%95%84%EC%9D%B4%EC%9C%A0")
     time.sleep(5) # 5초 동안 페이지 로딩 기다리기
        
     req = driver.page_source
     # HTML을 BeautifulSoup이라는 라이브러리를 활용해 검색하기 용이한 상태로 만듦
     # soup이라는 변수에 "파싱 용이해진 html"이 담긴 상태가 됨
     # 이제 코딩을 통해 필요한 부분을 추출하면 된다.
     soup = BeautifulSoup(req, 'html.parser')
        
     thumbnails = soup.select('#imgList > div > a > img')
        
     i = 1
     for thumbnail in thumbnails:
         img = thumbnail['src']
         dload.save(img, f'img_homework/{i}.jpg')
         i += 1
        
     driver.quit() # 끝나면 닫아주기
    

2.오늘 배운 것과 깨달은 것

  • 오랜만에 파이썬 하니까 또 재밌네. 자바스크립트의 매력은 화면이 보여지는 것이라면, 파이썬의 매력은 또 이렇게 데이터들을 추출하고 정리/저장 하는 것이다. API만들어서 데이터 내려줄 때의 재미도 큰 것같고…

3.지금까지 작업물 (사진)

  • 없음

태그:

카테고리:

업데이트:

댓글남기기