beautifulsoup로 웹 페이지 크롤링

2021. 12. 26. 21:10

● bs4 설치하기

pip install beautifulsoup4

● bs4 사용하기

from bs4 import BeautifulSoup

# HTML 파일을 읽어 들이고 BeautifulSoup 객체를 생성합니다.
with open('full_book_list.html') as f:
    soup = BeautifulSoup(f, 'html.parser')

# find_all() 메서드로 a 요소를 추출하고 반복을 돌립니다.
for a in soup.find_all('a'):
    # href 속성과 글자를 추출합니다.
    print(a.get('href'), a.text)

'크롤링 > 자주 쓰는 크롤링 코드' 카테고리의 다른 글

파이썬에서 웹 브라우저(url) 호출하는 방법 : webbrowser (0)	2021.12.27
html, xml 페이지 스크레이핑 (0)	2021.12.26
html, xml 페이지 스크레이핑 : urlopen() (0)	2021.12.26

datart

beautifulsoup로 웹 페이지 크롤링

'크롤링 > 자주 쓰는 크롤링 코드' 카테고리의 다른 글

+ Recent posts

티스토리툴바