본문 바로가기
파이썬 공부하기

파싱이란? 파이썬으로 뷰티풀수프 beautiful soup 로 파싱하기

by 메두 드 펭 2022. 1. 18.

 

파싱(parsing) 이란? 쉽게말해 데이터를 종류에 맞게 구분해서 정리하는 것. 

   취합 같은거 할 때 보통 담당자/주소/연락처/y,n여부 등을 엑셀로 칸을 만들어서 배포했던 경험 있을텐데

   이거도 일종의 파싱이라고 생각하면 이해가 쉬울 것이다. 

 

파서(parser) 이란? 파싱을 하게 만들어주는 번역기.

 

여기에서는 html 구문을 뷰티풀수프 의 파서를 이용해서 파싱해서

사람이 알아볼 수 있는 내용으로 가져와보겠다. 

 

1. 파이썬에서 뷰티풀수프가 하는 역할 

 

html 의 구문을 분석해서 사람이알아볼수 있도록 만들어주는 번역기같은 존재 

 

2. 뷰티풀수프 설치 및 사용법

 

from bs4 import BeautifulSoup 

 

위 구문으로 파이썬에서 뷰티풀수프를 사용할수 있다

뷰티풀수프라는 라이브러리를 가져오는것

 

3. 뷰티풀수프 대표 구문

 

soup  = BeautifulSoup(html, 'html.parser')

-> html 변수 안에 있는 구문을 html parser를 통해 파싱하고 그걸 soup 변수에 저장