파싱(parsing) 이란? 쉽게말해 데이터를 종류에 맞게 구분해서 정리하는 것.
취합 같은거 할 때 보통 담당자/주소/연락처/y,n여부 등을 엑셀로 칸을 만들어서 배포했던 경험 있을텐데
이거도 일종의 파싱이라고 생각하면 이해가 쉬울 것이다.
파서(parser) 이란? 파싱을 하게 만들어주는 번역기.
여기에서는 html 구문을 뷰티풀수프 의 파서를 이용해서 파싱해서
사람이 알아볼 수 있는 내용으로 가져와보겠다.
1. 파이썬에서 뷰티풀수프가 하는 역할
html 의 구문을 분석해서 사람이알아볼수 있도록 만들어주는 번역기같은 존재
2. 뷰티풀수프 설치 및 사용법
from bs4 import BeautifulSoup
위 구문으로 파이썬에서 뷰티풀수프를 사용할수 있다
뷰티풀수프라는 라이브러리를 가져오는것
3. 뷰티풀수프 대표 구문
soup = BeautifulSoup(html, 'html.parser')
-> html 변수 안에 있는 구문을 html parser를 통해 파싱하고 그걸 soup 변수에 저장
'파이썬 공부하기' 카테고리의 다른 글
(no코딩) 크롤링 클릭으로 그냥 하기 : listly 리스틀리 (0) | 2022.02.26 |
---|---|
트위터 개발자계정 발급받기 (트위터 api) (0) | 2022.01.19 |
파이썬 requests 설치, 사용법 (0) | 2022.01.17 |
vscode 에서 파이썬 터미널 command prompt 로 설정 및 이유 (0) | 2022.01.16 |
window10 파이썬 경로 path (패스, 패쓰, 환경변수) 설정하는 법 (0) | 2022.01.15 |