크롤링으로 이것저것 알아보다가 우연히 발견하게 되었다
대부분 크롤링을 알아보는 사람들은 코딩이 하고싶다가 아니라
크롤링으로 데이터를 얻고싶다 라는 사람들이 많다
데이터 얻고 싶은데 코드를 일일히 짜야한다니 얼마나 비효율인지..
클릭으로 쫙 긁어올수 있는 프로그램이 있어서 기록해둔다
몇개 해봤는데 실제로 코드 짜서 하는것처럼 예쁘게는 안되지만, 되기는 된다.
리스틀리 소개 및 설치
리스틀리 listly https://www.listly.io/ko
리스틀리 | 단숨에 웹데이터 추출!
무료 크롬확장프로그램으로 모든 웹사이트에서 데이터 수집하세요. 단숨에 웹 데이터를 엑셀 파일로 변환합니다. 깨끗하게 정리된 데이터로 여러분의 비즈니스를 성장시켜 드립니다.
www.listly.io
설치는 엄청 간단하다.
준비물 : 크롬, 엑셀
1. 웹사이트 들어가기 https://www.listly.io/ko
리스틀리 | 단숨에 웹데이터 추출!
무료 크롬확장프로그램으로 모든 웹사이트에서 데이터 수집하세요. 단숨에 웹 데이터를 엑셀 파일로 변환합니다. 깨끗하게 정리된 데이터로 여러분의 비즈니스를 성장시켜 드립니다.
www.listly.io
2. 크롬 확장 프로그램 추가 누르기
(악몽 같은 데이터수집 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ)
3. 크롬 웹 스토어에서 설치 (나는 이미 설치되어 있어서 설치가아닌 삭제로 바뀌어있다. 설치 하면 됨)
4. 크롬 확장프로그램에서 리스틀리 확인
리스틀리 사용하는 방법. 리스틀리로 크롤링하기
1. 크롤링할 사이트에 들어간다
나는 네이버 뷰 들어감. 키워드로 크롤링 키워드 검색하면 검색결과가 나온다.
2. 리스틀리 클릭
클릭하고 속성을 넣어준다
- 표처럼 생겼으면 표처럼 생겼습니까 on 해 줌
- 전체 로 하면 페이지를 쫙 긁어온다
- 부분 으로 하면 일부 항목만 긁어온다. 아래에서 더욱 자세히.
3. 리스틀리 (전체) 선택시
로딩 페이지 잠깐 나오고 리스틀리 결과 페이지가 나온다
긁어온 결과값들을 보여주고 다 가져올건지 일부만 가져올건지 선택한다
엑셀로 내려받기 하면 엑셀로 결과값을 볼 수 있다.
4. 리스틀리 (부분) 선택시
- 아래처럼 화면 중 어느부분을 가져올지 선택하게 한다.
크롤링할때 html 구조 살짝 알려줬는데 html 구조 그대로 나오는듯하다.
- 가져올 부분 선택후 런 리스틀리 선택한다.
뷰본문 전체를 선택하면 선택 영역을 클릭, 활성화된 런 리스틀리를 누르면 된다
이다음부터는 동일함. 이번에도 엑셀 저장 누름
5. 결과값 엑셀로 보기
- 네이버 뷰는 세로스크롤인데 리스틀리로 가져온 엑셀 결과값은 가로스크롤이다.
- 빠르게 크롤링해서 분석 하려면 리스틀리가 최고의 선택일듯.
아래는 이번 리스틀리 크롤링 엑셀결과 예시
6. 결론
코딩 베이스 없는데 당장 크롤링해서 뭔가 만들어야 한다면 리스틀리가 최고.
단 결과값이 다소 지저분할수 있으므로
코드 날려서 크롤링할 실력이 된다면 그게 젤 깔끔함
자기의 상황에 맞는걸로 추천. 리스틀리 마음에든다.
리스틀리를 더 잘 쓰고싶어진다 ~
'파이썬 공부하기' 카테고리의 다른 글
트위터 개발자계정 발급받기 (트위터 api) (0) | 2022.01.19 |
---|---|
파싱이란? 파이썬으로 뷰티풀수프 beautiful soup 로 파싱하기 (0) | 2022.01.18 |
파이썬 requests 설치, 사용법 (0) | 2022.01.17 |
vscode 에서 파이썬 터미널 command prompt 로 설정 및 이유 (0) | 2022.01.16 |
window10 파이썬 경로 path (패스, 패쓰, 환경변수) 설정하는 법 (0) | 2022.01.15 |