무한 스크롤 되는 페이지의 웹 크롤링
무한 스크롤 (infinite scroll) 또는 자동 스크롤 (auto scroll)은 웹 사이트에서 보여지는 디지털 콘텐츠를 여러 페이지로 나누어 보여주는 방법인데요, 인스타그램, 페이스북과 같은 소셜 네트워크 서비스에서 흔히 볼 수 있습니다. 이렇게 웹 페이지 하단으로 스크롤을 내려야만 새로운 글이나 이미지를 볼 수 있는 경우에도 간단히 데이터를 추출하는 방법, 리스틀리가 알려드릴게요!
한 눈에 살펴보기
- 자동 스크롤 웹 사이트 방문
- 리스틀리 전체 (LISTLY WHOLE) 혹은 리스틀리 (LISTLY PART) 부분 선택
- 데이터보드에서 설정 아이콘 클릭
- 자동 스크롤 반복 횟수 변경
- 재추출 버튼을 클릭해 데이터 추출 완료
오늘은 휴대폰 케이스로 유명한 케이스티파이 (Casetify) 웹 사이트를 한번 살펴보겠습니다.
하단의 이미지처럼, 케이스티파이는 웹 페이지 하단으로 스크롤을 내릴 때마다 새로운 제품 정보가 나타나는 자동 스크롤 웹 사이트입니다.
한번 리스틀리 부분 (LISTLY PART) 버튼을 클릭해보면 휴대폰 케이스 정보가 일부 추출된 것을 확인하실 수 있어요.
현재 보여지는 휴대폰 케이스뿐만 아니라 모든 케이스 정보를 추출하고 싶을 경우, 리스틀리 데이터보드에서 설정 (Setting) 아이콘을 선택해주세요.
설정 페이지를 아래로 조금 내려보면 더 많은 데이터 로딩을 위한 자동스크롤 (AUTO SCROLL TO LOAD MORE DATA) 영역이 나타날거예요. 반복할 횟수 (Repeat N times)를 5회로 임의로 설정한 뒤, 데이터보드에서 재추출 (Refresh) 버튼을 클릭해볼게요.
이전보다 더 많은 케이스 정보가 추출되지 않았나요? 아직도 추출한 휴대폰 케이스 정보 남아 있다면, 자동스크롤 반복 횟수를 늘려주세요! 자, 그럼 반복할 횟수를 20번으로 늘려볼까요?
몇 번의 클릭만으로 자동 스크롤 웹 페이지에서도 데이터를 추출할 수 있겠죠? 엑셀 (EXCEL) 버튼을 클릭해 추출한 데이터를 엑셀 파일로 정리해보세요. 리스틀리와 함께 간편하게 데이터를 수집하고 정리할 수 있답니다.
더 이상 어렵게 데이터 수집을 하지 마세요.
리스틀리를 사용하면 코딩을 몰라도 파이썬을 몰라도 대부분의 웹 페이지 데이터 수집을 간편하게 하실 수 있습니다. 리스틀리는 크롬/엣지/웨일 브라우저의 확장 프로그램을 통해 누구나 설치가 가능하며, 1Page -> Excel 변환은 무제한 무료로 서비스되고 있어 간단한 웹 페이지 크롤링은 무료 버젼만으로도 문제 없답니다.
전 세계 5만여 곳에서 다양한 업무에 사용중인 리스틀리를 지금 바로 설치하고 데이터 수집의 고통에서 벗어나보세요.