한 페이지에서 스크롤과 페이지네이션이 모두 필요한 경우에도 데이터 추출이 가능한가요?
네, 가능합니다. 한 페이지 내에서 스크롤 다운을 한 후, 여러 페이지네이션 페이지에 나누어 저장되어 있는 데이터를 추출하실 수 있습니다. 이 경우, 설정 페이지에서 자동 스크롤 기능을 설정해주고 그룹 추출로 여러 페이지 데이터를 한 번에 모아 추출하시는 형태라고 볼 수 있어요. 다만, 추출 실행 시간이 10분을 넘어가지 않도록 자동 스크롤 설정값을 조정하셔야 추출 실패 없이 모든 데이터를 추출하실 수 있습니다.
한 가지 예로, 특정 호텔 예약 웹 사이트에 접속해 리스틀리 확장프로그램을 클릭하면 8개의 호텔 정보만 수집됩니다. 해당 웹 페이지에서 데이터가 로딩되는 데에 시간이 걸리기도 하고, 페이지 하단까지 스크롤 다운을 해야 모든 데이터가 나타나는 구조이기 때문인데요. 자동 스크롤 기능을 5회 정도로 설정해주었더니, 해당 페이지에 있는 92개의 호텔 목록 정보가 모두 수집되었습니다.
추가로 웹 사이트 하단으로 이동해보시면, 페이지네이션에서 흔히 볼 수 있는 "다음 (Next)" 버튼을 확인하실 수 있어요. 이 때 그룹 추출 기능을 이용하시면, 여러 페이지에 나누어 저장된 정보들을 모두 수집하실 수 있습니다. 그룹 추출 사용법이 궁금하시다면 리스틀리 유튜브 튜토리얼을 확인해주세요.