그룹추출은 무엇이고, 어떻게 사용할 수 있나요? | FAQ 리스틀리 그룹추출 은 수백, 수천 개의 웹 페이지에서 데이터를 추출해 하나의 엑셀 파일로 변환해주는 기능입니다. 시간이 오래 걸리는 반복된 작업도 리스틀리에서 개발한 알고리즘을 이용해 단 몇 초만에 완료할 수 있어요. 대량의 웹 데이터를 엑셀, 구글시트, 혹은 API로 간편하게 수집하실 수 있습니다. 상세 페이지에서 이커머스 제품 정보, 영업에 사용될 연락처와 이메일 주소, 부동산 매물 혹은 투자자 정보 등을 수집하고자 하신다면, 그룹추출 기능으로 한 번에 해결해보세요. 현재 유료 플랜 구독 시 사용 가능 하며, 리스틀리의 많은 사용자분들께서 만족하며 사용하고 계신 대표 기능 중 하나입니다.
한 페이지에서 스크롤과 페이지네이션이 모두 필요한 경우에도 데이터 추출이 가능한가요? | FAQ 네, 가능합니다. 한 페이지 내에서 스크롤 다운을 한 후, 여러 페이지네이션 페이지에 나누어 저장되어 있는 데이터를 추출하실 수 있습니다. 이 경우, 설정 페이지에서 자동 스크롤 기능을 설정해주고 그룹 추출 로 여러 페이지 데이터를 한 번에 모아 추출하시는 형태라고 볼 수 있어요. 다만, 추출 실행 시간이 10분을 넘어가지 않도록 자동 스크롤 설정값을 조정하셔야 추출 실패 없이 모든 데이터를 추출하실 수 있습니다. 한 가지 예로, 특정 호텔 예약 웹 사이트에 접속해 리스틀리 확장프로그램을 클릭하면 8개의 호텔 정보만 수집됩니다. 해당 웹 페이지에서 데이터가 로딩되는 데에 시간이 걸리기도 하고, 페이지 하단까지 스크롤 다운을 해야 모든 데이터가 나타나는 구조이기 때문인데요. 자동 스크롤 기능을 5회 정도로 ...
목록 페이지주소, url 추출이 안 됩니다 | FAQ 그룹 추출을 위해서는 목록 페이지의 URL 주소가 필요합니다. 그러나 가끔씩, 리스틀리로 목록 페이지를 추출해도 URL 주소가 얻어지지 않는 경우가 발생할 수 있습니다. 이는 해당 웹사이트의 개발팀이 의도적으로 URL 주소 추출을 불가능하도록 숨겨두었기 때문입니다. 그러나 걱정하실 필요는 없어요! 최근에 출시된 리스틀리의 새로운 기능인 "parts"를 활용하여 문제를 해결할 수 있기 때문입니다. 이 방법은 일반적인 추출 방법과는 조금 다를 수 있지만, 차근차근 따라하시면 쉽게 익힐 수 있습니다. 자, 우선 상세 페이지 하나씩을 열어서 확인해보시길 권해드리는데요. 예제로는 해당 웹사이트를 선택했습니다. 그리고 상세페이지 몇 개를 예시로 들어가보았습니다. 하나하나 확인해보니, 아래와 같은 ...
매일 생긴 로그를 한 번에 추출하고 싶어요. | FAQ 로그는 동일한 웹 페이지를 여러 번 (2회 이상) 추출 했을 경우 생성됩니다. 특히, 스케줄러를 이용해 데이터를 수집한 여러 URL의 데이터를 일괄적으로 다운로드받고자 하실 경우, 로그 그룹 추출 기능을 사용해보세요. URL을 일일이 클릭해 다운로드 하지 않아도 과거 데이터 히스토리를 한 번에 모아 엑셀 시트 한 장으로 정리 할 수 있습니다. 매 시간, 매일 수집했던 정보들을 한 번에 다운로드할 때 유용한 기능입니다.
리스틀리 데이터 추출 단위 : 기본 URL vs 고급 URL | FAQ URL은 리스틀리의 데이터 추출 단위입니다. 사용처 및 차감 방식에 따라 '기본 URL' 과 '고급 URL' 로 구분하고 있으며, 그 차이는 다음과 같습니다. 기본 URL (URLs for Basic features) 사용처 : 확장 프로그램의 베이직 탭을 통한 단일 페이지 추출에 사용됩니다. 차감 방식 : 페이지를 추출할 때마다 기본 URL 1개가 차감됩니다. 이용 조건 : Light Plan 및 Business Plan과 같은 상위 플랜 구독 시 무제한으로 사용할 수 있습니다. Free Plan 사용자는 사용 후 24시간이 지나면 최대 10개까지 자동으로 URL이 재충전됩니다. 기본 URL은 별도로 구매할 수 없습니다. 고급 URL (URLs for Advan ...
쿠키 동의 팝업메시지가 나타나는데 추출할 수 있나요? | FAQ 웹데이터를 추출하려고 할 때 특정 웹사이트들은 쿠키 수집에 동의하는지 묻는 팝업창을 띄우는 경우가 있습니다. 이 경우에도 리스틀리로 웹데이터 수집은 가능합니다. 쿠키 수집을 묻는 팝업창은 무시하고, 일반적인 그룹 추출 기능을 이용해서 웹데이터를 수집하면 되거든요. 위의 사례처럼 쿠키 설정에 동의를 묻는 팝업창이 나타난다고 해도 걱정하실 것 없습니다. 자동클릭을 설정해서, 해당 쿠키 팝업메시지를 끄지 않으셔도 되고요. 일반적으로 팝업레이어들은 (쿠키, 프로모션 등) 자동클릭을 통해 따로 리스틀리가 버튼을 눌러주지 않아도, 뒤편에 정보가 전부 로딩되어 잘 나타납니다. 리스틀리가 HTML 을 불러와서 수집해주는 방식이기 때문인데요. "팝업 버튼" 을 누르지 않아도 이미 정보가 HTML sour ...
갑자기 데이터 추출 속도가 느려졌습니다. (추출 중 에러) | FAQ 문제 없이 추출이 잘 되고 있었는 데, 갑자기 추출 속도가 느려질 때가 있습니다. 이 경우 다양한 이유가 존재할 수 있으나 가장 대표적인 이유로는 5가지가 있습니다. 그룹 추출속도를 낮춘 것이 아닌지, 한번에 너무 많은 양의 데이터를 수집하는 것은 아닌지, (엔터프라이즈 사용자가 아닐 경우) 사용자가 한꺼번에 몰린 시간에 추출 중인 것은 아닌지, 프록시서버를 설정했는지, 추출하려는 웹사이트의 응답이 느린지 여부를 확인해보시길 권합니다. 그룹 추출속도가 느리게 설정되어 있을 때 느리게 추출할 수록, 타겟 웹사이트는 '사람이 하나하나 클릭해서 접속하는 것'으로 인지할 확률이 높아집니다. 그러나 추출속도가 너무 과하게 느리다면 간단하게 다시 속도를 조정해주면 됩니다. 먼저 데이터보드 ...
아마존 셀러를 추출하고 싶습니다. 두 번 그룹추출을 할 수 있나요? | FAQ 페이지 전환이 두 번 이상 일어날 때 리스틀리로 해결이 가능한지 걱정이 되실 수 있어요. 결론부터 말씀드리자면 페이지 전환이 많다고 해도 '여러 번의 그룹추출'로 해결이 가능합니다. 만약 아마존에 입점한 셀러들의 정보를 추출하고 싶다면, 그룹추출을 두 번 하시면 됩니다. 이미 다 알고 있는, 그룹추출 방법을 반복하는 것이라 추출 순서만 지켜주시면 어렵지 않습니다. 추출을 원하는 목록페이지 접속 먼저 특정 상품군/카테고리군의 셀러를 찾아야하니 아마존 창에 검색어를 입력해줍니다. 예시로 저는 door stopper를 검색했습니다. 그랬더니 아래처럼 door stopper 상세페이지들이 담긴, 목록페이지가 나타납니다. 위의 데이터를 추출해줍니다. Parts를 통해서 목록페이지 48개를 아래 ...