아마존 셀러를 추출하고 싶습니다. 두 번 그룹추출을 할 수 있나요?
페이지 전환이 두 번 이상 일어날 때 리스틀리로 해결이 가능한지 걱정이 되실 수 있어요.
결론부터 말씀드리자면 페이지 전환이 많다고 해도 '여러 번의 그룹추출'로 해결이 가능합니다.
만약 아마존에 입점한 셀러들의 정보를 추출하고 싶다면, 그룹추출을 두 번 하시면 됩니다.
이미 다 알고 있는, 그룹추출 방법을 반복하는 것이라 추출 순서만 지켜주시면 어렵지 않습니다.
- 추출을 원하는 목록페이지 접속
먼저 특정 상품군/카테고리군의 셀러를 찾아야하니 아마존 창에 검색어를 입력해줍니다.
예시로 저는 door stopper를 검색했습니다.
그랬더니 아래처럼 door stopper 상세페이지들이 담긴, 목록페이지가 나타납니다.
위의 데이터를 추출해줍니다. Parts를 통해서 목록페이지 48개를 아래처럼 수집했습니다.
이렇게 모은 48개의 링크들은 나중에 그룹추출을 할 때 활용하게 됩니다.
2. 이제는 셀러 링크 주소를 수집할 때입니다. 궁극적으로 우리가 필요한 건, 셀러의 정보이니까요.
목록페이지 중에서 하나의 상세페이지를 클릭해서 접속해줍니다.
그 뒤, 셀러의 정보가 담긴 '링크' 부분만 parts로 추출합니다.
이때 제대로 '링크'만을 뽑기 위해서 Extract - Hyperlink로 설정해준 뒤 RUN LISTLY 버튼을 눌러주세요.
3. 이제는 셀러들의 정보를 갖고 있는 '링크'들을 그룹추출할 시간입니다.
그룹 추가 버튼을 누른 뒤, (1)에서 얻어낸 상품 링크들을 활용해 그룹 추출을 시작합니다.
링크들은 위와 같이 나타납니다.
지금 거치는 과정들은, 목록페이지에서 얻은 url주소들을 활용해서 셀러정보가 담긴 링크를 뽑는 첫번째 그룹추출 과정입니다.
4. (3)의 그룹추출이 전부 완료되었나요?
그렇다면 셀러 링크, 즉 url주소들만이 정리되어 뽑혔을 겁니다.
엑셀이나 구글 스프레드시트로 다운로드 받아보면 아래와 같은 파일을 보실 수 있을텐데요. 거의 다 끝났습니다.
이렇게 다운로드된 링크들을 갖고 다시 한번 그룹추출을 해서, 실제로 원하는 셀러 정보들을 받아내면 되니까요.
5. 이제는 진짜 셀러 정보란에 들어가서 셀러의 이름과 기타 정보들을 수집할 차례입니다.
수집했던 셀러 정보 link 들 중 하나를 클릭하세요.
Parts를 활용해서, 제가 원하는 셀러명 및 아래의 셀러 정보까지 추출 영역을 잡아주었습니다.
그리고 RUN LISTLY를 눌렀습니다.
6. 곧바로 열리는 결과페이지 상단의 [그룹추가] 버튼을 눌러주세요.
(4)에서 얻은 하이퍼링크를 넣어 마지막으로 그룹추출을 할 시간입니다.
7. 모든 URL 링크를 다 붙여넣고 그룹추출을 시도해주세요.
이때 차단을 피하기 위해 프록시서버를 세팅하는 것을 추천드립니다.
데이터 정렬은 '가로 정렬'을 권해드립니다.
그러면 위처럼 셀러들의 정보만 쏙쏙 정리된 엑셀 파일을 받을 수 있습니다.