메인 콘텐츠로 건너뛰기

웹 사이트에서 스크랩한 파일 다운받기

최소 1년 전에 업데이트됨

최신 버전은 직접 로컬 폴더로 파일과 사진을 다운로드하는 기능을 도입했습니다. 현재 jpg, png, gif, doc, pdf, ppt, txt, xls, zip 형식의 문서 다운로드가 지원됩니다.

이번 튜토리얼에서는 Octoparse로 파일과 이미지를 다운로드하는 방법을 알려드리겠습니다. 파일 다운로드는 현재 로컬 실행에서만 사용할 수 있습니다.

이번 튜토리얼에서 사용할 파일 샘플 URL: https://www.cclcomponents.com/fronius-gen24-plus-primo-3kw-hybrid-inverter

URL.png

다운로드한 이미지 설정의 샘플 URL은 다음과 같습니다. https://www.rappi.com.mx/tiendas/tipo/market

2.png

1. 파일 다운로드

  • 다운로드 버튼 중 하나 클릭 - 다운로드할 문서를 클릭하면 클릭한 요소가 녹색으로 변하고 유사한 요소가 빨간색으로 바뀝니다.

__.png
  • [팁]에서 [모두 선택]을 누릅니다. 식별된 비슷한 부분은 모두 녹색으로 변합니다.

SELECT_ALL.png
  • 문서 URL 추출 및 연결된 파일 다운로드 - 링크를 추출하고 로컬 폴더에 파일을 다운로드 할 때

download.png

데이터 필드는 아래와 같이 표시되며 ...더 보기 아이콘을 클릭하여 데이터 필드를 수정합니다.

modified.png

참고: 필드 이름에 폴더 아이콘이 있는 필드를 삭제하면 전체 다운로드 설정이 취소됩니다.

mceclip0.png
  • 다운로드한 파일 이름 명명: 다운로드된 파일의 이름을 명명하는 방법은 4가지가 있습니다. 팁에서 옵션을 확인할 수 있습니다.

  1. MD5 해시 값: MD5 값을 사용하여 파일 이름 지정

  2. 원본 파일 이름: 원본 파일 디폴트 이름

  3. 다운로드 완료 시간: 전체 다운로드 시간을 사용하여 파일 이름 지정

  4. 데이터 필드 값: 데이터 필드 값을 사용하여 파일의 이름을 지정

MD5.png

파일 이름이 폴더에 이미 존재하는 경우 다음 세 가지 방법이 있습니다.

mceclip0.png
  1. 새 파일 건너뛰기: 다운로드한 파일 건너뛰기

  2. 기존 파일 대체하기: 기존 파일을 새로 다운로드한 파일로 바꾸기

  3. 새 파일 이름 바꾸기: 새 파일 이름 끝에 (1)을 붙이는 등 방식으로 이름 바꾸기


2. 이미지 다운로드

이미지를 로컬 폴더로 다운로드하는것은 파일 다운로드와 비슷한 방식입니다.

  • 하나의 이미지를 클릭합니다.

IMAGE.png
  • Tips에서 Select All - Select all similar elements를 클릭합니다.

  • 이미지 링크를 추출하거나 이미지를 로컬 폴더로 다운로드하려면 이미지 파일을 클릭합니다.

참고: Octoparse에서는 "https://"가 포함된 완전한 URL만 다운로드할 수 있습니다. 스크랩된 URL 값이 전체 다운로드 링크의 일부일 경우 접두사 추가 또는 데이터 정제 기능을 사용하여 유효한 다운로드 링크를 가져올 수 있습니다.

file_downlad.png

3. 다운로드 설정

3.1 파일 다운로드 설정

  • 데이터 필드 앞의 화살표 아이콘을 클릭합니다.

__.png
  • 다운로드한 파일의 이름을 변경하거나 여러 URL을 분리한 후 URL을 입력하여 다운로드 파일을 건너뛸 수 있습니다.

REMOVE_DUPLICATES.png

3.2 다운로드 위치 설정

  • 작업 설정 화면의 오른쪽 상단 모서리에 있는 작업 설정 아이콘 클릭합니다.

  • 브라우저 버튼 - 다운로드한 파일 및 이미지를 저장할 로컬 폴더 선택합니다.

  • 로컬 실행이 시작될 때 설정에 대해 하나의 모드를 선택합니다.

  • [저장] - [모든 수정 사항 저장]을 클릭합니다.

답변이 도움되었나요?