작업을 실행할 때 데이터가 잘못된 열로 추출되거나 추출되지 않을 수 있습니다. 이는 틀린 XPath가 잘못된 위치의 데이터를 가져왔기 때문일 수 있습니다.
다음은 XPath가 잘못 적용된 예입니다.
우리가 필요한 데이터는 다음과 같습니다.
다음은 데이터 출력 경과입니다. 하이라이트 표시된 데이터는 잘못 추출된 데이터입니다.
어떻게 수정하나요?
데이터가 항상 해당 데이터 필드에 올바르게 추출되게 하려면 모든 페이지에서 알맞은 데이터를 찾아주는 새 XPath를 작성해야 합니다. 이렇게 하려면 XPath 작성 방법에 대한 튜토리얼을 확인해 보십시오. 또는 이름-값을 쌍으로 추출하는 경우 데이터를 주변 텍스트와 연결하는 방법을 확인해 보십시오.
새 XPath가 있으면 아래와 같은 방법에 따라 XPath를 업데이트합니다.
STEP 1. 수정해야 할 데이터 필드를 선택하고 XPath 커스텀을 선택합니다.
STEP 2. 새 XPath를 입력하고 설정을 적용합니다.
때에 따라서는 데이터 미리보기에서 데이터를 추출할 수 있지만 작업을 실행한 후에는 추출할 수 없습니다. 이때 아래 방법을 적용해 볼 수 있습니다.
크롤링하기 전에 웹 데이터가 완전히 로드하도록 페이지 스크롤 설정하기
이미지와 같이 로딩 시간이 더 걸리는 데이터일 경우 대기 시간 추가하기
프라이빗 콘텐츠인 경우 로그인이 실패했는지 또는 쿠키가 무효가 되었는지 확인하기