색인화에 대한 원격 제어 정보

웹 사이트가 변경될 때마다 검색 로봇이 Remote Control을 사용하여 인덱스를 실행하도록 요청하는 스크립트 또는 프로그램을 실행할 수 있습니다.

인덱싱을 위한 원격 제어 사용

원격 제어 인덱싱 요청은 일반적으로 서버에 있는 스크립트나 프로그램에서 옵니다.

로봇은 Index 메뉴에서 수동으로 시작한 것과 동일한 인덱싱 단계를 수행합니다. 원격 제어 요청을 제출하려면 필요한 암호 및 응답 문자열을 구성합니다.

원격 제어 요청을 수행하는 방법

원격 제어 요청을 수행하려면 데이터 센터의 위치를 기반으로 다음 형식 예제를 사용합니다.

데이터 센터 위치

런던

https://center.lon5.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

북미

https://center.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

싱가포르

https://center.sin2.atomz.com/search/cgiindex.tk? sp_a=sp99999999&sp_password=xxxxxx&sp_operation=op

또는

문자열 및 값

설명

sp_a= sp99999999

계정 번호입니다.

> > 계정 설정 아래에서 계정 번호를 찾을 수 있습니다.

sp_lines= N

실행 중인 인덱스 크롤의 상태를 확인할 수 있습니다.

N 은 양의 정수이거나 모두 입니다. 이 값이 숫자 값이면 해당 인덱스 로그 파일의 마지막 N 줄이 JSON 응답에 포함됩니다.

값이 모두 이면 전체 파일이 반환됩니다.

값이 0 이면 로그 정보가 반환되지 않습니다. 이 값은 실행 중인 인덱스 상태 쿼리의 기본값입니다.

sp_operation= op

실행할 다음 인덱싱 작업 중 하나를 지정할 수 있습니다.

  • full_index

    검색 로봇은 웹 사이트의 전체 인덱스를 실행합니다.

  • increment_index

    검색 로봇은 > > 구성 아래에 설정된 구성을 사용하여 증분 인덱스를 실행합니다.

  • vertical_index

    검색 로봇은 > > 구성 아래에 설정된 구성을 사용하여 수직 업데이트를 실행합니다.

    수직 업데이트 정보를 참조하십시오.

  • script_index

    검색 로봇은 인덱스 > > 구성 아래에 지정된 텍스트 파일을 사용하여 증분 인덱스를 실행합니다.

  • full_staged_index

    검색 로봇은 웹 사이트의 전체 스테이지 인덱스를 실행합니다.

  • increation_staged_index

    검색 로봇은 > > 구성 아래에 설정된 구성을 사용하여 증분 단계 인덱스를 실행합니다.

  • vertised_index

    검색 로봇은 > > 구성 아래에 설정된 구성을 사용하여 수직 단계 업데이트를 실행합니다.

참고: 수직 업데이트를 사용하려면 Adobe 계정 담당자 또는 Adobe 지원 담당자가 귀하의 계정에서 사용하도록 설정해야 할 수 있습니다.

수직 업데이트 정보를 참조하십시오.

검색 로봇이 저장된 컨텐츠를 사용하려고 시도하도록 하려면 위의 sp_operation 값에 _saved 값을 추가할 수 있습니다. 예를 들어 다음을 지정할 수 있습니다.

sp_operation=full_index_saved

또는

sp_operation=full_staged_index_saved

또는 위의 sp_operation 값에 _status 를 추가하여 현재 또는 가장 최근 작업에 대한 상태 보고서를 요청할 수 있습니다. 예를 들어 다음을 지정할 수 있습니다.

sp_operation=full_index_status

또는

sp_operation=full_staged_index_status

결과를 JSON 개체로 반환합니다. 연결된 로그 파일의 N 행을 포함하려면 sp_lines=N 을 포함합니다. N이 음수이면 마지막 N 라인이 포함됩니다.

sp_operation= pushlive

스테이지된 색인을 원격으로 실시간으로 푸시할 수 있습니다.

푸시 라이브 작업에 _saved 을 추가하려는 시도는 무시됩니다.

pushlive 작업을 실행하면 OK, Priority 또는 Error 응답 텍스트 문자열이 서버로 반환됩니다. 원격 제어 페이지에서 이러한 응답 문자열을 지정합니다.

색인에 대한 원격 제어 구성을 참조하십시오.

스테이지된 인덱스가 없을 때 라이브를 푸시하면 아무 것도 발생하지 않으며 OK 응답 문자열이 반환됩니다.

sp_password= xxxxxx

원격 제어 암호입니다.

검색은 적절한 HTTP 응답 형식으로 데이터를 반환합니다. 전체 응답은 HTTP 상태, HTTP 응답 헤더, 빈 행 및 응답 문자열로 구성됩니다.

예를 들어 다음과 같은 원격 제어 요청을 한다고 가정합니다.

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index

다음은 서버의 응답입니다.

Status: 200 OK 
Content-type: text/plain 
OK

또는 다음과 같은 원격 제어 상태 요청을 수행한다고 가정합니다.

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status

서버의 응답은 다음과 같을 수 있습니다.

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:58:58-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "status": 1, 
    "message": "ok" 
}

이 인덱스 작업과 연관된 로그 목록의 처음 10줄을 상태와 함께 가져오려면 다음 쿼리가 사용됩니다.

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=10

서버의 응답:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T10:59:30-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "offset": 672, 
    "lines": [ 
        "07/25 16:40:07 PST   ======== Starting manual crawl of account sp99999999. ========", 
        "07/25 16:40:08 PST   Loading existing data", 
        "07/25 16:40:08 PST   Downloading entrypoint https://www.atomz.com/", 
        "07/25 16:40:08 PST   Robots.txt exclude mask: https://www.atomz.com/snap", 
        "07/25 16:40:08 PST   Exclude mask: regexp ^https://www.atomz.com/$", 
        "07/25 16:40:08 PST   Include mask: https://www.atomz.com/", 
        "07/25 16:40:08 PST   Downloading https://www.atomz.com/style.css", 
        "07/25 16:40:09 PST   Ignoring https://www.atomz.com/style.css, document type 'text/css'.", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/privacy.html", 
        "07/25 16:40:09 PST   Downloading https://www.atomz.com/terms.html" 
    ], 
    "status": 1, 
    "message": "ok" 
}

offset 값을 확인합니다. 이 값은 로그 파일에서 읽기가 중단된 파일 오프셋 위치를 식별합니다. 파일에서 next 열 줄을 읽으려면 서버에 전송된 요청에 &sp_offset=672를 포함시켜야 합니다.

sp_offset을 사용하면 로그 파일을 통해 효과적으로 페이지를 볼 수 있습니다.

상태와 함께 로그의 마지막 10줄을 가져오려면 수를 음수로 지정합니다. 예를 들어 다음과 같이 -10 값을 사용하여 sp_lines=을 지정합니다.

https://center.atomz.com/search/cgiindex.tk?sp_a=sp99999999&sp_password=my-password&sp_operation=full_index_status&sp_lines=-10

서버의 응답:

Status: 200 OK 
Content-type: application/json; charset=utf-8 
{ 
    "current_time": "2017-08-27T11:01:14-0700", 
    "start_time": "2017-07-25T16:40:07-0800", 
    "end_time": "2017-07-25T16:40:20-0800", 
    "elapsed_seconds": 13, 
    "elapsed_seconds_fmt": "13s", 
    "state": "finished", 
    "docs_indexed": 3, 
    "depth": 0, 
    "errors": 0, 
    "lines": [ 
        "07/25 16:40:20 PST   End Time: 07/25/2017 16:40:20 PST", 
        "07/25 16:40:20 PST   Elapsed Time: 13 seconds", 
        "07/25 16:40:20 PST   Pages Crawled: 3 pages", 
        "07/25 16:40:20 PST   Pages Indexed: 3 pages", 
        "07/25 16:40:20 PST   Words/Bytes Indexed: 2373 words/ 20618 bytes", 
        "07/25 16:40:20 PST   Errors: 0", 
        "07/25 16:40:20 PST   *** Index Summary ***", 
        "07/25 16:40:20 PST   Total Pages: 3", 
        "07/25 16:40:20 PST   --------------------------------------------------------------------", 
        "07/25 16:40:20 PST   ======== Finish manual crawl of account sp99999999: Done. ========" 
    ], 
    "status": 1, 
    "message": "ok" 
}

이 작업이 파일 끝에 완료되었으며 읽을 줄이 더 이상 없으므로 여기에 반환되는 offset 값이 없습니다.

인덱싱을 위한 원격 제어 구성

웹 사이트가 변경될 때마다 Remote Control을 사용하여 서버에서 스크립트나 프로그램을 실행하여 검색 로봇이 인덱스를 실행하도록 요청할 수 있습니다.

색인화를 위해 원격 컨트롤을 구성하려면

  1. 제품 메뉴에서 Index > Remote Control​을 클릭합니다.

  2. Remote Control 페이지에서 각 구성 필드 옵션을 설정하여 서버에서 색인 요청을 자동으로 제출하여 웹 사이트를 색인화할 수 있습니다.

    옵션

    설명

    원격 제어 암호

    원격 제어 암호를 지정합니다.

    암호는 대/소문자를 구분하며 6자 이상이어야 하며 하나 이상의 문자를 포함해야 합니다. 하나 이상의 숫자를 포함하는 것이 좋습니다.

    사이트 검색/머천다이징 로그인 암호를 사용하지 마십시오.

    암호는 각 원격 제어 요청에 사용됩니다.

    확인 응답 문자열

    요청한 색인 작업이 성공적으로 시작되는 경우 OK 응답 텍스트 문자열을 지정할 수 있습니다. 이러한 경우 검색 로봇은 서버에 OK 응답 문자열을 반환합니다.

    우선 순위 응답 문자열

    원격 요청을 수행할 때 다른 인덱싱 작업이 진행 중인 경우 검색 로봇은 요청된 인덱스를 수행할 수 없습니다. 이 경우 Priority 응답 텍스트 문자열이 서버로 반환됩니다.

    오류 응답 문자열

    오류 응답 텍스트 문자열을 지정할 수 있습니다. 암호가 올바르지 않거나 다른 오류가 발생한 경우 이러한 경우 검색 로봇은 오류 응답 문자열을 다시 서버로 반환합니다.

  3. 클릭 Save Changes.

이 페이지에서는