로그 처리를 위한 웹 특정 설정

로그 처리 데이터 세트에 정의된 웹 특정 설정에 대한 정보에는 사이트의 Adobe 프로필으로 전달되는 파일이 포함됩니다.

이러한 설정에 의해 정의된 필터링은 로그 항목이 디코더를 종료하고 변형이 적용되지만 Log Entry Condition에 의해 평가되기 전에 발생합니다.

HTTP 상태 필터링

데이터 세트에서 sc 상태 코드가 400 이상인 로그 항목을 제거하도록 Site의 구현을 구성할 수 있습니다. 성공한 요청에는 상태 코드가 400보다 작습니다. 기본 구현에는 HTTP 상태 필터링이 구성된 Log Processing Dataset Include 파일이 포함되어 있습니다.

HTTP 상태 필터링에 대한 구성 설정을 편집하려면

  1. 데이터 세트 프로필 내에서 Profile Manager을 열고 Dataset\Log Processing\Traffic\HTTP Status Filter.cfg 파일을 엽니다.

    노트

    Site의 구현을 사용자 정의한 경우 이러한 구성 설정이 있는 파일은 설명된 위치와 다를 수 있습니다.

  2. 원하는 대로 파일의 매개 변수 값을 검토하거나 편집합니다. 다음 예제를 안내서로 사용합니다.

    Range 조건에 대한 자세한 내용은 조건을 참조하십시오.

  3. 창 맨 위에 있는 (modified)​을 마우스 오른쪽 단추로 클릭하고 Save​를 클릭하여 HTTP Status Filter.cfg 파일을 저장합니다.

  4. 로컬에서 변경한 내용을 적용하려면 Profile Manager에서 User 열의 파일 확인 표시를 마우스 오른쪽 단추로 클릭한 다음 Save to > <profile name>​를 클릭합니다. 여기서 프로필 이름은 데이터 세트 프로필의 이름이거나 데이터 세트 포함 파일이 속한 상속된 프로필입니다.

    노트

    이러한 프로파일에 대한 업데이트를 설치할 때 변경 사항을 덮어쓰여지기 때문에 수정된 구성 파일을 Adobe에서 제공하는 내부 프로파일에 저장하지 마십시오.

로봇 필터링

Site의 구현을 구성하여 조회 파일을 사용하여 알려진 로봇에 의해 생성된 로그 항목, 테스트 스크립트 및 데이터 세트에서 내부 사용자에 대한 IP 주소를 제거할 수 있습니다. 기본 구현에는 로봇 필터링이 구성된 Log Processing Dataset Include 파일이 포함되어 있습니다.

로봇 필터링에 대한 구성 설정을 편집하려면

  1. 데이터 세트 프로필 내에서 Profile Manager을 열고 Dataset\Log Processing\Traffic\Robot Filter.cfg 파일을 엽니다.

    노트

    Site의 구현을 사용자 정의한 경우 이러한 구성 설정이 있는 파일은 설명된 위치와 다를 수 있습니다.

  2. 다음 예제와 정보를 안내선으로 사용하여 파일의 매개 변수를 검토하거나 편집합니다.

    파일에는 다음 3개의 매개 변수로 정의된 NotRobotCondition이 포함되어 있습니다.

    • 대/소문자를 구분하지 않는 로봇 필터링: True 또는 false. true이면 문자 대/소문자(위쪽/아래쪽)가 로봇 필터링에서 고려되지 않습니다.
    • 로봇 조회 파일, 기준선: 알려진 로봇이며 데이터 세트에서 필터링할 브라우저 사용자 에이전트 목록이 포함된 텍스트 파일의 경로와 파일 이름입니다. Adobe은 기준선 로봇 조회 파일을 제공합니다. 경로를 지정하지 않으면 데이터 워크벤치 서버는 데이터 워크벤치 서버 설치 디렉토리 내의 조회 디렉토리에서 이 파일을 찾습니다.
    • 로봇 조회 파일, 확장: 구현에 따른 로봇을 정의하는 브라우저 사용자 에이전트 또는 IP 주소 목록이 포함된 선택적 텍스트 파일의 경로와 파일 이름입니다. 이 목록에는 내부 모니터링 로봇, 테스트 스크립트 및 데이터 세트에서 필터링해야 하는 내부 사용자에 대한 IP 주소가 포함될 수 있습니다. 경로를 지정하지 않으면 데이터 워크벤치 서버는 데이터 워크벤치 서버 설치 디렉토리 내의 조회 디렉토리에서 이 파일을 찾습니다.

    로그 항목의 브라우저 사용자 에이전트가 조회 파일에 나열되지 않은 경우 로그 항목은 실제 방문자가 생성한 것으로 간주되며 데이터 세트에서 필터링되지 않습니다.

    노트

    로봇 조회 파일에서 일치하면 하위 문자열을 사용하여 c-ip 및 cs(user-agent) 로그 필드와 비교합니다. 검색 문자열이 "$"로 시작하는 경우 테스트할 문자열의 앞과 일치해야 하며, "$"로 끝나는 경우 검색 문자열은 테스트 중인 문자열의 끝과 일치해야 합니다. 검색 문자열이 모두 "$"로 시작하고 끝나는 경우 문자열이 정확히 일치해야 로그 항목을 필터링할 수 있습니다. 예를 들어 클래스 C 블록의 모든 IP 주소를 테스트하려면 $231.78.123 등의 문자열을 사용하여 문자열 맨 앞에 일치를 강제 적용합니다. 이것은 231.78.123.0~231.78.123.255 주소와 일치합니다.

  3. 창 위쪽에 있는 (modified)​을 마우스 오른쪽 단추로 클릭하고 Save​을 클릭하여 파일을 저장합니다.

  4. 로컬에서 변경한 내용을 적용하려면 Profile Manager에서 User 열의 파일 확인 표시를 마우스 오른쪽 단추로 클릭한 다음 Save to > <profile name>​를 클릭합니다. 여기서 프로필 이름은 데이터 세트 프로필의 이름이거나 데이터 세트 포함 파일이 속한 상속된 프로필입니다.

    이러한 프로파일에 대한 업데이트를 설치할 때 변경 사항을 덮어쓰여지기 때문에 수정된 구성 파일을 Adobe에서 제공하는 내부 프로파일에 저장하지 마십시오.

    노트

    데이터세트를 구성하는 데 사용되는 기본 로그 항목이 변경되지 않는 것이 중요한 경우(데이터 세트 및 해당 크기를 구성하고 업데이트하는 데 사용된 변형이 변경되더라도), 로봇 조회 파일, 기준선 및 로봇 조회 파일, 확장(Robot Lookup File)을 제어해야 합니다. 이러한 파일에 버전 번호를 배치하면 기본 로봇 조회 파일 업데이트가 이러한 파일의 항목을 추가하거나 삭제하여 이전에 구성한 보고 데이터 세트를 의도치 않게 변경하지 않습니다.

이 페이지에서는