색인화
Adobe Experience Manager는 웹 사이트의 특정 섹션에 게시된 모든 페이지의 색인을 유지하는 방법을 제공합니다. 이는 일반적으로 목록, 피드를 작성하고 페이지 또는 콘텐츠 조각에 대한 검색 및 필터링 사용 사례를 활성화하는 데 사용됩니다.
AEM은 이 색인을 스프레드시트에 보관하고 JSON을 사용하여 이 색인에 대한 액세스를 제공합니다. 문서를 참조하십시오. 스프레드시트 및 JSON 추가 정보.
초기 쿼리 색인 설정
이 섹션에서는 백엔드의 모든 문서를 인덱싱하는 쿼리 인덱스를 루트 폴더에 생성합니다.
- 설정 후
fstab.yaml
SharePoint 사이트 또는 Google 드라이브를 가리키는 마운트 지점을 사용하여 루트 폴더로 이동합니다. - 백엔드에 따라 다음 이름의 통합 문서를 만드십시오.
query-index.xlsx
SharePoint 또는 라는 스프레드시트용query-index
Google 드라이브용. - 해당 스프레드시트 또는 통합 문서에서
raw_index
.
인덱스에 추가할 속성 설정
- 내
query-index
문서, 머리글 줄을 추가하고 첫 번째 열에 추가path
을 헤더 이름으로 사용하십시오. - 머리글 행의 다음 열에 렌더링된 HTML 페이지에서 추출해야 하는 다른 모든 속성을 추가합니다.
Google 드라이브의 다음 예에서 추출된 필드는 다음과 같습니다 title
, image
, description
, 및 lastModified
.
페이지는 게시될 때 색인화됩니다. 색인에서 페이지를 제거하려면 게시를 취소해야 합니다.
사용자 정의 색인 정의가 없는 간단한 시나리오의 경우 robots
메타데이터 속성이 로 설정됨 noindex
AEM의 색인화에서 자동으로 생략됩니다. (여기에는 몇 가지 특별한 시나리오가 있습니다. 자세한 내용은 섹션을 참조하십시오. 로봇을 위한 특별한 시나리오).
다음 표에는 사용 가능한 속성과 HTML 페이지의 추출 위치가 요약되어 있습니다.
추가된 다른 모든 헤더에 대해 인덱서는 해당 이름이 있는 메타 태그를 찾으려고 합니다.
색인 활성화
색인을 활성화하려면 사이드 킥을 사용하여 스프레드시트를 미리 봅니다. 이렇게 하면 색인 구성이 만들어집니다.
색인 확인
Admin Service에는 페이지의 인덱스 표시를 확인할 수 있는 API 끝점이 있습니다. GitHub 소유자, 저장소, 분기 및 소유자, 페이지에 대한 리소스 경로를 제공하면 해당 끝점은 다음과 같습니다.
https://admin.hlx.page/index/<owner>/<repo>/<branch>/<path>
데이터 노드에 페이지의 인덱스 표현이 포함된 JSON 응답을 가져와야 합니다.
인덱스 구성 디버깅
AEM CLI에는 쿼리 구성을 변경할 때마다 인덱스 레코드를 인쇄하는 기능이 있어 올바른 CSS 선택기를 찾는 데 도움이 됩니다.
$ aem up --print-index
다음을 참조하십시오. AEM CLI GitHub 설명서 더 많은 정보를 원하시면 이것을 보세요 비디오 이 기능에 대해 자세히 알아보십시오.
더 많은 인덱스 구성 설정
고유한 사용자 지정 인덱스 구성을 만들어 정의할 수 있습니다 helix-query.yaml.
이렇게 하면 둘 이상의 색인 구성이 동일한 위치에 있을 수 있습니다 helix-query.yaml
: 사이트 일부가 다른 Excel 통합 문서나 Google 스프레드시트에 인덱싱됩니다. 문서 보기 색인 지정 참조 추가 정보.
로봇을 위한 특별한 시나리오
AEM에서 페이지를 인덱싱하는 방법과 사이트에 대한 인덱싱 설정에 대한 몇 가지 뉘앙스가 있습니다. 해당 항목을 살펴보겠습니다.
다음 2가지 상황에서 robots
끝 noindex
페이지에서 메타데이터는 아님 AEM에 의해 색인화되지 않도록 합니다.
- 을(를) 추가했습니다.
robots
열 위치query-index.xlsx
- 다음 항목이 있습니다.
helix-query.yaml
Github 저장소에서, 즉 사용자 지정 색인 정의.
권장 사항
- 사용자 정의 색인 정의가 없는 경우, 다음 작업을 수행하는 것이 좋습니다. 아님 추가
robots
필요한 경우가 아니면 색인 시트에 열을 추가합니다.
추가 중robots
색인 시트에 열을 추가하면 페이지가 AEM에 의해 색인화됩니다.robots
메타데이터 설정 대상noindex.
- 사용자 정의 색인 정의가 있는 경우, 페이지는 설정에 관계없이 AEM에 의해 인덱싱됩니다.
robots
끝noindex
을 클릭합니다. 이 문제가 발생하지 않도록 하려면 스프레드시트 필터를 사용하여 다음과 같은 인덱스에서 페이지를 생략할 수 있습니다.robots
메타데이터 설정 대상noindex
. 자세한 내용은 제목이 "적용 중noindex
사용자 정의 색인 정의를 사용한 구성아래에 있는 "을 참조하십시오.
사용자 정의 색인 정의를 통한 "noindex" 구성 적용
에서 사용자 정의 색인 정의를 정의한 경우 helix-query.yaml
, 설정 robots
다음으로 속성: noindex
는 페이지가 색인화되는 것을 방지하는 데 효과적이지 않습니다. 집행하기 위하여 noindex
구성은 이와 같은 상황에서 다음 작업을 수행합니다.
- ""라는 이름의 시트 만들기
helix-default
"해당query-index.xlsx
. 이후,query-index.xlsx
스프레드시트에는 2개의 시트가 있어야 합니다.“raw_index
" 및“helix-default
". 다음“raw_index
"시트 에는 모든 원시 인덱스 데이터가 있습니다. - 사용자 정의 수정
helix-query.yaml
(프로젝트의 Github 저장소에 있어야 함)robots
인덱싱할 수 있도록 속성을 설정합니다. - 이제 설정
“helix-default
의 "" 시트query-index.xlsx
스프레드시트가 Excel 공식을 사용하여 자동으로 채워지므로 의 모든 행이raw_index
다음이 있음robots
속성이 로 설정됨noindex
, 를 로 복사하지 않음helix-default
시트. 이 작업은 다음과 같은 Excel 공식을 사용하여 수행할 수 있습니다=FILTER(Table1,NOT(Table1[robots]="noindex"))
- 이제 헬릭스 기본 시트에는
raw_index
이 없는robots
속성이 로 설정됨noindex
. - 인덱싱할 페이지를 게시해야 합니다.
- 이제 다음과 같이 인덱스를 가져옵니다.
https://<branch>--<repo>-<org>.hlx.page/query-index.json
, 다음에서 데이터만 가져옵니다.helix-default
시트, 즉 명시적으로 금지되지 않은 항목이robot
속성이 로 설정됨noindex
.