疑難排解慢速查詢

查詢分類速度緩慢

AEM中有3個主要的慢速查詢分類,依嚴重性列出:

  1. 無索引查詢

    • 執行​not​的查詢解析為索引並遍歷JCR的內容以收集結果
  2. 限制不足(或限定範圍)的查詢

    • 解析為索引的查詢,但必須遍歷所有索引條目以收集結果
  3. 大型結果集查詢

    • 傳回大量結果的查詢

前2個查詢分類(無索引且限制不足)的速度緩慢,因為這些分類會強制Oak查詢引擎檢查每個​潛在​結果(內容節點或索引項目),以識別屬於​實際​結果集中的哪些。

檢查每個潛在結果的行為稱為「遍歷」。

由於必須檢查每個潛在結果,因此確定實際結果集的成本與電位結果的數目呈線性增長。

添加查詢限制和調整索引允許以優化格式儲存索引資料,提供快速結果檢索,並且減少或消除對潛在結果集的線性檢查的需要。

在AEM 6.3中,依預設,當到達100,000的周遊時,查詢會失敗並擲回例外狀況。 AEM 6.3之前的AEM版本預設不存在此限制,但可透過Apache Jackrabbit查詢引擎設定OSGi設定和QueryEngineSettings JMX Bean(屬性LimitReads)設定。

檢測無索引查詢

開發期間

說明​all​查詢,並確保其查詢計畫不包含​/*traverse​說明。 遍歷查詢計畫的示例:

  • 計畫: [nt:unstructured] as [a] /* traverse "/content//*" where ([a].[unindexedProperty] = 'some value') and (isdescendantnode([a], [/content])) */

部署後

  • 監視error.log中無索引遍歷查詢的:

    • *INFO* org.apache.jackrabbit.oak.query.QueryImpl Traversal query (query without index) ... ; consider creating and index
    • 只有在沒有可用索引且查詢可能遍歷許多節點時,才會記錄此消息。 如果索引可用,則不會記錄消息,但遍歷的量很小,因此速度很快。
  • 訪問AEM Query Performance操作控制台和Explain慢速查詢,查找遍歷或無索引查詢解釋。

檢測限制不足的查詢

開發期間

說明所有查詢,並確保它們解析為符合查詢屬性限制的調整索引。

  • 所有屬性限制的理想查詢計畫覆蓋範圍為indexRules,而查詢中最緊的屬性限制至少為。
  • 對排序結果進行查詢時,應解析為具有按設定orderable=true.的屬性排序的屬性的索引規則的Lucene屬性索引

例如,預設cqPageLucene沒有jcr:content/cq:tags的索引規則

新增cq:tags索引規則之前

  • cq:tags索引規則

    • 不存在
  • 查詢產生器查詢

    type=cq:Page
    property=jcr:content/cq:tags
    property.value=my:tag
    
  • 查詢計畫

    [cq:Page] as [a] /* lucene:cqPageLucene(/oak:index/cqPageLucene?lang=zh-Hant) *:* where [a].[jcr:content/cq:tags] = 'my:tag' */

此查詢解析為cqPageLucene索引,但由於jcr:contentcq:tags不存在屬性索引規則,因此在評估此限制時,將檢查cqPageLucene索引中的每個記錄以確定匹配項。 這表示,如果索引包含100萬個cq:Page節點,則檢查100萬條記錄以確定結果集。

新增cq:tags索引規則後

  • cq:tags索引規則

    /oak:index/cqPageLucene/indexRules/cq:Page/properties/cqTags
    @name=jcr:content/cq:tags
    @propertyIndex=true
    
  • 查詢產生器查詢

    type=cq:Page
    property=jcr:content/cq:tags
    property.value=myTagNamespace:myTag
    
  • 查詢計畫

    [cq:Page] as [a] /* lucene:cqPageLucene(/oak:index/cqPageLucene?lang=zh-Hant) jcr:content/cq:tags:my:tag where [a].[jcr:content/cq:tags] = 'my:tag' */

cqPageLucene索引中添加jcr:content/cq:tags的indexRule允許以優化方式儲存cq:tags資料。

執行具有jcr:content/cq:tags限制的查詢時,索引可以按值查找結果。 這意味著,如果100個cq:Page節點將myTagNamespace:myTag作為值,則僅返回這100個結果,而其它999,000則從限制檢查中排除,從而將效能提高10,000倍。

當然,進一步的查詢限制會減少符合條件的結果集,並進一步優化查詢優化。

同樣地,如果沒有cq:tags屬性的附加索引規則,即使對cq:tags具有限制的全文查詢也會執行不良,因為索引的結果會傳回所有全文匹配。 cq:tags上的限制會在之後篩選。

索引後篩選的另一個原因是存取控制清單,在開發期間經常會遺漏。 嘗試確定查詢未返回用戶可能無法訪問的路徑。 這通常可以透過更好的內容結構以及提供查詢的相關路徑限制來完成。

要識別Lucene索引是否返回大量結果以作為查詢結果返回非常小的子集,一個有用的方法是為org.apache.jackrabbit.oak.plugins.index.lucene.LucenePropertyIndex啟用DEBUG日誌,並查看從索引中載入的文檔數。 最終結果的數量與載入的文檔的數量之間不應不成比例。 如需詳細資訊,請參閱記錄

部署後

  • 監視error.log的遍歷查詢:

    • *WARN* org.apache.jackrabbit.oak.spi.query.Cursors$TraversingCursor Traversed ### nodes ... consider creating an index or changing the query
  • 請訪問AEM Query Performance操作控制台和Explain慢速查詢,查找未解析查詢屬性限制的查詢計畫以索引屬性規則。

檢測大結果集查詢

開發期間

為oak.queryLimitInMemory設定低臨界值(例如 10000)和oak.queryLimitReads(例如 5000),並在點擊「查詢讀取的節點數超過x個……」的UnsupportedOperationException時,優化昂貴的查詢

這有助於避免資源密集型查詢(即。 不受任何索引的支援或受覆蓋索引較少的支援)。 例如,讀取1M個節點的查詢將導致大量IO,並對整體應用程式效能產生負面影響。 因此,任何因上述限制而失敗的查詢都應加以分析和最佳化。

部署後

  • 監視日誌中是否有觸發大節點遍歷或大堆記憶體消耗的查詢:"

    • *WARN* ... java.lang.UnsupportedOperationException: The query read or traversed more than 100000 nodes. To avoid affecting other tasks, processing was stopped.
    • 優化查詢以減少已遍歷的節點數
  • 監視日誌中觸發大堆記憶體消耗的查詢:

    • *WARN* ... java.lang.UnsupportedOperationException: The query read more than 500000 nodes in memory. To avoid running out of memory, processing was stopped
    • 優化查詢以減少堆記憶體消耗

對於AEM 6.0 - 6.2版,您可以透過AEM啟動指令碼中的JVM參數來調整節點周遊臨界值,以防止大型查詢超出環境負載。 建議的值為:

  • -Doak.queryLimitInMemory=500000
  • -Doak.queryLimitReads=100000

在AEM 6.3中,上述2個參數預設已預先設定,並可透過OSGi QueryEngineSettings修改。

如需詳細資訊,請參閱:https://jackrabbit.apache.org/oak/docs/query/query-engine.html#Slow_Queries_and_Read_Limits

查詢效能調整

AEM中查詢效能最佳化的格言為:

「限制越多越好。」

以下概述了為確保查詢效能而建議的調整。 首先調整查詢(不那麼引人注目的活動),然後根據需要調整索引定義。

調整查詢語句

AEM支援下列查詢語言:

  • 查詢產生器
  • JCR-SQL2
  • XPath

下列範例使用查詢產生器,因為這是AEM開發人員最常使用的查詢語言,但JCR-SQL2和XPath也適用相同的原則。

  1. 添加nodetype限制,使查詢解析到現有Lucene屬性索引。
  • 未優化的查詢

    property=jcr:content/contentType
    property.value=article-page
    
  • 最佳化查詢

    type=cq:Page
    property=jcr:content/contentType
    property.value=article-page
    

    缺少nodetype限制的查詢會強制AEM採用nt:base nodetype,AEM中的每個節點都是的子類型,這有效地導致了nodetype限制。

    設定type=cq:Page將此查詢限制為僅cq:Page節點,並將查詢解析為AEM cqPageLucene,將結果限制為AEM中的節點子集(僅cq:Page節點)。

  1. 調整查詢的nodetype限制,使查詢解析為現有Lucene屬性索引。
  • 未優化的查詢

    type=nt:hierarchyNode
    property=jcr:content/contentType
    property.value=article-page
    
  • 最佳化查詢

    type=cq:Page
    property=jcr:content/contentType
    property.value=article-page
    

    nt:hierarchyNode 是的父節點類 cq:Page型,且假設 jcr:content/contentType=article-page 僅透過自訂應 cq:Page 用程式套用至節點,此查詢只會傳 cq:Page 回其 jcr:content/contentType=article-page中的節點。這是次優限制,因為:

    • 其他節點繼承自nt:hierarchyNode(例如 dam:Asset)會不必要地新增至可能的結果集。
    • nt:hierarchyNode沒有AEM提供的索引,但cq:Page沒有提供的索引。

    設定type=cq:Page會將此查詢限制為僅cq:Page節點,並將查詢解析為AEM cqPageLucene,將結果限制為AEM中的節點子集(僅cq:Page節點)。

  1. 或者,調整屬性限制,使查詢解析為現有的屬性索引。
  • 未優化的查詢

    property=jcr:content/contentType
    property.value=article-page
    
  • 最佳化查詢

    property=jcr:content/sling:resourceType
    property.value=my-site/components/structure/article-page
    

    將屬性限制從jcr:content/contentType(自訂值)變更為已知屬性sling:resourceType,可讓查詢解析為屬性索引slingResourceType,該索引由sling:resourceType索引所有內容。

    當查詢不能通過nodetype進行辨識,並且單個屬性限制主導結果集時,最好使用屬性索引(與Lucene屬性索引相對)。

  1. 將最緊的路徑限制添加到查詢。 例如,您偏好/content/my-site/us/en而非/content/my-site,或偏好/content/dam而非/
  • 未優化的查詢

    type=cq:Page
    path=/content
    property=jcr:content/contentType
    property.value=article-page
    
  • 最佳化查詢

    type=cq:Page
    path=/content/my-site/us/en
    property=jcr:content/contentType
    property.value=article-page
    

    將路徑限制範圍從path=/contentpath=/content/my-site/us/en允許索引減少需要檢查的索引條目數。 如果查詢可以很好地限制路徑,而不只是/content/content/dam,請確保索引具有evaluatePathRestrictions=true

    請注意,使用evaluatePathRestrictions會增加索引大小。

  1. 如有可能,請避免查詢函式/操作超調如下:LIKEfn:XXXX,因為它們的成本隨著基於限制的結果的數量而增加。
  • 未優化的查詢

    type=cq:Page
    property=jcr:content/contentType
    property.operation=like
    property.value=%article%
    
  • 最佳化查詢

    type=cq:Page
    fulltext=article
    fulltext.relPath=jcr:content/contentType
    

    LIKE條件評估速度緩慢,因為如果文字以萬用字元("%。…')開頭,則無法使用索引。 jcr:contains條件允許使用全文索引,因此是推薦條件。 這要求解析的Lucene屬性索引具有analayzed=truejcr:content/contentType的indexRule。

    使用fn:lowercase(..)等查詢函式可能較難進行最佳化,因為沒有更快的等效函式(在更複雜且更顯眼的索引分析器配置之外)。 最好找出其他範圍界定限制,以改善整體查詢效能,要求函式對盡可能小的潛在結果集進行操作。

  1. 此調整專用於查詢生成器,不適用於JCR-SQL2或XPath。

    如果立即需要完整的結果集​not,請使用查詢產生器' guessTotal

    • 未優化的查詢

      type=cq:Page
      path=/content
      
    • 最佳化查詢

      type=cq:Page
      path=/content
      p.guessTotal=100
      

    若是查詢執行速度快但結果數量大的情況,請參閱。guessTotal是查詢產生器查詢的重要最佳化。

    p.guessTotal=100 指示查詢產生器僅收集前100個結果,並設定布林值標幟,指出是否至少存在一個其他結果(但不存在多少個結果),因為計算此數字會導致速度緩慢。此最佳化優於分頁或無限載入使用案例,其中只會逐步顯示結果的子集。

現有索引調整

  1. 如果最佳查詢解析為屬性索引,則沒有其他任何可做的,因為屬性索引可調性最低。

  2. 否則,查詢應解析為Lucene屬性索引。 如果無法解析索引,請跳到「建立新索引」。

  3. 視需要將查詢轉換為XPath或JCR-SQL2。

    • 查詢產生器查詢

      query type=cq:Page
      path=/content/my-site/us/en
      property=jcr:content/contentType
      property.value=article-page
      orderby=@jcr:content/publishDate
      orderby.sort=desc
      
    • 從查詢生成器查詢生成的XPath

      /jcr:root/content/my-site/us/en//element(*, cq:Page)[jcr:content/@contentType = 'article-page'] order by jcr:content/@publishDate descending
      
  4. 將XPath(或JCR-SQL2)提供給Oak Index Definition Generator以生成優化的Lucene屬性索引定義。

    生成的Lucene屬性索引定義

    - evaluatePathRestrictions = true
    - compatVersion = 2
    - type = "lucene"
    - async = "async"
    - jcr:primaryType = oak:QueryIndexDefinition
        + indexRules
        + cq:Page
            + properties
            + contentType
                - name = "jcr:content/contentType"
                - propertyIndex = true
            + publishDate
                - ordered = true
                - name = "jcr:content/publishDate"
    
  5. 以添加方式手動將生成的定義合併到現有Lucene屬性索引中。 請小心不要刪除現有配置,因為它們可能用於滿足其他查詢。

    1. 找出涵蓋cq:Page的現有Lucene屬性索引(使用索引管理器)。 在此情況下,/oak:index/cqPageLucene
    2. 識別最佳化索引定義(步驟#4)與現有索引(/oak:index/cqPageLucene?lang=zh-Hant)之間的設定差值,並將最佳化索引中遺漏的設定新增至現有索引定義。
    3. 根據AEM重新索引最佳實務,會根據現有內容是否會受此索引組態變更影響,依序重新整理或重新索引。

建立新索引

  1. 驗證查詢未解析為現有Lucene屬性索引。 如果有,請參閱上節中關於優化和現有索引的部分。

  2. 視需要將查詢轉換為XPath或JCR-SQL2。

    • 查詢產生器查詢

      type=myApp:Author
      property=firstName
      property.value=ira
      
    • 從查詢生成器查詢生成的XPath

      //element(*, myApp:Page)[@firstName = 'ira']
      
  3. 將XPath(或JCR-SQL2)提供給Oak Index Definition Generator以生成優化的Lucene屬性索引定義。

    生成的Lucene屬性索引定義

    - compatVersion = 2
    - type = "lucene"
    - async = "async"
    - jcr:primaryType = oak:QueryIndexDefinition
        + indexRules
        + myApp:AuthorModel
            + properties
            + firstName
                - name = "firstName"
                - propertyIndex = true
    
  4. 部署生成的Lucene屬性索引定義。

    將Oak Index Definition Generator提供之新索引的XML定義新增至AEM專案,以管理Oak索引定義(請記住,將Oak索引定義視為程式碼,因為程式碼取決於這些定義)。

    按照通常的AEM軟體開發生命週期部署並測試新索引,並驗證查詢解析為索引且查詢效能良好。

    初始部署此索引後,AEM會將必要資料填入索引。

無索引和遍歷查詢何時可以?

由於AEM有彈性的內容架構,很難預測並確保內容結構的周遊性不會隨著時間而演變為無法接受的大。

因此,確保索引滿足查詢,除非路徑限制和nodetype限制的組合保證​小於20個節點被遍歷。

查詢開發工具

Adobe支援

支援的社區

本頁內容