在Adobe Experience Manager(AEM)中,二進位資料可獨立於內容節點儲存。 二進位資料被儲存在資料儲存中,而內容節點被儲存在節點儲存中。
可以使用OSGi配置配置資料儲存和節點儲存。 每個OSGi配置都使用永久標識符(PID)被引用。
要同時配置節點儲存和資料儲存,請執行以下步驟:
將AEM快速入門JAR檔案複製至其安裝目錄。
在安裝目錄中建立crx-quickstart/install
資料夾。
首先,通過建立一個配置檔案,其名稱為要在crx-quickstart/install
目錄中使用的節點儲存選項,配置節點儲存。
例如,Document節點儲存區(AEM的MongoMK實作的基礎)使用檔案org.apache.jackrabbit.oak.plugins.document.DocumentNodeStoreService.config
。
編輯檔案並設定您的設定選項。
使用您要使用的資料存放區的PID建立設定檔。 編輯檔案以設定配置選項。
啟動AEM。
區段節點儲存區是Adobe在AEM6中實作TarMK的基礎。 它使用org.apache.jackrabbit.oak.segment.SegmentNodeStoreService
PID進行配置。
「區段」節點儲存區的PID已從AEM 6的org.apache.jackrabbit.oak.plugins.segment.SegmentNodeStoreService in previous versions
變更為AEM 6.3的org.apache.jackrabbit.oak.segment.SegmentNodeStoreService
。請務必進行必要的組態調整,以反映此變更。
您可以設定下列選項:
repository.home
:儲存與儲存庫相關資料的儲存庫主目錄的路徑。預設情況下,段檔案儲存在crx-quickstart/segmentstore
目錄下。
tarmk.size
:區段的最大大小(MB)。預設上限為256MB。
customBlobStore
:指示使用自訂資料存放區的布林值。AEM 6.3及更新版本的預設值為true。 在AEM 6.3之前,預設值為false。
以下是範例org.apache.jackrabbit.oak.segment.SegmentNodeStoreService.config
檔案:
#Path to repo
repository.home="crx-quickstart/repository"
#Max segment size
tarmk.size=I"256"
#Custom data store
customBlobStore=B"true"
檔案節點儲存區是AEM MongoMK實作的基礎。 它使用org.apache.jackrabbit.oak.plugins.document.DocumentNodeStoreService
PID。 可使用下列配置選項:
mongouri
:連接 到Mongo資料庫所需的MongoURI。預設值為mongodb://localhost:27017
db
:Mongo資料庫的名稱。預設值為Oak。 不過,新的AEM 6安裝會使用aem-author作為預設資料庫名稱。
cache
:快取大小(MB)。這會分佈在DocumentNodeStore中使用的各種快取中。 預設值為256
。
changesSize
:Mongo中用於快取比較輸出的封頂系列大小(MB)。預設值為256
。
customBlobStore
:指示將使用自訂資料存放區的布林值。預設值為false
。
以下是範例org.apache.jackrabbit.oak.plugins.document.DocumentNodeStoreService.config
檔案:
#Mongo server details
mongouri="mongodb://localhost:27017"
#Name of Mongo database to use
db="aem-author"
#Store binaries in custom BlobStore
customBlobStore=B"false"
在處理大量二進位檔案時,建議使用外部資料存放區,而非預設節點儲存區,以發揮最大效能。
例如,如果您的專案需要大量的媒體資產,將它們儲存在「檔案」或「S3資料存放區」下,將比直接儲存在MongoDB中更快速地存取它們。
File Data Store提供比MongoDB更好的效能,而Mongo備份和恢復操作在大量資產的情況下也較慢。
以下說明不同資料儲存區和組態的詳細資訊。
這是Jackrabbit 2中FileDataStore的實作。 它提供了一種將二進位資料作為普通檔案儲存在檔案系統上的方法。 它使用org.apache.jackrabbit.oak.plugins.blob.datastore.FileDataStore
PID。
這些配置選項可用:
repository.home
:儲存各種儲存庫相關資料的儲存庫主目錄的路徑。預設情況下,二進位檔案將儲存在crx-quickstart/repository/datastore
目錄下。
path
:儲存檔案的目錄的路徑。如果指定,則優先於repository.home
值。
minRecordLength
:資料儲存中儲存的檔案的最小大小(以位元組為單位)。小於此值的二進位內容會內嵌在內。
使用NAS儲存共用檔案資料儲存時,請確保只使用高效能設備以避免效能問題。
AEM可設定為將資料儲存在Amazon的Simple Storage Service(S3)中。 它使用org.apache.jackrabbit.oak.plugins.blob.datastore.S3DataStore.config
PID進行配置。
為了啟用S3資料儲存功能,需要下載並安裝包含S3資料儲存連接器的功能包。 前往Adobe Repository並從1.8.x版的功能套件下載最新版本(例如com.adobe.granite.oak.s3connector-1.8.0.zip)。 此外,您也需要下載並安裝 AEM 6.4 Service Pack發行說明頁面中所列的最新AEM Service Pack。
將AEM 6.4與TarMK搭配使用時,預設會將二進位檔儲存在FileDataStore
中。 若要搭配S3資料儲存區使用TarMK,您必須使用crx3tar-nofds
執行模式啟動AEM,例如:
java -jar aem6.4.jar -r crx3tar-nofds
下載後,您可以按如下方式安裝和配置S3連接器:
將功能套件zip檔案的內容解壓縮至暫存資料夾。
轉至臨時資料夾並導航到以下位置:
jcr_root/libs/system/install
將上述位置的所有內容複製到<aem-install>/crx-quickstart/install.
如果AEM已設定為可搭配Tar或MongoDB儲存,請先從aem-install/crx-quickstart/install
資料夾移除任何現有的設定檔案,然後再繼續。 需要移除的檔案包括:
For MongoMK: org.apache.jackrabbit.oak.plugins.document.DocumentNodeStoreService.config
For TarMK: org.apache.jackrabbit.oak.segment.SegmentNodeStoreService.config
返回已提取功能包的臨時位置,並複製以下資料夾的內容:
jcr_root/libs/system/config
至
<aem-install>/crx-quickstart/install
請確定您僅複製當前配置所需的配置檔案。 對於專用資料儲存和共用資料儲存設定,都複製org.apache.jackrabbit.oak.plugins.blob.datastore.S3DataStore.config
檔案。
在群集設定中,逐個對群集的所有節點執行上述步驟。 此外,請務必對所有節點使用相同的S3設定。
編輯檔案並新增設定所需的設定選項。
啟動AEM。
如果您需要升級至新版本的1.8.x S3連接器(例如,從1.8.0升級至1.8.1),請遵循下列步驟:
停止AEM例項。
導覽至AEM安裝資料夾中的<aem-install>/crx-quickstart/install/15
,並備份其內容。
備份後,通過刪除<aem-install>/crx-quickstart/install/15
資料夾中的所有jar檔案來刪除舊版S3 Connector及其從屬關係,例如:
上述檔案名稱僅用於圖示用途,且未確定。
從Adobe Repository下載最新版1.8.x功能包。
將內容解壓縮至個別的資料夾,然後導覽至jcr_root/libs/system/install/15
。
將jar檔案複製至AEM安裝資料夾中的<aem-install>/crx-quickstart/install/15。
啟動AEM並檢查連接器功能。
您可以使用配置檔案和以下選項:
accessKey:AWS訪問密鑰。
secretKey:AWS秘密訪問密鑰。 注意: 或者, IAM 角色可用於驗證。如果您使用IAM角色,則不再需要指定accessKey
和secretKey
。
s3Bucket:桶名。
s3地區:桶區域。
路徑:資料儲存的路徑。 預設值為<AEM安裝資料夾>/repository/datastore
minRecordLength:應儲存在資料儲存中的對象的最小大小。 最小/預設值為16KB。
maxCachedBinarySize:大小小於或等於此大小的二進位檔案將儲存在記憶體快取中。 大小(以位元組為單位)。 預設值為17408(17 KB)。
cacheSize:快取的大小。 該值以位元組為單位指定。 預設值為64GB。
機密:僅在對共用資料儲存設定使用無二進位複製時使用。
stagingSplitPercentage:配置為用於轉移非同步上載的快取大小的百分比。 預設值為10。
uploadThreads:用於非同步上載的上載線程數。 預設值為10。
stagingPurgeInterval:從預備快取中清除已完成上載的間隔(秒)。 預設值為300秒(5分鐘)。
stagingRetryInterval:失敗上載的重試間隔(秒)。 預設值為600秒(10分鐘)。
美國標準 | us-standard |
美國西部 | us-west-2 |
美國西部(北加州) | us-west-1 |
歐盟(愛爾蘭) |
EU |
亞太地區(新加坡) |
ap-southeast-1 |
亞太地區(雪梨) |
ap-southeast-2 |
亞太地區(東京) | ap-northeast-1 |
南美洲(聖保羅) |
sa-east-1 |
DataStore快取
S3DataStore
、CachingFileDataStore
和AzureDataStore
的DataStore實作支援本機檔案系統快取。 CachingFileDataStore
實施在DataStore位於NFS(網路檔案系統)上時非常有用。
從舊版快取實作(Oak 1.6之前版本)升級時,本機檔案系統快取目錄的結構有所不同。 在舊快取結構中,已下載和已上載的檔案都直接放在快取路徑下。 新結構將下載和上載分離,並將它們儲存在快取路徑下名為upload
和download
的兩個目錄中。 升級程式應順暢無阻,而且應排程任何擱置中的上傳,而且在初始化時,快取中任何先前下載的檔案都會放入快取中。
您也可以使用oak-run的datastorecacheupgrade
命令離線升級快取。 有關如何執行命令的詳細資訊,請查看readme中有關oak-run模組的資訊。
快取有大小限制,可使用cacheSize參數加以設定。
下載
在從DataStore存取請求的檔案/blob之前,將檢查本地快取中的記錄。 當快取在向快取中添加檔案時超出配置的限制(請參見cacheSize
參數)時,將逐出某些檔案以回收空間。
非同步上傳
快取支援非同步上傳至DataStore。 檔案會在本機儲存(在檔案系統上),而非同步作業會開始上傳檔案。 非同步上傳的數量受測試快取大小的限制。 使用stagingSplitPercentage
參數來設定預備快取的大小。 此參數定義用於測試快取的快取大小百分比。 此外,可下載的快取百分比計算為(100 - stagingSplitPercentage
)*cacheSize
。
非同步上載是多線程的,並且線程數是使用uploadThreads
參數配置的。
上載完成後,檔案將移到主下載快取。 當測試快取大小超過其限制時,檔案會同步上傳至DataStore,直到先前的非同步上傳完成,而且測試快取中的空間又可用。 已上載檔案由週期性作業從轉移區域中刪除,其間隔由stagingPurgeInterval
參數配置。
失敗的上載(例如,由於網路中斷)將被放入重試隊列並定期重試。 重試間隔是使用stagingRetryInterval parameter
配置的。
要使用S3配置無聯機複製,需要執行以下步驟:
安裝作者和發佈例項,並確定它們已正確啟動。
轉到複製代理設定,方法是開啟到http://localhost:4502/etc/replication/agents.author/publish.html的頁。
按Settings部分中的Edit按鈕。
將Serialization類型選項更改為二進位小於。
在傳輸URI中添加參數" binaryless
= true
"。 變更後,URI的外觀應類似下列:
http://localhost:4503/bin/receive?sling:authRequestLogin=1&binaryless=true
重新啟動所有作者和發佈例項,讓變更生效。
使用以下命令解壓縮CQ快速入門:
java -jar cq-quickstart.jar -unpack
解壓縮AEM後,請在安裝目錄crx-quickstart/install內建立資料夾。
在crx-quickstart
資料夾中建立下列兩個檔案:
建立檔案後,視需要新增設定選項。
如上所述,安裝S3資料存放區所需的兩個組合。
請確定已安裝MongoDB且mongod
的實例正在運行。
使用下列命令啟動AEM:
java -Xmx1024m -XX:MaxPermSize=256M -jar cq-quickstart.jar -r crx3,crx3mongo
對第二個AEM例項重複步驟1至4。
啟動第二個AEM例項。
首先,在共用資料儲存區所需的每個執行個體上建立資料儲存區設定檔案:
FileDataStore
,請建立名為org.apache.jackrabbit.oak.plugins.blob.datastore.FileDataStore.config
的檔案,並將它放在<aem-install>/crx-quickstart/install
資料夾中。<aem-install>/crx-quickstart/install
資料夾中建立名為rg.apache.jackrabbit.oak.plugins.blob.datastore.S3DataStore.config
的檔案,如上所示。修改每個實例上的資料儲存配置檔案以指向同一資料儲存。 如需詳細資訊,請參閱本文。
如果實例已從現有伺服器中克隆,則需要在儲存庫離線時使用最新的oak-run工具刪除新實例的clusterId
。 您需要執行的命令是:
java -jar oak-run.jar resetclusterid < repository path | Mongo URI >
如果配置了「段」節點儲存,則需要指定儲存庫路徑。 預設情況下,路徑為<aem-install-folder>/crx-quickstart/repository/segmentstore.
如果配置了Document節點儲存,則可以使用Mongo Connection String URI。
Oak-run工具可從以下位置下載:
https://mvnrepository.com/artifact/org.apache.jackrabbit/oak-run/
請注意,需要根據您與AEM安裝搭配使用的Oak版本,使用不同版本的工具。 請在使用此工具之前,先檢查下列版本需求清單:
最後,驗證配置。 為此,您需要查找每個正在共用資料儲存庫的唯一檔案。 檔案的格式為repository-[UUID]
,其中UUID是每個單獨儲存庫的唯一標識符。
因此,正確的配置應具有與共用資料儲存的儲存庫相同的唯一檔案。
檔案的儲存方式不同,視資料儲存區而定:
FileDataStore
,檔案是在資料儲存資料夾的根路徑下建立的。S3DataStore
,在META
資料夾下配置的S3儲存桶中建立檔案。AEM可設定為將資料儲存在Microsoft的Azure儲存服務中。 它使用org.apache.jackrabbit.oak.plugins.blob.datastore.AzureDataStore.config
PID進行配置。
為啟用Azure資料儲存功能,必須下載並安裝包含Azure連接器的功能套件。 前往Adobe Repository並從功能套件1.6.x版下載最新版本(例如com.adobe.granite.oak.azureblobconnector-1.6.3.zip)。
將AEM 6.4與TarMK搭配使用時,預設會將二進位檔儲存在FileDataStore中。 若要搭配Azure DataStore使用TarMK,您必須使用crx3tar-nofds
執行模式啟動AEM,例如:
java -jar aem6.4.jar -r crx3tar-nofds
下載後,您可依下列方式安裝及設定Azure連接器:
將功能套件zip檔案的內容解壓縮至暫存資料夾。
轉到臨時資料夾,將jcr_root/libs/system/install
的內容複製到<aem-install>crx-quickstart/install
資料夾。
如果AEM已設定為可搭配Tar或MongoDB儲存,請先從/crx-quickstart/install
資料夾移除任何現有的設定檔案,然後再繼續。 需要移除的檔案包括:
ForMongoMK:
org.apache.jackrabbit.oak.plugins.document.DocumentNodeStoreService.config
針對TarMK:
org.apache.jackrabbit.oak.segment.SegmentNodeStoreService.config
返回已提取特徵包的臨時位置,並將jcr_root/libs/system/config
的內容複製到<aem-install>/crx-quickstart/install
資料夾。
編輯配置檔案並添加設定所需的配置選項。
啟動AEM。
您可以使用配置檔案和以下選項:
azureSas="":在1.6.3版的連接器中,新增了Azure共用存取簽名(SAS)支援。 如果配置檔案中同時存在SAS和儲存憑據,則SAS具有優先順序。 有關SAS的更多資訊,請參 閱官方文檔。請確定'='字元已逸出為'='。
azureBlobEndpoint="":Azure Blob端點。 例如,https://<storage-account>.blob.core.windows.net。
accessKey="":儲存帳戶名稱。 有關Microsoft Azure驗證憑證的詳細資訊,請參閱官方檔案。
secretKey="":儲存訪問密鑰。 請確定'='字元已逸出為'='。
container="":Microsoft Azure Blob儲存容器名稱。 容器是一組膨脹體的群組。 如需詳細資訊,請閱讀官方檔案。
maxConnections="":每個操作同時發出請求的併發數。 預設值為1。
maxErrorRetry="":每個請求的重試次數。 預設值為3。
socketTimeout="":請求使用的逾時間隔(以毫秒為單位)。 預設值為5分鐘。
除了上述設定外,您也可以設定下列設定:
<aem-install>/repository/datastore.
所有設定都應放在引號之間,例如:
accessKey="ASDASDERFAERAER"
secretKey="28932hfjlkwdo8fufsdfas\=\="
資料儲存廢棄項目收集過程用於移除資料儲存中任何未使用的檔案,從而釋放過程中的寶貴磁碟空間。
您可以透過下列方式執行資料存放區廢棄項目收集:
轉到位於https://<serveraddress:port>/system/console/jmx的JMX控制台
正在搜索RepositoryManagement。 在找到儲存庫管理器MBean後,按一下它可開啟可用選項。
捲動至頁面結尾,然後按一下startDataStoreGC(boolean markOnly)連結。
在以下對話框中,為markOnly
參數輸入false
,然後按一下叫用:
markOnly
參數表示垃圾回收的掃描階段是否將運行。
在叢集或共用資料存放區設定(使用Mongo或區段Tar)中執行廢棄項目收集時,記錄檔可能會顯示有關無法刪除特定點滴ID的警告。 這是因為在先前廢棄項目收集中刪除的blob ID被其他沒有ID刪除資訊的群集或共用節點重新錯誤引用。 因此,在執行廢棄項目收集時,當嘗試刪除上次執行中已刪除的ID時,它會記錄警告。 此行為不會影響效能或功能。
有了較新版本的AEM,資料存放區廢棄項目收集也可以在多個儲存庫共用的資料存放區上執行。 若要在共用資料存放區上執行資料存放區廢棄項目收集,請執行下列步驟:
請確保為資料儲存廢棄項目收集配置的任何維護任務在共用資料儲存的所有儲存庫實例上都被禁用。
在共用資料儲存的所有儲存庫實例上分別運行二進位廢棄項收集中提及的步驟。 但是,請務必在按一下「調用」按鈕之前為markOnly
參數輸入true
:
在所有實例上完成上述過程後,從實例的any再次運行資料儲存廢棄項目收集:
markOnly
參數輸入false
。這會整理使用之前使用的標籤階段找到的所有檔案,並刪除資料儲存區中未使用的其餘檔案。