文字剖析器

最後更新： 2026年6月25日

您可以使用文字剖析器工具來剖析文字，以供其他Adobe Workfront Fusion案例模組使用。文字剖析器不需要連線。

存取權要求

展開以檢視這篇文章中所述功能的存取權要求。

table 0-row-2 1-row-2 2-row-2 layout-auto html-authored no-header

Adobe Workfront 封裝

任何 Adobe Workfront Workflow 封裝及任何 Adobe Workfront Automation and Integration 封裝

Workfront Ultimate

Workfront Prime 和 Select 封裝，以及額外購買的 Workfront Fusion。

Adobe Workfront 授權

標準

工作或更高層級

產品

如果您的組織擁有 Select 或 Prime Workfront 封裝，但不包括 Workfront Automation and Integration，則您的組織必須購買 Adobe Workfront Fusion。

若要詳細了解此表格中的資訊，請參閱🔗文件中的存取權要求。

文字剖析器API資訊

文字剖析器聯結器使用下列專案：

API 標記

文字剖析器模組及其欄位

當您設定文字剖析器模組時，Adobe Workfront Fusion會顯示下列欄位。在模組中，粗體標題表示那是必要欄位。

若在欄位或函式上方看到對應按鈕，可以使用按鈕設定該欄位的變數和函式。如需詳細資訊，請參閱將資訊從一個模組對應到另一個模組。

對應切換

從HTML取得元素

從HTML程式碼中擷取所需的元素。

即使模組找不到符合專案，仍繼續執行路由

啟用此選項以確保模組未傳回任何結果時不會停止案例。

元素型別

選取您要從HTML程式碼擷取的元素型別。

Image
連結
iFrame元素

HTML

輸入或對應您要從中擷取指定元素型別的HTML程式碼。

從文字取得元素

根據指定的模式剖析文字中的元素。

輸入文字

輸入或對應您要剖析的文字。

模式

選取反映您要從文字中剖析之元素的圖樣。

若要輸入自訂規則運算式，請從清單中選取「自訂」，然後在「自訂規則運算式」欄位中輸入自訂運算式。

忽略重複發生次數

核取此方塊以忽略重複出現的文字元素。

HTML至文字

HTML

輸入要轉換為純文字的HTML程式碼。

分行符號

選取新行的型別（分行符號）。

大寫標題

啟用此選項可將標題標籤內的文字（如<h2> </h2>）轉換為大寫文字。

符合模式

符合模式模組可讓您從指定文字中尋找和擷取符合搜尋模式的字串元素。此模組使用規則運算式（也稱為regex或regexp）。

規則運算式是一系列字元，其中每個字元都是具有特殊意義的中繼字元，或是具有常值含義的規則字元。這些字元和中繼字元會識別可用來搜尋文字的模式。例如，如果您想要搜尋名稱，可以設定規則運算式來搜尋由兩個以大寫字母開頭的連續字片語成的模式。規則運算式是搜尋和處理文字的強大工具。

有關規則運算式的討論不在本文的討論範圍內。我們建議使用下列資源：

如需完整的中繼字元清單，請參閱MDN網頁檔案中的規則運算式。
如需有關如何建立規則運算式的教學課程，我們建議RegexOne。
若要嘗試規則運算式，我們建議使用規則運算式101網站。在左側面板中選取ECMAScript (JavaScript) FLAVOR 。

模式

輸入規則運算式模式。

範例： [+-]?(\d+(\.\d+)?|\.\d+)([eE][+-]?\d+)?會擷取所提供文字中的所有數字。

注意：

此模式應該包含至少一個括弧()中的擷取群組。如果模式不包含任何擷取群組，則輸出組合為空白。

全域符合

啟用此選項以擷取文字中的所有相符專案。每個相符專案都會以個別的套裝輸出。如果停用此選項，模組只會擷取第一個專案。

區分大小寫

啟用此選項讓此模組將文字視為區分大小寫。

Multiline

啟用此選項可確保開始和結束中繼字元（^和$）符合每行的開頭或結尾，而不只是整個輸入字串的開頭或結尾。

單行

啟用此選項以確保句點(.) 符合新行字元(\n)。

即使模組未傳回任何結果，仍繼續執行路由

啟用此選項以確保模組未傳回任何結果時不會停止案例。

文字

輸入或對應您要符合圖樣的文字。

Replace

搜尋指定值或規則運算式的輸入文字，並將結果取代為新值。

模式

輸入搜尋字詞。您也可以使用規則運算式。如需規則運算式的詳細資訊，請參閱比對模式模組。

新值

輸入您要取代搜尋字詞的值。

全域符合

啟用此選項以擷取文字中的所有相符專案。每個相符專案都會以個別的套裝輸出。如果停用此選項，模組只會擷取第一個專案。

區分大小寫

啟用此選項讓此模組將文字視為區分大小寫。

Multiline

啟用此選項可確保開始和結束中繼字元（^和$）符合每行的開頭或結尾，而不只是整個輸入字串的開頭或結尾。

單行

啟用此選項以確保句點(.) 符合新行字元(\n)。

文字

輸入要搜尋的文字。

資料清除

資料擷取（有時稱為網頁擷取、資料擷取或網頁收集）是從網站收集資料，並將其儲存在本機資料庫或試算表中的程式。如果您想從網站刮取資料，但不熟悉規則運算式，則可使用資料刮取工具。

如果資料刮取工具提供REST API，您可以透過我們的通用HTTP模組和Webhooks模組連線到它。

文字剖析器疑難排解

如果您無法取得文字剖析器以產生任何輸出，請使用此資訊。

範例：

模組應剖析檔案檔案「filename.docx」的檔案型別，且檔案名稱的副檔名從DOCX到PDF再到CSV。

您可以在此情況下選擇使用的運算式是…+

此規則運算式通常會產生完全相符的結果。

不過，在文字剖析器中實作此運算式不會產生相符專案：

沒有相符項

原因在於「i」僅顯示每個相符項的相符數，因此在此例中，我們有2個相符項，因此「i」後面有一個數值1和2。此情況下的使用案例是，如果您只需要比對或傳遞資料至篩選器，就可以指定由數值表示的值（第二個相符值）。

為了能夠取得您在要剖析的零件中新增方括弧所需的相符值（例如，從「filename.docx」 — 「docx」中擷取），則根據我們用於此案例的規則運算式情境，方括弧應套用在.(.+)上

這會擷取DOCX、將其置於群組中，並保留「」。盡情享受吧。

取得相符專案

在下圖所示的輸出中，擷取群組將符合任何字元（行終止元除外）。

另一個同時納入regex的因應措施是使用取代函式

{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}

然後將abcdefghijklmno pqr stuvw xyz.docx取代為您的實際檔案名稱變數。

style

shade-box

recommendation-more-help

workfront-fusion-help-workfront-fusion