文字剖析器
您可以使用文字剖析器工具來剖析文字,以供其他Adobe Workfront Fusion案例模組使用。 文字剖析器不需要連線。
存取需求
您必須具有下列存取權才能使用本文中的功能:
table 0-row-2 1-row-2 2-row-2 3-row-2 layout-auto html-authored no-header | |
---|---|
Adobe Workfront套件 | 任何 |
Adobe Workfront授權 |
新增:標準 或 目前:工作或以上 |
Adobe Workfront Fusion授權** | 無Workfront Fusion授權需求 |
產品 |
新增:
或 目前:您的組織必須購買Adobe Workfront Fusion。 |
如需此表格中資訊的詳細資訊,請參閱檔案中的存取需求。
如需Adobe Workfront Fusion授權的相關資訊,請參閱Adobe Workfront Fusion授權。
文字剖析器API資訊
文字剖析器聯結器使用下列專案:
文字剖析器模組及其欄位
當您設定文字剖析器模組時,Adobe Workfront Fusion會顯示下列欄位。 模組中的粗體標題表示必填欄位。
如果您在欄位或函式上方看到對應按鈕,則可以使用它來設定該欄位的變數和函式。 如需詳細資訊,請參閱將資訊從一個模組對應到另一個模組。
轉換器
從HTML取得元素
從HTML程式碼中擷取所需的元素。
從文字取得元素
根據指定的模式剖析文字中的元素。
HTML至文字
符合模式
符合模式模組可讓您從指定文字中尋找和擷取符合搜尋模式的字串元素。 此模組使用規則運算式(也稱為regex或regexp)。
規則運算式是一系列字元,其中每個字元都是具有特殊意義的中繼字元,或是具有常值含義的規則字元。 這些字元和中繼字元會識別可用來搜尋文字的模式。 例如,如果您想要搜尋名稱,可以設定規則運算式來搜尋由兩個以大寫字母開頭的連續字片語成的模式。 規則運算式是搜尋和處理文字的強大工具。
有關規則運算式的討論不在本文的討論範圍內。 我們建議使用下列資源:
Replace
搜尋指定值或規則運算式的輸入文字,並將結果取代為新值。
資料清除
資料擷取(有時稱為網頁擷取、資料擷取或網頁收集)是從網站收集資料,並將其儲存在本機資料庫或試算表中的程式。 如果您想從網站刮取資料,但不熟悉規則運算式,則可使用資料刮取工具。
如果資料刮取工具提供REST API,您可以透過我們的通用HTTP模組和Webhooks模組連線到它。
文字剖析器疑難排解
如果您無法取得文字剖析器以產生任何輸出,請使用此資訊。
範例:
模組應剖析檔案檔案「filename.docx」的檔案型別,且檔案名稱的副檔名從DOCX到PDF再到CSV。
您可以在此情況下選擇使用的運算式是..+
此規則運算式通常會產生完全相符的結果。
不過,在文字剖析器中實作此運算式不會產生相符專案:
原因在於「i」僅顯示每個相符項的相符數,因此在此例中,我們有2個相符項,因此「i」後面有一個數值1和2。 此情況下的使用案例是,如果您只需要比對或傳遞資料至篩選器,就可以指定由數值表示的值(第二個相符值)。
為了能夠取得您在要剖析的零件中新增方括弧所需的相符值(例如,從「filename.docx」 — 「docx」中擷取),然後根據我們用於此案例的規則運算式情境,方括弧應套用在\上。(.+)
這會擷取DOCX、將其置於群組中,並保留「」。 盡情享受吧。
在下圖所示的輸出中,擷取群組將符合任何字元(行終止元除外)。
另一個同時納入regex的因應措施是使用取代函式
{{replace("abcdefghijklmno pqr stuvw xyz.docx"; "/.\./"; ".")}}
然後將abcdefghijklmno pqr stuvw xyz.docx
取代為您的實際檔案名稱變數。