微軟的新技術將不可編輯的 PDF 轉換為可編輯的文檔,同時保留其原始佈局和設計

微軟的新技術將不可編輯的 PDF 轉換為可編輯的文檔,同時保留其原始佈局和設計

每個人都希望將不可編輯的 PDF 盡可能無縫地轉換為可編輯文檔,但目前市場上沒有一款轉換器可以將 PDF(或任何其他文檔)轉換為可編輯文件,同時保留其原始佈局。

微軟知道這一點,因此這家總部位於雷德蒙德的科技巨頭一直在研究一種技術來實現這一點:將不可編輯的文檔轉換為可編輯的文檔,同時保留其所有原始方面,包括字體、顏色、佈局和圖像等視覺元素不同格式的。

該公司最近發表了一篇論文,描述了該技術的系統和方法。它被建議稱為從不可編輯文檔生成可編輯文檔的方法和系統,並且它使用人工智慧等來保持文檔的原始元素完整。

系統檢視不可編輯的文件並計算出各種元素(如文字、圖像和表格)的排列,並使用邊界框確定這些元素的位置和大小。

系統識別不可編輯文件中文字中使用的字體,然後使用人工智慧模型根據原始文件中使用的顏色選擇配色方案。

系統使用識別的版面配置、字體和配色方案來建立新的可編輯文件。這個新文件保留了原始不可編輯文件的外觀和風格,但允許編輯。

    該技術將不可編輯的 PDF 轉換為可編輯的文檔,同時保留其原始元素,但它還允許調整它們的大小,同時保持所有內容完好無損。

    由於各種原因,該技術將改變遊戲規則。它允許更快的轉換,而不必擔心錯位的部分或錯誤的字體。儘管目前市場上有數十種 PDF 轉換器(我們甚至為您提供了一些建議),但沒有一個能夠真正將不可編輯的文檔轉換為可編輯的文檔,同時保持其完整。

    此外,該技術的創新在於其大小調整和視覺保留,這在某些情況下非常有用,從保存和編輯存檔文件到賦予舊文件新的生命。

    可以在此處閱讀論文。

    在一些實施方式中,該技術解決方案還透過以保留文件中的各種元素的縱橫比的方式保留調整文件大小來提供可編輯文件的自動調整大小。

    如本文所使用的,術語「不可編輯文檔」是指無法透過文字處理、簡報或設計建立應用程式進行編輯的電子文檔。不可編輯文件的範例包括圖像(例如,jpeg、GIF、PNG 等)和 PDF 文件。

    發佈留言

    發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *