如何在 Linux 中將 PDF 轉換為文字

一名男士使用 Linux 設備將 PDF 轉換為文本。

想要使用 Linux 裝置編輯 PDF嗎?了解如何使用命令或線上 PDF 編輯器,將 PDF 轉換為文字。

如何使用命令列將 PDF 轉換為文字

只要您相當熟悉如何使用命令列,就可透過這個極具效率的方式來操控 (也就是本例中的轉換) 您的檔案。Linux 使用者能使用 Poppler 工具套件中名為 pdftotext 的命令列公用程式,將 PDF 轉換為純文字格式。只需依照下列步驟,即可達成目的:

  1. 使用 sudo apt install poppler-util 命令,以安裝 Poppler 工具套件。這個命令適用於 Debian、Ubuntu 和 Linux Mint 等散發版本。
  2. 套件安裝完成後,執行第二個命令,將所選檔案轉換為純文字:
    pdftotext -layout input.pdf output.txt
  3. 使用想要轉換的檔案名稱取代 input.pdf,並使用想要附加至新建立文字檔案的名稱取代 output.txt。
  4. 如果沒有選擇儲存位置,新的檔案將自動儲存在與原始 PDF 相同的資料夾內。

若無需進行編輯,且只想複製或搜尋 PDF 中的文字,您可以改為安裝光學字元辨識 (OCR) 工具。Linux OCR PDF 工具可讀取 PDF,並在原始 PDF 上新增可搜尋的文字檔案。這樣一來,您就能使用 Ctrl+F 和 Ctrl+C 等功能來搜尋和複製 PDF 中的文字。

使用線上編輯器將 PDF 轉換為文字

PDF 為最適合共用的檔案格式之一,因此,有時您可能會收到 PDF。如果您收到 PDF,且想要將其轉換為文字檔案,可以透過幾個選項達成此一目的。舉例來說,如果您不熟悉命令公用程式,不妨使用 Adobe Acrobat 線上服務等線上 PDF 編輯器,以省下數星期的學習時間。這些編輯器可將 PDF 輕鬆轉換為 Microsoft Word 等文字格式。

只要透過四個簡單步驟,就能在 Linux 上將 PDF 輕鬆轉換為文字,且無需使用命令或進行下載:

  1. 使用任何瀏覽器,瀏覽至 Acrobat 線上服務的將 PDF 轉換為文字工具。
  2. 上傳要轉換的 PDF 檔案。
  3. 下載新建立的 Microsoft Word DOCX 檔案。
  4. 選取「轉換為 > 檔案名稱.txt」,以另存為 .txt 檔案。

下載 DOCX 檔案後,即可使用 Microsoft Word 加以開啟,並立即著手編輯。

在 Linux 中將文字轉換為 PDF

將文字檔案轉換回 PDF 的最簡單方式之一,就是使用 Linux PDF 印表機。將檔案轉換為 PDF,即可透過保留格式設定來提高其跨裝置可讀性和可共用性。

若要將文字檔案轉換為 PDF,請開啟檔案,並依照下列步驟操作:

  1. 按下 Ctrl+P,以開啟列印對話方塊。
  2. 按一下「一般」索引標籤,然後在「印表機」下方選擇「列印至檔案」。
  3. 選擇檔案名稱和儲存位置。
  4. 選取要轉換為哪個檔案格式,預設檔案類型為 PDF。
  5. 選取任何頁面偏好設定。
  6. 按一下「列印」,以儲存 PDF。

Linux PDF 印表機會將檔案「列印」為 PDF,並將其儲存在所選位置,而非將文件傳送至實體印表機。只要確認選取您可記住的位置和檔案名稱即可。現在,您可以享受將文字檔案轉換回 PDF 格式所帶來的所有便利性。

利用 PDF 完成更多工作

身為 PDF 的發明者,Adobe 不僅打造多項效率十足的工具,更為您的 PDF 創造無限的可能性。PDF 向來以可共用、可列印和易於保護著稱。使用 Adobe 旗下的服務,您就能輕鬆將 PDF 轉換為安全的表格,甚至收集數位簽名。Acrobat 線上服務可讓您與遠端同事一同即時編輯 PDF,並更有效率地並肩合作。Adobe 提供的這些服務,皆隨附出色的技術支援和數位論壇,能協助您探索 PDF 的每一項潛在功能。

歡迎深入探索 Adobe AcrobatAcrobat 線上服務如何讓您透過 Linux 裝置,將 PDF 線上轉換為文字。