如何在 Linux 中將 PDF 轉換為文字
想要使用 Linux 裝置編輯 PDF嗎?了解如何使用命令或線上 PDF 編輯器,將 PDF 轉換為文字。
如何使用命令列將 PDF 轉換為文字
只要您相當熟悉如何使用命令列,就可透過這個極具效率的方式來操控 (也就是本例中的轉換) 您的檔案。Linux 使用者能使用 Poppler 工具套件中名為 pdftotext 的命令列公用程式,將 PDF 轉換為純文字格式。只需依照下列步驟,即可達成目的:
- 使用 sudo apt install poppler-util 命令,以安裝 Poppler 工具套件。這個命令適用於 Debian、Ubuntu 和 Linux Mint 等散發版本。
- 套件安裝完成後,執行第二個命令,將所選檔案轉換為純文字:
pdftotext -layout input.pdf output.txt - 使用想要轉換的檔案名稱取代 input.pdf,並使用想要附加至新建立文字檔案的名稱取代 output.txt。
- 如果沒有選擇儲存位置,新的檔案將自動儲存在與原始 PDF 相同的資料夾內。
若無需進行編輯,且只想複製或搜尋 PDF 中的文字,您可以改為安裝光學字元辨識 (OCR) 工具。Linux OCR PDF 工具可讀取 PDF,並在原始 PDF 上新增可搜尋的文字檔案。這樣一來,您就能使用 Ctrl+F 和 Ctrl+C 等功能來搜尋和複製 PDF 中的文字。
使用線上編輯器將 PDF 轉換為文字
PDF 為最適合共用的檔案格式之一,因此,有時您可能會收到 PDF。如果您收到 PDF,且想要將其轉換為文字檔案,可以透過幾個選項達成此一目的。舉例來說,如果您不熟悉命令公用程式,不妨使用 Adobe Acrobat 線上服務等線上 PDF 編輯器,以省下數星期的學習時間。這些編輯器可將 PDF 輕鬆轉換為 Microsoft Word 等文字格式。
只要透過四個簡單步驟,就能在 Linux 上將 PDF 輕鬆轉換為文字,且無需使用命令或進行下載:
- 使用任何瀏覽器,瀏覽至 Acrobat 線上服務的將 PDF 轉換為文字工具。
- 上傳要轉換的 PDF 檔案。
- 下載新建立的 Microsoft Word DOCX 檔案。
- 選取「轉換為 > 檔案名稱.txt」,以另存為 .txt 檔案。
下載 DOCX 檔案後,即可使用 Microsoft Word 加以開啟,並立即著手編輯。
在 Linux 中將文字轉換為 PDF
將文字檔案轉換回 PDF 的最簡單方式之一,就是使用 Linux PDF 印表機。將檔案轉換為 PDF,即可透過保留格式設定來提高其跨裝置可讀性和可共用性。
若要將文字檔案轉換為 PDF,請開啟檔案,並依照下列步驟操作:
- 按下 Ctrl+P,以開啟列印對話方塊。
- 按一下「一般」索引標籤,然後在「印表機」下方選擇「列印至檔案」。
- 選擇檔案名稱和儲存位置。
- 選取要轉換為哪個檔案格式,預設檔案類型為 PDF。
- 選取任何頁面偏好設定。
- 按一下「列印」,以儲存 PDF。
Linux PDF 印表機會將檔案「列印」為 PDF,並將其儲存在所選位置,而非將文件傳送至實體印表機。只要確認選取您可記住的位置和檔案名稱即可。現在,您可以享受將文字檔案轉換回 PDF 格式所帶來的所有便利性。
利用 PDF 完成更多工作
身為 PDF 的發明者,Adobe 不僅打造多項效率十足的工具,更為您的 PDF 創造無限的可能性。PDF 向來以可共用、可列印和易於保護著稱。使用 Adobe 旗下的服務,您就能輕鬆將 PDF 轉換為安全的表格,甚至收集數位簽名。Acrobat 線上服務可讓您與遠端同事一同即時編輯 PDF,並更有效率地並肩合作。Adobe 提供的這些服務,皆隨附出色的技術支援和數位論壇,能協助您探索 PDF 的每一項潛在功能。
歡迎深入探索 Adobe Acrobat 和 Acrobat 線上服務如何讓您透過 Linux 裝置,將 PDF 線上轉換為文字。