LinuxでPDFをテキストに変換する方法

LinuxデバイスからPDFを編集したい場合コマンドまたはオンラインPDFエディターを使用してPDFをテキストに変換する方法を説明します。

PDFをコマンドラインでテキストに変換する方法

Linuxユーザーは、pdftotextと呼ばれる、ポップラーツールパッケージの一部であるコマンドラインユーティリティを使用して、PDFをプレーンテキスト形式に変換できます。

最初に、popplerツールをインストールして、「sudo apt install poppler-utils」コマンドをパッケージ化します。このコマンドはDebian、Ubuntu、Linux Mintディストリビューションで動作します。パッケージがインストールされたら、2番目のコマンドを実行して、選択したファイルをプレーンテキストに変換します。

pdftotext -layout input.pdf output.txt

input.pdfを変換するファイルの名前、output.txtを新しく作成したテキストファイルに付けたい名前に置き換えます。保存場所を選択しない場合、新しいファイルは元のPDFと同じフォルダに自動的に保存されます。

編集が不要で、PDF内のテキストをコピーや検索したいだけの場合は、代わりに光学式文字認識(OCR)ツールをインストールできます。Linux OCR PDFツールはPDFを読み、元のPDFに検索可能なテキストファイルを追加します。この方法では、Ctrl+FやCtrl+Cなどの機能を使用して、PDF内のテキストを検索し、コピーできます。

オンラインPDFエディターを使用します。

コマンドユーティリティの使い心地が悪い場合と感じるは、Adobe AcrobatオンラインサービスなどのオンラインPDFエディターを使用すると、PDFをMicrosoft Wordのようなテキスト形式に変換するのも簡単です。

コマンドやダウンロードを行わずに、PDFをLinux上のテキストに簡単に変換するには、次の3つのステップに従います。

  1. AcrobatオンラインPDFエディターに移動します。
  2. 変換したいPDFファイルをクリックします。
  3. エディターによるファイルの変換が完了するのを待ちます。
  4. 新しく作成したMicrosoft Word DOCXファイルをダウンロードします。

DOCXファイルをダウンロードしたら、Microsoft Wordを使用して開き、すぐに編集を開始できます。

**Adobe AcrobatAcrobatオンラインサービス**を使用すると、PDFをLinuxデバイスからオンラインのテキストに簡単に変換できます。