メインコンテンツまでスキップ

PDFからデータをスプレッドシートに抽出

テンプレートの概要

項目説明
カテゴリ📄 ドキュメント処理 · 📊 データ処理
連携サービスGoogle Drive、Google Sheets
難易度⭐⭐ 中級
作成者n8n 公式チーム

動作の仕組み

このワークフローは、Google Drive の指定フォルダに新しく追加されたPDFファイルを自動的に監視します。請求書、契約書、レポートなどのPDFがアップロードされると、ワークフローはPDF内のテキストを抽出し、正規表現またはAIを使って重要な構造化データ(請求書番号、金額、日付、顧客名など)を解析・取得します。その後、これらのデータを自動的にGoogle Sheetsの指定シートに新しい行として追加します。

主な機能

  • 自動監視 — Google Driveフォルダ内の新しいPDFファイルを監視
  • テキスト抽出 — PDFから全文テキストを抽出
  • 構造化解析 — 金額、日付、番号などの重要なフィールドを識別・抽出
  • スプレッドシートへの書き込み — 抽出したデータをGoogle Sheetsに自動的に追加

ワークフローのノード構成

Google Drive Trigger (新しいファイル) → Read Binary File (PDFを読み込み)
→ Extract Document Text (テキスト抽出)
→ Code (構造化データの解析)
→ Google Sheets (書き込み)

利用手順

  1. テンプレートのインポート — n8nでこのワークフローテンプレートをインポート
  2. Google Driveの設定 — 認証を行い、監視対象のPDFフォルダを選択
  3. Google Sheetsの設定 — 保存先のスプレッドシートを選択または作成し、列見出しを設定
  4. 解析ルールの調整 — 自分のPDF形式に合わせて、抽出フィールドや正規表現を修正
  5. 有効化とテスト — テスト用PDFをアップロードし、データ抽出の正確性を確認

活用シーン

  • 🧾 請求書の自動入力
  • 📋 契約書の重要情報アーカイブ
  • 📊 月次レポートのデータ集計
  • 🏦 銀行取引明細の自動処理

関連ドキュメント


💡 動作要件:n8n バージョン1.0.0以上が必要です

👉 n8nでこのテンプレートをインポート