PDFからデータをスプレッドシートに抽出
テンプレートの概要
| 項目 | 説明 |
|---|---|
| カテゴリ | 📄 ドキュメント処理 · 📊 データ処理 |
| 連携サービス | Google Drive、Google Sheets |
| 難易度 | ⭐⭐ 中級 |
| 作成者 | n8n 公式チーム |
動作の仕組み
このワークフローは、Google Drive の指定フォルダに新しく追加されたPDFファイルを自動的に監視します。請求書、契約書、レポートなどのPDFがアップロードされると、ワークフローはPDF内のテキストを抽出し、正規表現またはAIを使って重要な構造化データ(請求書番号、金額、日付、顧客名など)を解析・取得します。その後、これらのデータを自動的にGoogle Sheetsの指定シートに新しい行として追加します。
主な機能
- 自動監視 — Google Driveフォルダ内の新しいPDFファイルを監視
- テキスト抽出 — PDFから全文テキストを抽出
- 構造化解析 — 金額、日付、番号などの重要なフィールドを識別・抽出
- スプレッドシートへの書き込み — 抽出したデータをGoogle Sheetsに自動的に追加
ワークフローのノード構成
Google Drive Trigger (新しいファイル) → Read Binary File (PDFを読み込み)
→ Extract Document Text (テキスト抽出)
→ Code (構造化データの解析)
→ Google Sheets (書き込み)
利用手順
- テンプレートのインポート — n8nでこのワークフローテンプレートをインポート
- Google Driveの設定 — 認証を行い、監視対象のPDFフォルダを選択
- Google Sheetsの設定 — 保存先のスプレッドシートを選択または作成し、列見出しを設定
- 解析ルールの調整 — 自分のPDF形式に合わせて、抽出フィールドや正規表現を修正
- 有効化とテスト — テスト用PDFをアップロードし、データ抽出の正確性を確認
活用シーン
- 🧾 請求書の自動入力
- 📋 契約書の重要情報アーカイブ
- 📊 月次レポートのデータ集計
- 🏦 銀行取引明細の自動処理
関連ドキュメント
💡 動作要件:n8n バージョン1.0.0以上が必要です