본문으로 건너뛰기

PDF에서 데이터 추출해 스프레드시트에 저장하기

템플릿 개요

항목설명
분류📄 문서 처리 · 📊 데이터 처리
연동 서비스Google Drive, Google Sheets
난이도⭐⭐ 중급
작성자n8n 공식 팀

작동 방식

이 워크플로는 Google Drive의 지정된 폴더에 새 PDF 파일이 업로드되면 자동으로 모니터링합니다. 송장, 계약서 또는 보고서와 같은 새로운 PDF가 업로드되면, 워크플로는 해당 PDF에서 텍스트를 추출한 후 정규 표현식 또는 AI를 사용해 구조화된 핵심 데이터(예: 송장 번호, 금액, 날짜, 고객명 등)를 파싱하고, 이를 자동으로 Google Sheets의 지정된 시트에 추가합니다.

핵심 기능

  • 자동 모니터링 — Google Drive 폴더 내의 새 PDF 파일을 감시
  • 텍스트 추출 — PDF 전체 텍스트 내용 추출
  • 구조화된 데이터 파싱 — 금액, 날짜, 문서 번호 등 핵심 필드 식별 및 추출
  • 스프레드시트 입력 — 추출된 데이터를 Google Sheets에 자동으로 추가

워크플로 노드 구성

Google Drive Trigger (새 파일) → Read Binary File (PDF 읽기)
→ Extract Document Text (텍스트 추출)
→ Code (구조화된 데이터 파싱)
→ Google Sheets (데이터 입력)

사용 방법

  1. 템플릿 가져오기 — n8n에서 이 워크플로 템플릿을 가져옵니다.
  2. Google Drive 설정 — 인증 후 모니터링할 PDF 폴더를 선택합니다.
  3. Google Sheets 설정 — 대상 스프레드시트를 선택하거나 새로 생성하고 열 헤더를 미리 설정합니다.
  4. 데이터 추출 규칙 수정 — 사용자의 PDF 형식에 맞게 추출 필드와 정규 표현식을 수정합니다.
  5. 활성화 및 테스트 — 테스트용 PDF를 업로드하여 데이터 추출 정확도를 확인합니다.

사용 사례

  • 🧾 재무 송장 자동 입력
  • 📋 계약서 핵심 정보 아카이빙
  • 📊 월간 보고서 데이터 집계
  • 🏦 은행 명세서 자동 처리

관련 문서


💡 사용 요구사항: n8n 1.0.0 이상 버전 필요

👉 n8n에서 템플릿 바로 가져오기