Insight to Ptofitc [python 실무] PDF 이미지(PNG)로 전환 - 1초컷

[python 실무] PDF 이미지(PNG)로 전환 - 1초컷

2024. 7. 11. 10:081. Data Analyst/1-1. Python

728x90
반응형

 
 
 
오늘은 Python을 활용하여 PDF 파일을 PNG 이미지로 변환하는 방법에 대해 알려드릴게요.
PDF 파일을 이미지로 변환하는 과정은 종종 필요한 작업이며, 특히 문서의 각 페이지를 이미지로 추출할 때 유용합니다.
 
 
 

1. 패키지설치 : PyMuPDF

먼저, 아래의 패키지를 설치해야 합니다. 이 패키지는 PDF 파일을 다루는 데 필요합니다.

!pip install PyMuPDF

 
 
 
 
 
 
 
 
 
이제 Python 코드를 작성해보겠습니다.
아래 코드는 PyMuPDF를 사용하여 PDF 파일을 PNG 이미지로 변환하는 방법을 보여줍니다.

 





2. Python 코드 작성하기

패키지 불러오기

import fitz

 
import fitz: PyMuPDF의 fitz 모듈을 사용합니다. 이 모듈은 PDF 파일을 다루는 데 필요합니다.
 
 
 
 
 

PDF -> PNG 변환 함수 생성

def pdf_to_png(pdf_file_path, output_folder):
    # PDF 파일 열기
    doc = fitz.open(pdf_file_path)
    
    # 각 페이지를 이미지로 변환하여 저장
    for i, page in enumerate(doc):
        # 페이지의 pixmap 가져오기
        img = page.get_pixmap()
        
        # PNG 파일로 저장 (파일명 예시: SALES_0.png, SALES_1.png, ...)
        img.save(f"{output_folder}/SALES_{i}.png")
    
    # 작업 완료 후, 문서 닫기
    doc.close()

 
pdf_to_png 함수: 이 함수는 주어진 PDF 파일을 PNG 이미지로 변환하여 출력 폴더에 저장합니다. 함수는 다음과 같은 작업을 수행합니다:

  • PDF 파일을 엽니다 (fitz.open(pdf_file_path)).
  • 각 페이지를 이미지로 변환하여 저장합니다. 각 페이지는 SALES_0.png, SALES_1.png, ... 와 같은 형식으로 파일명이 지정됩니다.
  • 마지막으로 문서를 닫습니다 (doc.close()).

 
 
 
 
 

변환할 파일 불러오기

# PDF 파일 경로와 출력 폴더 지정
PDF_FILE_PATH = '/Users/Desktop/REPORT/0. SALES/ Salesreport.pdf'
OUTPUT_FOLDER = '/Users/Desktop/REPORT/0. SALES/'


# PDF를 PNG로 변환하는 함수 호출
pdf_to_png(PDF_FILE_PATH, OUTPUT_FOLDER)

 
 
이제 위의 코드를 실행하면 지정된 PDF 파일의 각 페이지가 PNG 이미지로 변환되어 출력 폴더에 저장됩니다.
이 방법을 사용하면 문서의 각 페이지를 이미지로 추출할 수 있어서,
예를 들어 보고서 작성이나 문서 검토 시에 유용하게 활용할 수 있습니다.
 
 
 
 
 
 
 
 

3.  결과확인

 
 
원래 오리지널 pdf파일이 위와 같이 순서대로 PNG파일로 자동변환 저장되었습니다!
 
 
 
 
 
 
오늘은 간단하고 유용한 Python 코드를 통해 PDF를 PNG 이미지로 변환하는 방법을 소개드렸습니다.
언제든지 이 방법을 활용하여 원하는 작업을 해보세요!
 
 
파이썬으로 만들고자 하는 기능 혹은 궁금한 점이 있다면 언제든 댓글로 남겨주세요~!
 
 
 
 
 
 
 

728x90
반응형