2024. 7. 11. 10:08ㆍ1. Data Analyst/1-1. Python
오늘은 Python을 활용하여 PDF 파일을 PNG 이미지로 변환하는 방법에 대해 알려드릴게요.
PDF 파일을 이미지로 변환하는 과정은 종종 필요한 작업이며, 특히 문서의 각 페이지를 이미지로 추출할 때 유용합니다.
1. 패키지설치 : PyMuPDF
먼저, 아래의 패키지를 설치해야 합니다. 이 패키지는 PDF 파일을 다루는 데 필요합니다.
!pip install PyMuPDF
이제 Python 코드를 작성해보겠습니다.
아래 코드는 PyMuPDF를 사용하여 PDF 파일을 PNG 이미지로 변환하는 방법을 보여줍니다.
2. Python 코드 작성하기
패키지 불러오기
import fitz
import fitz: PyMuPDF의 fitz 모듈을 사용합니다. 이 모듈은 PDF 파일을 다루는 데 필요합니다.
PDF -> PNG 변환 함수 생성
def pdf_to_png(pdf_file_path, output_folder):
# PDF 파일 열기
doc = fitz.open(pdf_file_path)
# 각 페이지를 이미지로 변환하여 저장
for i, page in enumerate(doc):
# 페이지의 pixmap 가져오기
img = page.get_pixmap()
# PNG 파일로 저장 (파일명 예시: SALES_0.png, SALES_1.png, ...)
img.save(f"{output_folder}/SALES_{i}.png")
# 작업 완료 후, 문서 닫기
doc.close()
pdf_to_png 함수: 이 함수는 주어진 PDF 파일을 PNG 이미지로 변환하여 출력 폴더에 저장합니다. 함수는 다음과 같은 작업을 수행합니다:
- PDF 파일을 엽니다 (fitz.open(pdf_file_path)).
- 각 페이지를 이미지로 변환하여 저장합니다. 각 페이지는 SALES_0.png, SALES_1.png, ... 와 같은 형식으로 파일명이 지정됩니다.
- 마지막으로 문서를 닫습니다 (doc.close()).
변환할 파일 불러오기
# PDF 파일 경로와 출력 폴더 지정
PDF_FILE_PATH = '/Users/Desktop/REPORT/0. SALES/ Salesreport.pdf'
OUTPUT_FOLDER = '/Users/Desktop/REPORT/0. SALES/'
# PDF를 PNG로 변환하는 함수 호출
pdf_to_png(PDF_FILE_PATH, OUTPUT_FOLDER)
이제 위의 코드를 실행하면 지정된 PDF 파일의 각 페이지가 PNG 이미지로 변환되어 출력 폴더에 저장됩니다.
이 방법을 사용하면 문서의 각 페이지를 이미지로 추출할 수 있어서,
예를 들어 보고서 작성이나 문서 검토 시에 유용하게 활용할 수 있습니다.
3. 결과확인
원래 오리지널 pdf파일이 위와 같이 순서대로 PNG파일로 자동변환 저장되었습니다!
오늘은 간단하고 유용한 Python 코드를 통해 PDF를 PNG 이미지로 변환하는 방법을 소개드렸습니다.
언제든지 이 방법을 활용하여 원하는 작업을 해보세요!
파이썬으로 만들고자 하는 기능 혹은 궁금한 점이 있다면 언제든 댓글로 남겨주세요~!
'1. Data Analyst > 1-1. Python' 카테고리의 다른 글
실무에서 유용한 Pandas 문자열 관련 메서드 10가지와 사용 예시 (0) | 2024.09.20 |
---|---|
Python 실무 - 파이썬 그룹 기준으로 데이터 통일하기 (0) | 2024.08.30 |
[Python 실무] 하위컬럼 불러오기 (0) | 2024.06.29 |
[아나콘다 에러] There is an instance of anaconda navigator already running error 1초만에 해결하기 (0) | 2024.06.21 |
[Python 실무] 파이썬 날짜 년/월/일/시간/분/초로 변환하기 - 1초컷 (0) | 2024.06.20 |