• 목록
  • 아래로
  • 위로

PDF를 이미지 파일로 변경하는 모듈이 여러가지가 있지만 PDF2Image가 가장 널리 사용되는 것 같더군요 ^^

 

images = convert_from_path('/home/belval/example.pdf')

 

또는

 

images = convert_from_bytes(open('/home/belval/example.pdf', 'rb').read())

 

위와 같이 사용이 가능합니다.

 

 

 

아래와 같은 다양한 옵션이 가능합니다 ^^

 

convert_from_path(pdf_path, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

convert_from_bytes(pdf_file, dpi=200, output_folder=None, first_page=None, last_page=None, fmt='ppm', jpegopt=None, thread_count=1, userpw=None, use_cropbox=False, strict=False, transparent=False, single_file=False, output_file=str(uuid.uuid4()), poppler_path=None, grayscale=False, size=None, paths_only=False, use_pdftocairo=False)

 

 

파일 저장은 다음과 같이 할 수 있습니다.

 

for idx, img in enumerate(images):
    img.save('pdf_' + str(idx).zfill(len(str(len(images)))) + '.jpg', 'JPEG') # pdf_넘버링.jpg 이런 방식으로 네이밍을 합니다.

 

 

+)

Poppler를 설치해야 이 모듈을 제대로 사용할 수 있어요.

설치방법은 공홈에 있어요 ^^

설치 후에 poppler_path = '경로' 이런 방식으로 지정해줘야 되어요!

 

A python module that wraps the pdftoppm utility to convert PDF to PIL Image object - Belval/pdf2image

 

https://github.com/Belval/pdf2image

작성자
이니스프리 119 Lv. (1%) 2510210/115200000EXP

Make StudyForUs Great Again!

 

CSVpuymXAAAVVpd.jpg

댓글 0

권한이 없습니다.
번호 제목 글쓴이 날짜 조회 수
공지 [1차 해결 및 추가] 서버 접속 불가 문제 안내 11 마스터 마스터 5일 전15:22 183
공지 [작업 완료] 설 명절 맞이 서버 업데이트 안내 3 마스터 마스터 24.02.11.17:21 2250
공지 [중요] 호스팅 만료와 관련하여 일부 수칙이 변경됩니다. 4 마스터 마스터 23.01.14.02:23 5931
156 [할인정보] KFC 타워버거 2,900원! 4 image 이니스프리 이니스프리 17.02.11.23:20 221
155 [Python] 디렉토리 내 0바이트 파일 찾기 이니스프리 이니스프리 20.10.11.11:19 221
154 BeautifulSoup에서 로딩한 html이 짤리는 경우에 해결방법 image 이니스프리 이니스프리 19.12.19.21:57 221
153 [할인정보] 크록스 50~75% 할인 이벤트 3 image 이니스프리 이니스프리 17.02.20.00:52 220
152 [Python] COS Pro 1급 5-9 풀이 이니스프리 이니스프리 20.02.16.00:34 220
151 [할인정보] 버거킹에서 현재 진행 중인 각종 이벤트! image 이니스프리 이니스프리 17.01.16.11:29 220
150 [아미나] 한별아빠 님의 미소 심플 1.0 테마 출시, 미소 컴퍼니 2.2 테마 업그레이드, jake 님의 PORTFOLIO 테마 출시 5 이니스프리 이니스프리 19.02.01.00:46 220
149 [파이썬] random.randint()에서 주의할 점 이니스프리 이니스프리 20.01.13.00:49 220
148 [강좌 추천] 파이썬을 파이썬답게 7 이니스프리 이니스프리 19.02.01.12:20 219
147 일본 배대지 휴무 - 골든위크 관련 이니스프리 이니스프리 19.04.21.21:22 218
146 이것 7가지 지키면 미세먼지 노출 줄일 수 있다! image 오후두시스토리 오후두시스토.. 17.04.06.11:12 218
145 만년필 잉크를 직구할 때에는 온도와 관련된 문제를 주의하세요 이니스프리 이니스프리 19.07.01.07:19 217
144 [Python] Instalooter 에러 발생 시 대처법 1 이니스프리 이니스프리 21.01.31.13:37 216
143 [할인정보] 콰트로치즈와퍼주니어 44% 할인 + 오리지널 또는 골드 치킨프라이 50% 할인 3 image 이니스프리 이니스프리 17.03.13.12:18 216
142 hosting.kr 개인정보 보호 서비스 image 이니스프리 이니스프리 21.09.20.10:46 215
141 [Python] Ordered Set 이니스프리 이니스프리 23.09.19.20:24 214
140 [Matplotlib] X축 눈금 레이블 텍스트를 회전시키는 방법 이니스프리 이니스프리 22.07.18.21:05 208
139 [Python] 네이버 블로그 크롤링할 때 PostList.nhn 관련 팁 (문자열에서 첫번째 행을 제거하기) 이니스프리 이니스프리 20.11.08.18:16 206
138 [디지털 포렌식 전문가] 제21회 실기 시험 일정 image 이니스프리 이니스프리 23.10.29.01:39 204
137 [Python] 확장자를 지정할 수 있는 백업 스크립트 이니스프리 이니스프리 20.05.13.21:58 204