pdf 모듈

ufp.pdf.toBmp(pdf, format=u'bmp32b', dpi=200)

pdf 파일을 bmp로 바꾸어 저장합니다.

다음과 같은 식으로 사용합니다.

import pyPdf
from io import BytesIO
import ufp.pdf

#PDF 파일을 준비
buffer = file(srcPath, 'rb')
pdf = pyPdf.PdfFileReader(buffer)

#각 페이지 마다
for pageNumber in xrange(pdf.getNumPages()):
        #현재 페이지의 pdf 데이터를 추출
        page = pdf.getPage(pageNumber)
        pdfFileWriter = pyPdf.PdfFileWriter()
        pdfFileWriter.addPage(page)
        with BytesIO() as outputStream:
                pdfFileWriter.write(outputStream)
                pageBinary = outputStream.getvalue()
                pass
        
        #PDF를 BMP(24-bit RGB Color)로 변환
        imageBinary = ufp.pdf.toBmp(pageBinary, format='bmp16m', dpi=200)
        
        #저장
        with open('{0}.bmp'.format(pageNumber), 'w') as f:
                f.write(imageBinary)
        pass
매개 변수:
  • pdf (bytes) – pdf 바이너리 데이터. 오직 1 페이지만 존재하는 pdf 데이터여야 합니다.
  • format (unicode) –

    출력 포멧.

    bmp16m: 24-bit RGB Color

    bmpmono: Black-and-White Color

    bmpgray: Grayscale Color

    bmpsep1:

    bmpsep8:

    bmp16: 4-bit Color

    bmp256: 8-bit Color

    bmp32b: 32-bit RGBA Color

  • dpi (int) – DPI. 기본값은 200DPI입니다. 양의 정수만을 취합니다.
예외 Exception:

pdf 변환에 문제가 발생했을때.

반환:

BMP 이미지 바이너리 데이터

반환 형식:

bytes

ufp.pdf.toBmps(pdf, format=u'bmp16m', dpi=200)

pdf 파일을 bmp로 바꾸어 저장합니다.

각 페이지의 bmp는 제너레이터 형식으로 각각 반환됩니다. 예를 들어 다음과 같이 작동합니다.

import ufp.pdf

with open('test.pdf', 'r') as f:
        pdf = f.read()

buffer = ufp.pdf.toBmps(pdf, format='bmp16m')
for page, bmp in enumerate(buffer, start=1):
        with open('{0}.bmp'.format(page), 'w') as f:
                f.write(bmp)
매개 변수:
  • pdf (bytes) – pdf 바이너리 데이터. 여러 페이지가 포함된 파일도 허용합니다.
  • format (unicode) –

    출력 포멧.

    bmp16m: 24-bit RGB Color

    bmpmono: Black-and-White Color

    bmpgray: Grayscale Color

    bmpsep1:

    bmpsep8:

    bmp16: 4-bit Color

    bmp256: 8-bit Color

    bmp32b: 32-bit RGBA Color

  • dpi (int) – DPI. 기본값은 200DPI입니다. 양의 정수만을 취합니다.
예외 Exception:

pdf 변환에 문제가 발생했을때.

Yield:

BMP 이미지 바이너리 데이터(bytes)