pdf
모듈¶
-
ufp.pdf.
toBmp
(pdf, format=u'bmp32b', dpi=200)¶ pdf 파일을 bmp로 바꾸어 저장합니다.
다음과 같은 식으로 사용합니다.
import pyPdf from io import BytesIO import ufp.pdf #PDF 파일을 준비 buffer = file(srcPath, 'rb') pdf = pyPdf.PdfFileReader(buffer) #각 페이지 마다 for pageNumber in xrange(pdf.getNumPages()): #현재 페이지의 pdf 데이터를 추출 page = pdf.getPage(pageNumber) pdfFileWriter = pyPdf.PdfFileWriter() pdfFileWriter.addPage(page) with BytesIO() as outputStream: pdfFileWriter.write(outputStream) pageBinary = outputStream.getvalue() pass #PDF를 BMP(24-bit RGB Color)로 변환 imageBinary = ufp.pdf.toBmp(pageBinary, format='bmp16m', dpi=200) #저장 with open('{0}.bmp'.format(pageNumber), 'w') as f: f.write(imageBinary) pass
매개 변수: - pdf (bytes) – pdf 바이너리 데이터. 오직 1 페이지만 존재하는 pdf 데이터여야 합니다.
- format (unicode) –
출력 포멧.
bmp16m: 24-bit RGB Color
bmpmono: Black-and-White Color
bmpgray: Grayscale Color
bmpsep1:
bmpsep8:
bmp16: 4-bit Color
bmp256: 8-bit Color
bmp32b: 32-bit RGBA Color
- dpi (int) – DPI. 기본값은 200DPI입니다. 양의 정수만을 취합니다.
예외 Exception: pdf 변환에 문제가 발생했을때.
반환: BMP 이미지 바이너리 데이터
반환 형식:
-
ufp.pdf.
toBmps
(pdf, format=u'bmp16m', dpi=200)¶ pdf 파일을 bmp로 바꾸어 저장합니다.
각 페이지의 bmp는 제너레이터 형식으로 각각 반환됩니다. 예를 들어 다음과 같이 작동합니다.
import ufp.pdf with open('test.pdf', 'r') as f: pdf = f.read() buffer = ufp.pdf.toBmps(pdf, format='bmp16m') for page, bmp in enumerate(buffer, start=1): with open('{0}.bmp'.format(page), 'w') as f: f.write(bmp)
매개 변수: - pdf (bytes) – pdf 바이너리 데이터. 여러 페이지가 포함된 파일도 허용합니다.
- format (unicode) –
출력 포멧.
bmp16m: 24-bit RGB Color
bmpmono: Black-and-White Color
bmpgray: Grayscale Color
bmpsep1:
bmpsep8:
bmp16: 4-bit Color
bmp256: 8-bit Color
bmp32b: 32-bit RGBA Color
- dpi (int) – DPI. 기본값은 200DPI입니다. 양의 정수만을 취합니다.
예외 Exception: pdf 변환에 문제가 발생했을때.
Yield: BMP 이미지 바이너리 데이터(bytes)