[英]How to get Pdf Orientation using PyPDF2
我正在使用 Python/Django。
PyPDF2 来阅读我当前的 pdf。
我想阅读我保存的 pdf 并获取 pdf 中单个页面的方向。
我希望能够确定页面是横向还是纵向。
tempoutpdffilelocation = settings.TEMPLATES_ROOT + nameOfFinalPdf
pageOrientation = pageToEdit.mediaBox
pdfOrientation = PdfFileReader(file(temppdffilelocation, "rb"))
# tempPdfOrientationPage = pdfOrientation.getPage(numberOfPageToEdit).mediaBox
print("existing pdf width: ")
# print(existing_pdf.getPage(numberOfPageToEdit).getWidth)
# print("get page size with rotation")
# print(tempPdfOrientationPage.getPageSizeWithRotation)
existing_pdf = pdfOrientation.getPage(numberOfPageToEdit).mediaBox
# print(pageOrientation)
if pageOrientation.getUpperRight_x() - pageOrientation.getUpperLeft_x() > pageOrientation.getUpperRight_y() - pageOrientation.getLowerRight_y():
print('Landscape')
print(pageOrientation)
# print(pdfOrientation.getWidth())
else:
print('Portrait')
print(pageOrientation)
# print(pdfOrientation.getWidth())
# create a new PDF with Reportlab
can = canvas.Canvas(packet, pagesize=letter)
最后一行设置 pagesize=letter 我想根据我当前的 pdf 确定什么。
这是我的进口:
from PyPDF2 import PdfFileWriter, PdfFileReader
from reportlab.pdfgen import canvas
from reportlab.lib.pagesizes import letter, landscape
import urllib
我试过 pyPdf .mediaBox 但它总是返回与预期文件大小相同的值,而不是实际大小。 而且 pyPdf 已经过时了。 如您所见,我也尝试过 getWidth 和 withRotation。
我认为 PyPDF2 PdfFileReader 有一种简单的方法来确定所选对象的方向。
任何帮助表示赞赏。 谢谢。
我简单地使用了页面的“ /Rotate
”属性:
OrientationDegrees = pdf.getPage(numberOfPageToEdit).get('/Rotate')
它可以是0, 90, 180, 270
或None
这个有效,经过全面测试:
import PyPDF2
from PyPDF2 import PdfFileReader
pdf = PdfFileReader(open('YourPDFname.pdf', 'rb'))
page = pdf.getPage(0).mediaBox
if page.getUpperRight_x() - page.getUpperLeft_x() > page.getUpperRight_y() -
page.getLowerRight_y():
print('Landscape')
else:
print('Portrait')
rotate 属性将覆盖 mediaBox 设置。 为了解决这个问题,请在做出最终判断之前检查页面旋转。 请注意,文本也可以旋转。
from PyPDF2 import PdfFileReader
pdf_path = 'yourPDFname.pdf'
pdf_reader = PdfFileReader(pdf_path)
deg = pdf_reader.getPage(0).get('/Rotate')
page = pdf_reader.getPage(0).mediaBox
if page.getUpperRight_x() - page.getUpperLeft_x() > page.getUpperRight_y() -page.getLowerRight_y():
if deg in [0,180,None]:
print('Landscape')
else:
print('Portrait')
else:
if deg in [0,180,None]:
print('Portrait')
else:
print('Landscape')
您可以使用以下代码片段来检测它:
from PyPDF2 import PdfFileReader
pdf = PdfFileReader(file('example.pdf'))
page = pdf.getPage(0).mediaBox
if page.getUpperRight_x() - page.getUpperLeft_x() > page.getUpperRight_y() -
page.getLowerRight_y():
print('Landscape')
else:
print('Portrait')
声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.