簡體   English   中英

如何判斷 PDF 文本是否已旋轉

[英]how to tell if PDF text has been rotated

我正在嘗試使用 iText7 從 PDF 中提取文本。 我正在使用 IEventListener 來獲取頁面的所有部分,盡管某些文本是旋轉的。 我可以找到有關如何將旋轉文本插入 PDF 的示例,但找不到任何關於如何判斷給定文本段是否旋轉的信息。

任何人都可以幫忙嗎?

public void EventOccurred(IEventData data, EventType type)
{
    PdfPart part = null;

    switch (type)
    {
        case EventType.BEGIN_TEXT:
            break;
        case EventType.RENDER_TEXT:
            part = new PdfTextPart(PageNumber, data as TextRenderInfo);
            Parts.Add(part);
            break;
        case EventType.END_TEXT:
            break;
        case EventType.RENDER_IMAGE:
            var imageData = data as ImageRenderInfo;
            //this.HandleImage(imageData);
            break;
        case EventType.RENDER_PATH:
            part = new PdfLinePart(PageNumber, data as PathRenderInfo);
            Parts.Add(part);
            break;
        case EventType.CLIP_PATH_CHANGED:
            break;
        default:
            break;
    }
}
public PdfTextPart(Int32 pageNumber, TextRenderInfo info) : base(pageNumber)
{
    Text = info.GetText();

    var font = info.GetFont().GetFontProgram().GetFontNames();
    Font = font.GetFontName();

    if (font.IsItalic()) { this.IsItalic = true; }
    if (font.IsBold()) { this.IsBold = true; }
    if (font.IsUnderline()) { this.IsUnderline = true; }
}

TextRenderInfo有一個基線。 該基線是LineSegment ,因此具有起點和終點。 現在你只需要確定這兩點之間的線的角度。

TextRenderInfo info

LineSegment baseline = info.GetBaseline();
Vector startPoint = baseline.GetStartPoint();
Vector endPoint = baseline.GetEndPoint();
Vector direction = endLocation.Subtract(startLocation);
double angle = Math.Atan2(direction.Get(Vector.I2), direction.Get(Vector.I1));

結果顯然是以弧度為單位的。

您可能還必須考慮頁面旋轉(如果我沒記錯的話)沒有計算到上面的坐標中。

暫無
暫無

聲明:本站的技術帖子網頁,遵循CC BY-SA 4.0協議,如果您需要轉載,請注明本站網址或者原文地址。任何問題請咨詢:yoyou2525@163.com.

 
粵ICP備18138465號  © 2020-2024 STACKOOM.COM