从PDF转换成HTML的时候，页面缺少元素

Thu Jun 06, 2024 6:22 am

开发团队：
您好，我使用的是通过pip安装的spire.pdf，然后发现，从PDF转换成HTML的时候，有的文档能够正常转换，有的文档在转换的过程中缺了编辑PDF过程中的东西，下面是转换部分的源码：

Code: Select all: from spire.pdf.common import * from spire.pdf import * import os def converter(filepath,output_dir): doc = PdfDocument() doc.LoadFromFile(filepath) filename = os.path.basename(filepath).split(".")[0] html_filepath = "{}/HTML/{}.html".format(output_dir,filename) doc.SaveToFile(html_filepath,FileFormat.HTML) doc.Close() return html_filepath

以下是两个不同PDF转换结果的案例：

对比.png

左侧红色的PDF转换有问题，而右侧的正常，图中红色涂抹部分是用PDF编辑软件做的

希望知道转换问题的原因和解决方案，谢谢

Thu Jun 06, 2024 6:41 am

您好，

感谢您的咨询。
对于您的问题，需要提供您的文档给我们，以便我们进一步分析。您可以将PDF文件上传到附件中或者发送到此邮件：support@e-iceblue.com。感谢您的配合。

Sincerely,
William
E-iceblue support team

Thu Jun 06, 2024 8:21 am

PDF文件已通过邮箱发送，请查收

Thu Jun 06, 2024 8:58 am

您好，

感谢您的提供的文档。
我这边测试后发现的确有您提到的问题，我已将此问题记录到我们的跟踪系统，编号为SPIREPDF-6817。我们的开发人员会进一步调查解决方案，如果有进展了，我会第一时间通知您。

Sincerely,
William
E-iceblue support team

Thu Jul 11, 2024 1:37 am

您好，

感谢您的耐心等待。
我们最新发布的Spire.PDF for Python版本: 10.7.1修复了问题SPIREPDF-6817，请更新测试。

Sincerely,
William
E-iceblue support team