c#/vb.net 将pdf转为excel_carina-baby-编程思维

PDF文档可以避免可防⽌他⼈⽆意中触到键盘修改⽂件内容。但是在避免他人⽆意修改的同时也妨碍了正常的修改。如果你想处理或修改PDF文档中的数据,不妨试试用Excel来实现。Excel拥有强大的数据处理功能,丰富的绘制图表功能,丰富的自动化功能。本文将分为两个部分详细为您介绍如何通过C#/VB.NET代码将PDF转为Excel格式。仅需简单几步即可实现此功能,详情请阅读以下内容。

将PDF转为Excel

将多页 PDF 转换为一个 Excel 工作表

类库引入及代码思路

方法 1:

 

在程序中引入 Spire.PDF.dll 文件;将Free Spire.PDF for .NET 下载到本地,解压,找到 BIN 文件夹下的 Spire.PDF.dll。然后在 Visual Studio 中打开“解决方案资源管理器”,鼠标右键点击“引用”,“添加引用”,将本地路径 BIN 文件夹下的 dll 文件添加引用至程序。

 

方法 2:

 

通过 NuGet 安装。可通过以下 2 种方法安装:

 

  1. 可以在 Visual Studio 中打开“解决方案资源管理器”,鼠标右键点击“引用”,“管理 NuGet 包”,然后搜索“Free Spire.PDF”,点击“安装”。等待程序安装完成。

 

  2. 将以下内容复制到 PM 控制台安装。

 

Install-Package FreeSpire.PDF -Version 8.2.0

将PDF转为Excel

具体步骤:

  • 创建 PdfDocument 类的对象。

  • 调用 PdfDocument.LoadFromFile() 方法加载 PDF 文档。

  • 通过 PdfDocument.SaveToFile() 方法保存为Excel文件格式到指定路径。

完整代码:

【C#】

using Spire.Pdf;
using Spire.Pdf.Conversion;

namespace ConvertPdfToExcel
{
    class Program
    {
        static void Main(string[] args)
        {
            //创建 PdfDocument 类的对象
            PdfDocument pdf = new PdfDocument();
            //加载PDF文档
            pdf.LoadFromFile("TableSample2.pdf");

            //保存PDF为XLSX文件
            pdf.SaveToFile("PdfToExcel2.xlsx", FileFormat.XLSX);
        }
    }
}

VB.NET

Imports Spire.Pdf
Imports Spire.Pdf.Conversion

Namespace ConvertPdfToExcel
    
    Class Program
        
        Private Shared Sub Main(ByVal args() As String)
            '创建 PdfDocument 类的对象
            Dim pdf As PdfDocument = New PdfDocument
            '加载PDF文档
            pdf.LoadFromFile("TableSample2.pdf ")
            '保存PDF为XLSX文件
            pdf.SaveToFile("PdfToExcel2.xlsx", FileFormat.XLSX)
        End Sub
    End Class
End Namespace

文档效果:

原文档

输出文档

将多页 PDF 转换为一个 Excel 工作表

下面是将多页 PDF 转换为一个 Excel 工作表的具体步骤:

  • 创建 PdfDocument 类的对象。
  • 调用 PdfDocument.LoadFromFile() 方法加载 PDF 文档。
  • 初始化XlsxLineLayoutOptions 类的一个实例,在类构造函数中,将第一个参数convertToMultipleSheet 设置为 false。
  • 调用PdfDocument.ConvertOptions.SetPdfToXlsxOptions()方法设置PDF转XLSX选项。
  • 用PdfDocument.SaveToFile()方法将PDF保存为Excel文档。

完整代码:

【C#】

using Spire.Pdf;
using Spire.Pdf.Conversion;

namespace ConvertPdfToExcel
{
    class Program
    {
        static void Main(string[] args)
        {
            //创建 PdfDocument 类的对象
            PdfDocument pdf = new PdfDocument();
            //加载PDF文档
            pdf.LoadFromFile("TableSample.pdf");

            //初始化XlsxLineLayoutOptions 类的一个实例,在类构造函数中,将第一个参数convertToMultipleSheet 设置为 false.
            //四个参数分别代表:convertToMultipleSheet、showRotatedText、splitCell、wrapText
            XlsxLineLayoutOptions options = new XlsxLineLayoutOptions(false, true, true, true);
            //设置PDF转XLSX选项
            pdf.ConvertOptions.SetPdfToXlsxOptions(options);

            //保存PDF为Excel文档
            pdf.SaveToFile("PdfToOneExcelSheet.xlsx", FileFormat.XLSX);
        }
    }
}

【VB.NET】

Imports Spire.Pdf
Imports Spire.Pdf.Conversion

Namespace ConvertPdfToExcel
    
    Class Program
        
        Private Shared Sub Main(ByVal args() As String)
            '创建 PdfDocument 类的对象
            Dim pdf As PdfDocument = New PdfDocument

            pdf.LoadFromFile("TableSample.pdf")
            '初始化XlsxLineLayoutOptions 类的一个实例,在类构造函数中,将第一个参数convertToMultipleSheet 设置为 false.
            '四个参数分别代表:convertToMultipleSheet、showRotatedText、splitCell、wrapText          
            Dim options As XlsxLineLayoutOptions = New XlsxLineLayoutOptions(false, true, true, true)
            '设置PDF转XLSX选项
            pdf.ConvertOptions.SetPdfToXlsxOptions(options) 
            '保存PDF为Excel文档
            pdf.SaveToFile("PdfToOneExcelSheet.xlsx", FileFormat.XLSX)
        End Sub
    End Class
End Namespace

 

文档效果:

原文档

输出文档

:测试代码中的文件路径为程序Debug路径,文件路径可自定义为其他路径。

版权声明:本文版权归作者所有,遵循 CC 4.0 BY-SA 许可协议, 转载请注明原文链接
https://www.cnblogs.com/Carina-baby/p/16419432.html

c#/vb.net 使用插件将html转pdf_carina-baby-编程思维

HTML 文件是通常以文件扩展名 .html 或 .htm 保存的网页文档。 由于 PDF 的可移植性和兼容性,将 HTML 内容转换为 PDF 具有许多优势。 由于 PDF 支持范围广泛的图像压缩,即使在一个文件中保存了很多的数据,在硬盘驱动器上也不会占用很多的存储空间。因为即使压缩数据,转换为 PDF 的 HTML

微软外服工作札记②——聊聊微软的知识管理服务平台和一些编程风格-编程思维

微软外服工作札记②聊聊微软的知识管理服务平台和一些编程风格 前言 近期,我参加了微软某部门的知识平台整合工作,正好把微软内部的各个知识管理平台的特点做一个整理,供大家参考。 众所周知,知识管理服务平台其实对任何一家稍有规模的企业都是相当重要的,俗话说铁打的营盘流水的兵,在当今社会,除了在国企,任何一个人都不太可能在一家

.net 应用考虑x64生成_xspringsun-编程思维

在x86架构下使用32位应用程序,理论上32位能够分配4G的大小空间,但实际上默认 .NET Framework 可以创建一个不超过 2 GB 的对象,在实际使用过程中可能使用到1.5G的样子就会报内存溢出异常。 刚写了一个读取数据在内存中组装xml的程序,有10多万条数据,结果程序运行一段时间后就报内存溢出。而我本机

c#/vb.net 给pdf文档添加文本/图像水印_carina-baby-编程思维

当我们在网上共享PDF文件时,重要的是要让屏幕另一侧的人相信发布的信息是正确的。毕竟,任何文件都可以被攻击者截获并进行修改。带有你的标志或特定文本的水印 PDF 将证明文件的真实性,并为将要发送给的每个人证明其安全性。 我们将在本文中详细介绍应用水印PDF的方法。本文将分为三个部分,详细为您介绍如何通过 C#/VB.N

c#/vb.net 使用插件将html转pdf_carina-baby-编程思维

HTML 文件是通常以文件扩展名 .html 或 .htm 保存的网页文档。 由于 PDF 的可移植性和兼容性,将 HTML 内容转换为 PDF 具有许多优势。 由于 PDF 支持范围广泛的图像压缩,即使在一个文件中保存了很多的数据,在硬盘驱动器上也不会占用很多的存储空间。因为即使压缩数据,转换为 PDF 的 HTML

【C#/VB.NET】 将PDF转为SVG/Image, SVG/Image转PDF-编程思维

SVG是一种图形文件格式,它的英文全称为Scalable Vector Graphics,意思为可缩放的矢量图形。它在放大或者改变尺寸的情况下其图形质量不会有所损失,且与 JPG 和 GIF 图像比起来,尺寸更小,且可压缩性更强。本文将介绍如何实现将PDF文档与SVG/Image相互转换的方法。经过综合对比之后,最后筛

Java添加条形码到PDF表格-编程思维

条码的应用已深入生活和工作的方方面面。在处理条码时,常需要和各种文档格式相结合。当需要在文档中插入、编辑或者删除条码时,可借助于一些专业的类库工具来实现。本文,以操作PDF文件为例,介绍如何在编辑表格时,向单元格中添加条形码。     【程序环境】 本次功能测试中,使用 Free Spire.PDF for Java。

c#/vb.net 给pdf文档添加文本/图像水印_carina-baby-编程思维

当我们在网上共享PDF文件时,重要的是要让屏幕另一侧的人相信发布的信息是正确的。毕竟,任何文件都可以被攻击者截获并进行修改。带有你的标志或特定文本的水印 PDF 将证明文件的真实性,并为将要发送给的每个人证明其安全性。 我们将在本文中详细介绍应用水印PDF的方法。本文将分为三个部分,详细为您介绍如何通过 C#/VB.N

java 将rtf转换为pdf格式_carina-baby-编程思维

RTF文件的出色之处在于它的灵活性。RTF文件的性质使其非常适合那些使用不同软件进行工作的人。当然,这并不意味着文件应该永远保存为RTF文件。 有时我们希望将内容“锁定”在RTF文件中,使其无法编辑。那我们只需要将RTF转换为PDF格式即可。本文将为大家演示如何通过Java将RTF转换为 PDF格式。以下是我整理的思路