整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

5-LINUX HTML 转 PDF-selenium

tml2pdf

selenium

Selenium 通过使用 WebDriver 支持市场上所有主流浏览器的自动化。 Webdriver 是一个 API 和协议,它定义了一个语言中立的接口,用于控制 web 浏览器的行为。 每个浏览器都有一个特定的 WebDriver 实现,称为驱动程序。 驱动程序是负责委派给浏览器的组件,并处理与 Selenium 和浏览器之间的通信。

这种分离是有意识地努力让浏览器供应商为其浏览器的实现负责的一部分。 Selenium 在可能的情况下使用这些第三方驱动程序, 但是在这些驱动程序不存在的情况下,它也提供了由项目自己维护的驱动程序。

Selenium 框架通过一个面向用户的界面将所有这些部分连接在一起, 该界面允许透明地使用不同的浏览器后端, 从而实现跨浏览器和跨平台自动化。

selenium 驱动

# selenium 驱动
https://selenium-python.readthedocs.io/installation.html#drivers
https://selenium-python.readthedocs.io/api.html

selenium-java

主要依赖

        <dependency>
            <groupId>org.seleniumhq.selenium</groupId>
            <artifactId>selenium-java</artifactId>
            <version>4.16.1</version>
        </dependency>

测试代码

        // 获取 java 版本
        String version = System.getProperty("java.specification.version");

        // 获取系统类型
        String platform = System.getProperty("os.name", "");
        platform = platform.toLowerCase().contains("window") ? "win" : "linux";

        // 当前程序目录
        String current = System.getProperty("user.dir");

        System.out.println("current:" + current);

        // firefox 运行参数配置
        FirefoxOptions options = new FirefoxOptions();
        // 无头模式
        options.addArguments("--headless");
        // 最大化
        options.addArguments("--start-maximized");

        FirefoxDriver browser = new FirefoxDriver(options);

        Path url = Paths.get(current, "..", "index.html");
        System.out.println("url:" + url.toString());

        // NOTE 要使用 file 协议
        browser.get(String.format("file://%s", url.toString()));

        // 打印设置
        PrintOptions print = new PrintOptions();
        Pdf pdf = browser.print(print);

        // pdf base64 内容
        String content = pdf.getContent();
        // 解码内容
        Base64.Decoder decoder = Base64.getDecoder();
        byte[] buffer = decoder.decode(content);

        try {
            // 将 byte 写入文件
            Path file = Paths.get(String.format("java%s_%s.pdf", version, platform));
            Files.write(file, buffer);
        } catch (IOException e) {
            throw new RuntimeException(e);
        } finally {
            browser.quit();
        }

效果预览

selenium/java11_linux.pdf · yjihrp/linux-html2pdf-demo - Gitee.com

selenium/java11_win.pdf · yjihrp/linux-html2pdf-demo - Gitee.com

测试结果


测试结果

下一篇 6-LINUX HTML 转 PDF-selenium-python

数字时代,PDF格式已经成为信息传递和保存的重要方式。然而,有时候我们需要将PDF文件转换为其他格式,如HTML、TXT或图片,以满足不同的需求。这时,一款强大的PDF编辑工具就显得尤为重要。首助编辑高手就是这样一款工具,它支持批量将HTML转PDF、PDF转HTML、PDF转图片、PDF转TXT,为您的信息转换需求提供了一站式解决方案。

1.对于需要将PDF文件转换为HTML格式的用户,提供了高效、准确的转换功能。

2.您只需将PDF文件导入工具中,选择转换为目标HTML格式,即可快速获得转换后的文件。同时,还支持批量转换,大大提高了工作效率。

3.如果您需要将HTML格式转换为PDF格式,同样能够满足您的需求。这一功能尤其适用于需要在PDF文件中整合网络内容的情况。使用软件,您可以轻松地将HTML内容转换为PDF格式,以方便打印或与他人分享。

4.除了HTML和PDF之间的转换,还支持将PDF文件转换为图片。将PDF转换为图片可以方便地保存和分享文档内容,

5.而将PDF转换为TXT格式则便于文本编辑和整理。这些功能使软件成为了一款非常全面的PDF编辑工具。

6.软件还具有操作简便、转换速度快、转换质量高等优点。无论您是个人用户还是企业用户,都能为您的PDF转换需求提供强大的支持。无论是学习、工作还是生活,首助编辑高手都是您不可或缺的得力助手。

总之,它是一款功能强大、操作简便的PDF编辑工具。它支持批量将HTML转PDF、PDF转HTML、PDF转图片、PDF转TXT,满足了用户在不同场景下的转换需求。无论是个人用户还是企业用户,都能为您的工作和生活带来极大的便利。现在就来试试首助编辑高手,体验全能转换的魅力吧!

数字时代,PDF文档已经成为我们工作和学习的重要工具。然而,PDF的编辑和转换常常让人头疼。面对这样的问题,首助编辑高手软件应运而生,它以其强大的功能和高效的批量处理能力,成为PDF文档修改的利器,批量转HTML的绝佳选择。

步骤一:打开软件,在”PDF编辑工具“板块中,单击”修改原PDF文档。

步骤二:弹出一个小窗口,选中并将需要修改的PDF文档导入软件中。

步骤三:进入编辑界面,你可以对PDF文档的内容进行修改,包括文字、图片、排版等。

步骤四:完成修改后,点击“保存”按钮,保存修改后的PDF文档。

步骤五:回到软件主界面,选择“批量抓换格式”功能,在转换模式中,选择“PDF转HTML”选项。

步骤六:然后通过“添加文件”或者“添加文件夹中的文件”方式一键将需要转换的PDF文档导入软件

步骤七:选择好新文件保存位置,比如原文件相同位置,或者指定位置都是可以的

步骤八:确认设置无误后,点击“开始转换”按钮,软件将开始批量将PDF文档转换为HTML网页文件。

步骤九:转换完成后软件会提示你转换成功,打开文件夹查看,即可看到转换后的HTML网页文件。

步骤十:最后,你可以使用浏览器打开HTML网页文件,查看转换效果,其中的内容跟未修改前的PDF文档有所不同,说明修改和转换成功

总之,首助编辑高手软件是一款功能全面、操作简单的PDF编辑和转换工具。它不仅能够帮助你快速修改PDF文档内容,还能实现批量转换为HTML网页文件。如果你正在寻找一款实用的PDF处理软件,那么该软件绝对是你的不二选择。