合理的自动HTML到PDF转换(在UNIX / Linux环境中)

有没有办法在Linux中自动从HTML文件中生成PDF文档,其中PDF提供了与input文件相似的合理级别?

一个命令行工具 – 而不是某种交互式GUI–是关键。

当然,我已经试过htmldoc和一些相关的堂兄弟。 但是这些工具绝对是石器时代的; htmldoc根本不支持CSS。 现在你不会发现很多HTML文档,至less没有CSS样式。 我并不在意愚蠢的效果或者小的修饰,但问题在于,CSS现在是大多数布局的核心。 没有多less人使用6层嵌套表了。 所以,如果转换工具没有CSS的把握,那不仅仅是“文档看起来不太正确”的问题。 它可能根本不符合可用性的最低标准。

一些人build议我尝试使用Gecko渲染引擎来生成可以转换为PDF的图像,但我不知道如何去做这件事,更不用说容易。

我毫不犹豫地相信有这么好的商业工具可以做到这一点,但是如果可能的话,我确实在寻找一个开放源代码的软件包,因为这个努力本身是一个开放源代码软件,并且不会付钱。

提前致谢!

    你见过wkhtmltopdf吗? 不能说它有多好,但它看起来正是你所需要的。 唯一的问题可能是,这个和任何'浏览器自动化'的解决scheme,它会拿起打印样式表,而不是屏幕显示一个,所以PDF可能不完全是你在屏幕上看到的。

    用python-beautifulsoup试试chm2pdf。

    XHTML2PDF是一个Python工具集,它包含了命令行脚本和一个Python库(如果你想把它embedded到更大的东西中,而不需要对脚本进行脱壳处理)。它支持HTML / XHTML和CSS,以及其他厂商特定的CSS样式调整格式化的输出(例如,页码,段落stream等)

    我只用了一点点批量处理一些HTML文档,但它运行良好,其function集似乎全面。 该手册隐藏在演示页面上,但本身就是将HTML文档转换为PDF的一个很好的例子。

    我有一个很好的链接到“之前”和“之后”的例子,但我刚刚创build了我的帐户,显然,只有垃圾邮件发送者在他们的第一篇文章中多个链接:-p

    我想从命令行生成一些HTML页面的PNG。 某处我发现这个使用mozembed生成截图的ruby脚本 。 如果您不想缩放比例,您可以删除比例线。

    我看到的唯一问题是页面实际上出现在屏幕上一会儿…

    尝试dompdf它工作正常从德命令行,并通过它的例子,它适用于任何types的HTML

    PrinceXML。 可以处理CSS就好了。 Linux,Windows,Mac OS X版本可用。 AFAICS,这也是Google Docs的PDF输出背后的技术。 但请注意:这是付费软件。