借助Aspose.HTML控件,使用 Python 将 HTML 转换为 DOCX
<p><img src="https://image.evget.com/attachment/keditor/image/20250919/094923_2.png"></p><p>本教程将向开发者展示<strong><em>如何</em></strong><strong><em>在 Python 中以编程方式将</em></strong><strong><em>HTML</em></strong><strong><em>转换为</em></strong><strong><em>DOCX</em></strong>。我们将使用一个非常快速的 Python SDK 将网页转换为 MS Word 文件——<strong>Aspose.HTML </strong><strong>for Python via .NET,</strong>它提供了用于自动执行文件格式转换任务的类和方法,能够精确地转换 HTML 结构和样式,是 Python 开发人员的理想选择。该 SDK 易于设置,并提供可编辑的 Word 文档输出。此外,它采用先进的转换方法,几乎提供了所有必要的功能,以实现更佳的 HTML 到 DOC/DOCX 的转换效果。然而,MS Word的普及性已得到广泛认可,构建一个 HTML 到 DOCX 的转换器可以为您的商业应用程序带来竞争优势。</p>
<div style="text-align: center"><span style="color: rgba(230, 126, 35, 1)"><strong>Aspose.Html 正版免费试用下载,请联系Aspose官方授权代理商慧都科技</strong></span></div>
<p style="text-align: center"><span style="color: rgba(230, 126, 35, 1)"><strong><em>加入Aspose技术交流QQ群(1041253375),与更多小伙伴一起探讨提升开发技能。</em></strong></span></p>
<h2 id="setting-up-asposehtml-for-python-via-net">通过.NET为Python设置Aspose.HTML</h2>
<p>此 SDK 的安装只需在终端/CMD 中运行以下命令:</p>
<pre class="prettyprint lang-py highlighter-hljs"><code>pip install aspose-html-net </code></pre>
<p>您也可以<strong>联系慧都科技下载 SDK 文件</strong><strong>。</strong></p>
<h2 id="code">使用 Python 编辑 HTML - 代码示例</h2>
<p>我们将向您展示通过 .NET使用<strong><u> Aspose.HTML for Python</u></strong> 是多么容易。</p>
<p>您可以按照以下步骤以编程方式将 HTML 转换为 Word 文档:</p>
<ul>
<li>定义工作目录的路径。</li>
<li>初始化HTMLDocument类的实例并加载HTML文档。</li>
<li><strong>创建DocSaveOptions</strong>类的对象。</li>
<li>自定义 DOCX 的保存选项。</li>
<li>通过调用convert_html方法将 HTML 转换为 DOCX。</li>
</ul>
<p>以下代码片段展示了如何在 Python 中将 HTML 转换为 DOCx:</p>
<pre class="prettyprint lang-py highlighter-hljs"><code>import os
import aspose.html as html
from aspose.html import *
from aspose.html.saving import *
from aspose.html.drawing import *
from aspose.html.converters import *
from aspose.html.rendering.doc import *
# Define path for the working directories.
output_dir = "output/"
input_dir = "input/"
license = html.License()
license.set_license("license.lic")
if not os.path.exists(output_dir):
os.makedirs(output_dir)
document_path = os.path.join(input_dir, "sample.html")
save_path = os.path.join(output_dir, "output1.docx")
# Initialize an instance of the HTMLDocument class and load an HTML document.
document = HTMLDocument(document_path)
# Create an object of the DocSaveOptions class.
options = DocSaveOptions()
# Customize save options for DOCX.
options.document_format.DOCX
options.font_embedding_rule.FULL
options.css.media_type.PRINT
options.horizontal_resolution = Resolution.from_dots_per_inch(96.0)
options.vertical_resolution = Resolution.from_dots_per_inch(96.0)
# Convert HTML to DOCX by calling the convert_html method.
Converter.convert_html(document, options, save_path)
print(f"HTML document converted to DOCX successfully and saved to {save_path}")</code></pre>
<p>输出:</p>
<p><img src="https://image.evget.com/2025/09/19/QQ20250916-101548rpkphqluj70jmvkt.png"></p>
<p>通过 .NET使用<strong><u>Aspose.HTML for Python</u></strong> 简单流畅。您可以在文档和API 参考中查看许多可用功能。此外,我们已经看到,此 SDK 可以轻松加载文件、自定义内容并以 DOCX/DOC 格式保存,同时保留布局。因此,立即将此 Python SDK 集成到您的项目中,自动化您的文档工作流程吧。</p>
<h2 id="faqs">常见问题解答</h2>
<p><strong>问:如何在 Python 中将 HTML 转换为 DOCX?</strong></p>
<p>答:<strong><u>Aspose.HTML for Python via .NET</u></strong>是一个功能强大的 SDK,用于将网页转换为 Word 文档。</p>
<p><strong>问:如何将 HTML 文件转换为 Word DOC?</strong></p>
<p>答:您可以使用<strong>Aspose.HTML for Python</strong> 通过 .NET公开的类和方法轻松实现这一点。</p>
<div style="text-align: center"><span style="color: rgba(230, 126, 35, 1)"><strong>Aspose.Html 正版免费试用下载,请联系Aspose官方授权代理商慧都科技</strong></span></div>
<p style="text-align: center"><span style="color: rgba(230, 126, 35, 1)"><strong><em>加入Aspose技术交流QQ群(1041253375),与更多小伙伴一起探讨提升开发技能。</em></strong></span></p><br><br>
来源:https://www.cnblogs.com/software-Development/p/19100457
頁:
[1]