3

我需要用阿拉伯语获取一个 HTML 页面并将其转换为 PDF。itextsharp 不起作用。这是一些带有阿拉伯语的 HTML 示例。

<div>
    <table border="1" width="500px">
        <tr>
            <td colspan="2">
                aspdotnetcodebook
                اللغة العربية</td>
        </tr>
        <tr>
            <td>
                cell1
            </td>
            <td>
                cell2
            </td>
        </tr>
        <tr>
            <td colspan="2">
                <asp:Label ID="lblLabel" runat="server" 
                    Text=""></asp:Label>
                <img alt="" src="logo.gif" style="width: 174px; height: 40px" /></td>
        </tr>
        <tr>
            <td colspan="2" dir="rtl">
                <h1>
                    <img alt="" height="168" 
                        src="http://a.cksource.com/c/1/inc/img/demo-little-red.jpg" 
                        style="margin-left: 10px; margin-right: 10px; float: left;" width="120" />تحويل 
                    محتوى الى ملف بي دي اف</h1>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.
                    <a href="http://en.wikipedia.org/wiki/Brothers_Grimm">
                    الاخوان جريم/a> مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة 
                    التعلم بالبحث والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون 
                    ويريدون أن يتعلموا كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى 
                    عربي معاصر في الفكر والعلم والفنون والأداب بعيدا الكتابة الإبداعية. <a href="http://en.wikipedia.org/wiki/Hood_(headgear%2529" 
                        title="Hood (headgear)">ا</a><a 
                        href="http://en.wikipedia.org/wiki/Hood_(headgear%2529">لهودد</a>
                    <a href="http://en.wikipedia.org/wiki/Cape" title="Cape">ك</a><a 
                        href="http://en.wikipedia.org/wiki/Cape">يب</a> أو
                    <a href="http://en.wikipedia.org/wiki/Cloak" title="ويكيبيديا">ويكيبيديا</a> 
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية. .</p>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.</p>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.</p>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.
                    <a href="http://en.wikipedia.org/wiki/Hunter">الصياد</a>, مجموعة المحتوى 
                    العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث والتعلم بالكتابة. 
                    المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا كيف يكتبون كتابة 
                    علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر والعلم والفنون 
                    والأداب بعيدا الكتابة الإبداعية. المحتوى العربي، تعنى بتطوير مهارة الكتابة 
                    وتتبنى فكرة التعلم بالبحث والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين 
                    يكتبون ويريدون أن يتعلموا كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج 
                    محتوى عربي معاصر في الفكر والعلم والفنون والأداب بعيدا الكتابة الإبداعية.</p>
                <p>
                    مجموعة المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث 
                    والتعلم بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا 
                    كيف يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية.                         <a href="http://en.wikipedia.org/wiki/Enchanted_forest">الغابة</a>, مجموعة 
                    المحتوى العربي، تعنى بتطوير مهارة الكتابة وتتبنى فكرة التعلم بالبحث والتعلم 
                    بالكتابة. المجموعة تضم الأعضاء الجادين الذين يكتبون ويريدون أن يتعلموا كيف 
                    يكتبون كتابة علمية وفكرية رصينه ويساهمون في انتاج محتوى عربي معاصر في الفكر 
                    والعلم والفنون والأداب بعيدا الكتابة الإبداعية. </p>
            </td>
        </tr>
    </table>
</div>

我使用 itextsharp 将存储在 DB 中的内容转换为要下载给用户的 pdf 文件

4

4 回答 4

1

你手头有c#代码吗?有这个在线资源讨论如何使用 itextsharp 创建 PDF。是字符集、字体还是从右到左的问题?

http://www.devshed.com/c/a/Java/Creating-Simple-PDF-Files-With-iTextSharp/

http://www.codeproject.com/KB/graphics/ITextSharpHelperClass.aspx

我希望它可以帮助

于 2010-05-22T08:42:45.793 回答
1

Apache PDFBox 可以做到这一点,但可能无法提供您需要的渲染质量。您可能必须使用 Apache Tika 从 HTML 中获取文本,从而丢失大部分格式。无论如何,我担心将您发送到各种 Java 组件的路径不会让您的船浮起来,但它是我所知道的唯一处理 RTL PDF 文件的免费代码。这并不意味着它是唯一存在的代码。

于 2010-05-23T21:01:36.813 回答
0

这些示例处理创建新文档并添加一些元素作为短语或表格或单元格 - 我的意思是我创建并连接文档 - 逐项 - 但我的情况不同

我将 HTML 内容存储在 DB 中 - 我检索它并将其显示在 HTML 页面上

我在 HTML 中也有阿拉伯文,它转换为空的 pdf

我使用带有 C# 的 asp.net 将此 ARABIC HTML 内容转换为 pdf 我使用 itextsharp 来实现这一点

于 2010-05-22T08:59:06.353 回答
0

我认为CutyCapt是您需要的实用程序,它可以将 html 转换为 pdf 和许多其他格式。

于 2013-06-08T08:38:13.177 回答