0

我有这样的html:

<table class="tbNoBorder" ..some attr here...>
<tr><td>1</td></tr><tr><td>2</td></tr>
</table>

<table ..some attr here... >
<tr><td>1</td></tr><tr><td>2</td></tr>
</table>

我需要使用正则表达式转换为

<table class="tbNoBorder" cellspacing="0" cellpadding="0" ..some attr here...>
<tr><td style="padding: 5px;">1</td></tr><tr><td style="padding: 5px;">2</td></tr>
</table>

<table cellspacing="0" cellpadding="0" ..some attr here... >
<tr><td style="border: solid 1px #ccc; padding: 5px;">1</td></tr><tr><td style="border: solid 1px #ccc; margin: 0; padding: 5px;">2</td></tr>
</table>

然后我将其转换为 Word,这就是我需要这种转换的原因。具有类tbNoBorder的表不能有任何边框。

我编写了这段代码来做到这一点,但所有表格都带有边框。第一个正则表达式占用所有表。有什么想法让它发挥作用吗?

        //Fixes tables with borders
        content = Regex.Replace(content,
            @"<table(.*?)(?!tbNoBorder)(.*?)>(.*?)</table>",
            m =>
                {
                    var tableContent = Regex.Replace(m.Groups[3].ToString(), 
                                        @"<td",
                                        t => "<td style=\"border: solid 1px #ccc; padding: 5px;\"", RegexOptions.IgnoreCase
                                        );
                    return "<table cellspacing=\"0\" cellpadding=\"0\"" + m.Groups[1] + m.Groups[2] + ">" + tableContent + "</table>";
                }, RegexOptions.IgnoreCase
            );

        //Fixes tables without borders, has class tbNoBorder
        content = Regex.Replace(content,
            @"<table(.*?)tbNoBorder(.*?)>(.*?)</table>",
            m =>
            {
                var tableContent = Regex.Replace(m.Groups[3].ToString(),
                                    @"<td",
                                    t => "<td style=\"padding: 5px;\"", RegexOptions.IgnoreCase
                                    );
                return "<table cellspacing=\"0\" cellpadding=\"0\" + m.Groups[1] + m.Groups[2] + ">" + tableContent + "</table>";
            }, RegexOptions.IgnoreCase
        );
4

2 回答 2

3

将您的第一个正则表达式更改为

@"<table(?![^>]*tbNoBorder)(.*?)>(.*?)</table>"

tbNoBorder那么如果开始标签中有a,它将失败

于 2012-04-16T07:49:19.433 回答
1

使用 xslt 可以这样解决:

<?xml version="1.0" encoding="utf-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
    <xsl:output method="html" />

    <xsl:template match="/">
        <xsl:apply-templates />
    </xsl:template>

    <xsl:template match="table">
        <xsl:element name="table">
            <xsl:attribute name="cellspacing">0</xsl:attribute>
            <xsl:attribute name="cellpadding">0</xsl:attribute>
            <xsl:apply-templates select="@* | node()" />
        </xsl:element>
    </xsl:template>

    <xsl:template match="td">
        <xsl:element name="td">
            <xsl:if test="ancestor::table[not(@class='tbNoBorder')][1]">
                <xsl:attribute name="style">border: solid 1px #ccc; padding: 5px;</xsl:attribute>
            </xsl:if>
            <xsl:apply-templates />
        </xsl:element>
    </xsl:template>

    <xsl:template match="@* | node()">
        <xsl:copy>
            <xsl:apply-templates select="@* | node()"/>
        </xsl:copy>
    </xsl:template>

</xsl:stylesheet>
于 2012-04-16T12:13:49.870 回答