4

我正在尝试longtabu在我正在编写的 Java 程序中将 HTML 表解析为 LaTeX 代码(使用它支持自定义列宽设置)。我的代码运行非常稳定,直到刚才输出看起来还不错。我必须支持表的colspan-feature(我现在正在跳过 rowspan),这就是问题所在。导致问题的表如下所示:

<table>
<tr>
    <td width="385" colspan="3">
        Content
    </td>
    <td width="359" colspan="3">
        Content
    </td>
    <td width="151">
        Content
    </td>
</tr>
<tr>
    <td width="24">
        Content
    </td>
    <td width="361" colspan="2">
        Content
    </td>
    <td width="359" colspan="3">
        Content
    </td>
    <td width="151">
        Content
    </td>
</tr>
<tr>
    <td width="24">
        Content
    </td>
    <td width="276">
        Content
    </td>
    <td width="85">
        Content
    </td>
    <td width="198" colspan="2">
        Content
    </td>
    <td width="161">
        Content
    </td>
    <td width="151">
        Content
    </td>
</tr>

我发现了这个问题,没有一个表格行定义了所有的列宽。

据我了解,我需要一个线性方程组来解决单列宽度的计算……我是对的还是我错过了什么?

在 Java 中求解这样一个方程系统的最佳方法是什么?

4

1 回答 1

2

假设源表没有过度约束、约束不足或不一致约束,我建议:

  • 定义一个事实表,列出确定的每列的已知宽度
  • 为指定起始列、列跨度和总宽度的每个 colspan 条目定义一个约束对象集合。
  • 通过收集事实和约束的整个表定义。
  • 然后遍历事实表,对于未定义的每一列,遍历所有约束,看看是否存在对定义了所有其他列的一组列的约束。这样的约束将为当前考虑的列生成一个值。
  • 每次发现新的列值时,您都从事实表的开头重新开始,扫描未知列,并且每次扫描整个约束集。

这是一个 n 平方(或更差)算法,但只要表没有一万行或一万列就应该没问题。如果表格被正确约束,您将到达定义所有列宽的点。像这样的蛮力算法的优点是它相对容易调试并且应该是稳定的。

如果表格约束不足,您将达到通过的点,并且仍然存在未计算的列宽。如果要处理此问题,则添加另一遍,这一次采用涉及未计算表列的任意约束,该列还必须包含一个或多个其他未计算表列,并在所有未计算列中平均分配剩余空间约束。由于这是一个任意约束,您可能会在不同的运行中得到不同的答案......但表受到约束......这有关系吗?

完成后,您将拥有一个包含所有列宽的完整事实表,然后您可以生成指定所有表列的 LaTeX 代码。

于 2013-01-12T18:58:53.203 回答