我正在处理的项目的目标是从 word 文档中获取内容,然后输出一个包含带边框的框的图像,这些框包含我通过代码自动汇集的文本段。这是我需要的一个例子:
由于我自己的一点点知识和其他人的大量知识,我已经为这个项目完成了 90% 的步法。我的代码已经从 word 文档中获取文本并自动获取我想要的内容。尝试模仿此图像时会出现问题。我正在使用 Wand 创建图像,但我仍然无法让它正常工作。我知道我很接近,但我完全不确定我错过了什么。以下是严格用于图像创建的代码:
from wand.image import Image
from wand.drawing import Drawing
target_width = 500
target_height = 0
y_offset = 0
y_padding = 4
x_padding = 5
with Image(width=2000, height=2000, pseudo='xc:white') as img:
for match in find_matches(text=fullText):
ct += 1
with Drawing() as ctx:
ctx.font_size = 20
ctx.text_alignment = 'center'
words = match.split(" ")
words.append("\n" + str(ct))
word_count = len(words)
while True:
temp_text = rebuild_text(words, word_count)
metrics = ctx.get_font_metrics(img, temp_text, multiline=True)
if metrics.text_width > target_width:
word_count -= 1
else:
text = temp_text
target_height = int(metrics.text_height + 0.5)
break
ctx.push()
ctx.fill_color = 'white'
ctx.stroke_width = 3
ctx.stroke_color = 'black'
ctx.rectangle(2, y_offset + y_padding, width=2*x_padding+target_width,
height=6*y_padding+target_height)
ctx.pop()
ctx.text(x_padding + (target_width // 2), 16 + 6*y_padding+y_offset, text)
ctx(img)
y_offset = target_height + 100*y_padding + 7
img.trim()
img.save(filename='patdrawdemoTest.png')
我一遍又一遍地尝试弄乱这段代码,但无济于事。我知道我想要的所有文本都在通过,因为我添加了一个打印语句来确保这一点,并且在到处乱七八糟的代码之后,有时我发现有很多重叠的文本,但我永远不能得到超过三个有边框的盒子。以下是我通过更改此处和此处的值可以获得的输出示例:
我无法复制文本重叠输出,但是,以上只是一些示例。我不确定它是否有帮助,但它们之间的区别是文本和矩形等与 y 轴相关的值。
我需要的文本行由 python 中的 docx 库获取,然后放入变量中;这不是一个简单的字符串。此外,此代码必须适用于任何场合;无论是 5 个文本框、2 个、8 个还是 100 个文本框,它都必须创建具有那么多文本框的图像。以下是我解析的文本,并通过我上面的代码传递:
在第一区域243中存储与交通工具的运行方式相关的第一数据
在第二区域244中存储与交通工具的运行方式相关的第二数据
根据综合能源消耗效率修改交通功能
245
确定组合的能源消耗效率,其中确定包括对等组之间的区块链共识,该对等组包括传输、服务器和至少一个其他传输中的一项或多项246
基于区块链共识,执行智能合约以记录区块链上的综合能源消耗效率
247
我将非常感谢我能得到的任何帮助,因为我完全被难住了。请让我知道我是否可以更清楚,或者我是否缺少一些东西来帮助您回答我的问题。谢谢。