1

我需要显示 HTML 文本的前 100 个字符,这意味着,我必须选择不是标签的前 100 个字符,然后关闭所有打开的标签,留下一个平衡的 HTML。有没有图书馆可以做到?或者有什么我想念的微不足道的方法吗?

文本最初是用 Textile 编写的,它可以并且确实包含 HTML,所以我认为我最好先将其转换为完全 HTML,然后再进行处理,但如果可以在 Textile 级别做到这一点,我也很高兴。

4

2 回答 2

1

这就是我如何获得前 100 个字符的文本。您可能需要根据自己的需要进行修改

require 'nokogiri'

def get_first_100_chars
 doc = Nokogiri::Slop(open 'html_file.html')
 text = doc.html.body.text
 return text[0..99]
end

不确定平衡html。如果我发现会发布。

于 2012-01-12T03:36:14.137 回答
0

看看Nokogiri

于 2010-08-04T09:17:34.043 回答