我需要显示 HTML 文本的前 100 个字符,这意味着,我必须选择不是标签的前 100 个字符,然后关闭所有打开的标签,留下一个平衡的 HTML。有没有图书馆可以做到?或者有什么我想念的微不足道的方法吗?
文本最初是用 Textile 编写的,它可以并且确实包含 HTML,所以我认为我最好先将其转换为完全 HTML,然后再进行处理,但如果可以在 Textile 级别做到这一点,我也很高兴。
我需要显示 HTML 文本的前 100 个字符,这意味着,我必须选择不是标签的前 100 个字符,然后关闭所有打开的标签,留下一个平衡的 HTML。有没有图书馆可以做到?或者有什么我想念的微不足道的方法吗?
文本最初是用 Textile 编写的,它可以并且确实包含 HTML,所以我认为我最好先将其转换为完全 HTML,然后再进行处理,但如果可以在 Textile 级别做到这一点,我也很高兴。
这就是我如何获得前 100 个字符的文本。您可能需要根据自己的需要进行修改
require 'nokogiri'
def get_first_100_chars
doc = Nokogiri::Slop(open 'html_file.html')
text = doc.html.body.text
return text[0..99]
end
不确定平衡html。如果我发现会发布。
看看Nokogiri