-4

我无法获得a标签p.user_info

<p class="user_info"> 
    <a href="javascript:;" onClick="showSideView(this, 'login_id', 'user_name', 'ZmFubmlAaGFubWFpbC5uZXQ=', '');" title="[login_id]user_name">
        <img src='/cs2/data/member/fa/login_id.gif?dt=20130117095107' align='absmiddle' border='0'> of
    </a>
</p>

使用:

p_user_info = page.css("p.user_info")
puts p_user_info.css("a") # => []
puts p_user_info.css("a")[0] # => null
puts p_user_info.css("a").text # => ""

是否可以使用 Nokogiri在标签中获取login_id, ?user_namea


我发现了一个更重要的问题:

url = "http://clien.net/cs2/bbs/board.php?bo_table=park&wr_id=23895599"
html = open(url).read
puts html
# => ...
<p class="user_info"> <img src='/cs2/data/member/at/atlantis33.gif?dt=20130506110916' align='absmiddle' border='0'>님 </p>
...

我不知道为什么我不能得到a标签。

4

3 回答 3

1

尝试以下操作:

require 'nokogiri'

html = <<eoh
<p class="user_info"> 
    <a href="javascript:;" onClick="showSideView(this, 'login_id', 'user_name', 'ZmFubmlAaGFubWFpbC5uZXQ=', '');" title="[login_id]user_name">
        <img src='/cs2/data/member/fa/login_id.gif?dt=20130117095107' align='absmiddle' border='0'> of
    </a>
</p>
eoh

page = Nokogiri::HTML(html)
a = page.at_css("p.user_info a")
p a[:onclick].split(',')[1,2]
# => [" 'login_id'", " 'user_name'"]
p a[:onclick].split(',')[1,2].map { |x| x.gsub(/^[' ]+|[' ]+$/, '') }
# => ["login_id", "user_name"]
于 2013-09-09T03:35:10.990 回答
0

回答我自己。该a标签只有在登录后才能看到。需要mechanize图书馆。

于 2020-05-13T01:10:16.700 回答
-1
require 'nokogiri'                                                              

a =%{<p class="user_info">                                                      
    <a href="javascript:;" onClick="showSideView(this, 'login_id', 'user_name', 'ZmFubmlAaGFubWFpbC5uZXQ=', '');" title="[login_id]user_name">
<img src='/cs2/data/member/fa/login_id.gif?dt=20130117095107' align='absmiddle' border='0'> of
</a>                                                            
</p>"}                                                          

html = Nokogiri::HTML(a)                                                        
link = html.at_css "a"                                                          
puts link.values[1].split[1]                                                    
puts link.values[1].split[2]
于 2013-09-09T04:09:16.993 回答