10

简短版本:我可以获得聊天消息(在 java 中使用 selenium 的 By.xpath),但我想将微笑包含在适当的位置。

更长的版本:您好,我一直在解决这个有趣的问题,我需要解析来自网络浏览器的聊天消息并使用 java 和 selenium 重新创建它。我解析消息的文本没有问题,但我也想用它的子元素(微笑图标)来解析它。除了手动源代码解析之外,还有什么好的方法吗?

这是我可以访问的单个消息的代码:

<div class="chat_msg chat_msg_caller ">
    <div class="chat_msg_head">
        <span class="chat_msg_author">
            SomeAuthor
        </span>
        <span class="chat_msg_date">
           SomeDate
        </span>
    </div>
    <div class="chat_msg_body message_text">
        SomeMessageText
        <span class="sml-icon biggrin">
            <span>
                :D
            </span>
        </span>
        SomeOtherText
        <span class="sml-icon biggrin">
            <span>
                :D
            </span>
        </span>
    </div>
</div>

这是我如何获取聊天消息文本的示例:

String msgTxt = we.findElement(By.xpath("//div[@id='messages_body']/div[" + (i + 1) + "]/div[@class='chat_msg_body message_text']")).getText();

我的结果:SomeMessageText SomeOtherText 我想要的结果:SomeMessageText :D SomeOtherText :D

CSS 文件:

http://badoocdn.com/v2/-/-/css/base-ltr.268.css
http://badoocdn.com/v2/-/-/css/page.chat-ltr.22.css
http://badoocdn.com/v2/-/-/css/popup.messenger-ltr.230.css

结构:

<div id="messages_body">
   <div id="pager" class="pages"> … </div>
   <div class="chat_msg chat_msg_caller ">
       <div class="chat_msg_head">
          <span class="chat_msg_author"> … </span>
          <span class="chat_msg_date"> … </span>
       </div>
       <div class="chat_msg_body message_text"> … </div>
   </div>
   <div class="me chat_msg chat_msg_owner "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="me chat_msg chat_msg_owner "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   <div class="chat_msg chat_msg_caller "> … </div>
   ...
4

2 回答 2

15

如果我对您的理解正确,您只需要在父元素上执行 getText() 例如

driver.findElement(By.cssSelector(".chat_msg_body message_text")).getText()

这应该返回

SomeMessageText :D SomeOtherText :D

它可能会删除一些空格,您需要试一试。

编辑

看到你正在处理潜在的 CSS 问题,你总是可以尝试以下方法:

driver.findElement(By.cssSelector(".chat_msg_body message_text")).getAttribute("textContent")

即使 CSS 正在到处移动东西,那也应该得到 textContent 。

于 2013-06-07T11:38:49.010 回答
0

我如何做到这一点,
1. 我打开 Selenium IDE,
2. 从我想要获取的站点中选择文本
3. 右键单击​​并使用可用的命令
4. 假设我们使用验证文本。
5.停止录制并将录制转换为webdriver。
你得到你的代码。这很简单,一直为我工作。
你可以试试

 (new WebDriverWait(driver, 60)).until(ExpectedConditions
                .textToBePresentInElement(By.id("Element ID"),
                        "Text to verify"));
于 2013-06-07T09:25:41.763 回答