希望从文章中提取作者姓名。当前使用 =IMPORTXML(G2,"//*[@class='author-details']")
当我这样做时,它会在下面创建 4 个单元格,其中包含我无法摆脱的单词“By”。
非常新的代码 - 我做错了什么?
希望从文章中提取作者姓名。当前使用 =IMPORTXML(G2,"//*[@class='author-details']")
当我这样做时,它会在下面创建 4 个单元格,其中包含我无法摆脱的单词“By”。
非常新的代码 - 我做错了什么?
您可以使用:
=index(IMPORTXML(G2,"//*[@class='author-details']"),1,2)
这仅显示返回内容的第二列的第一行。您所追求的信息。
编辑:
此外,由于您突出显示您想要作者姓名。如果所有名称都采用“By FIRST LAST @TwitterHandle Affiliation”格式,那么您可以使用它来获取作者的姓名:
=trim(split(right(index(IMPORTXML(G2,"//*[@class='author-details']"),1,2),len(index(IMPORTXML(G2,"//*[@class='author-details']"),1,2))-3),"@",true,true))
可能看起来像伏都教,但将其粘贴进去,它可以工作。它删除前 3 个字符(“By”),在“@”符号处拆分文本,然后只保留其左侧的文本,即名称。