9

我有一些带有 twitter 风格#hashtags 的文本。我将如何编写一个函数来解析可能包含无限数量#hashtags的文本正文,获取主题标签的文本并将它们全部替换为<a href="tag/[hashtag text]">[hashtag text]</a>

我想了很多关于如何做到这一点,但我真的不擅长用正则表达式编写这类函数。

示例文本:

Lorem ipsum dolor sit amet, consectetur adipiscing elit。Vivamus #tristique non elit eu iaculis。Vivamus eget ultricies nisi。mauris condimentum scelerisque 的 Vivamus hendrerit。Donec nibh mauris, pulvinar et #commodo a, porta et Tellus。Duis eget ante gravida, convallis augue id, blandit lectus。Mauris euismod commodo mi ut fringilla。Sed felis magna、rhoncus vitae mattis varius、sagittis a eros。Donec eget porta ipsum。#Mauris sed mauris ante。暂停潜力。Donec #pretium #augue,eget hendrerit orci。整数 cursus scelerisque consequat。

4

6 回答 6

22

尝试使用这个:

$text = "Vivamus #tristique non elit eu iaculis.";
$text = preg_replace('/(?:^|\s)#(\w+)/', ' <a href="tag/$1">$1</a>', $text);
// $text now: Vivamus <a href="tag/tristique">tristique</a> non elit eu iaculis;

它在这里工作:https ://3v4l.org/WXqTr (点击运行)。

正则表达式参考:空格或字符串开头非捕获组

原文来源:用 RegExp 解析 Twitter

于 2013-06-21T22:43:15.507 回答
4

这将适用于 UTF-8 编码文本,并将在内容中的标签前显示 #(哈希)

preg_replace('/(\#)([^\s]+)/', ' <a href="tag/$2">#$2</a> ', $content);
于 2014-03-22T08:50:08.520 回答
1

尝试这个:

preg_replace('/(\#)([^\s]+)/', '<a href="tag/$2">$2</a>', $your_content_here);

这将变成这样:This is a #hashtag

进入这个:This is a <a href="tag/hashtag">hashtag</a>

假设你有$your_content_here = 'This is a #hashtag';

于 2013-06-21T22:41:50.593 回答
0

无论标签之间没有空格,它都会提取并添加到文本中每个标签的链接。

$text = "#test Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vivamus #tristique non elit eu iaculis. Vivamus eget ultricies nisi. Vivamus hendrerit at mauris condimentum scelerisque. Donec nibh mauris, pulvinar et #commodo a, porta et tellus. Duis eget ante gravida, convallis augue id, blandits.Repost#high#fashion#photography#Ishan#portart#photo#Shoot#EishaChopra#luxe#twisty#creative#destination#style#Actor#model#beauty#gorgeous#makeup#and#hair#kamaldeep#fashionista#trending ";
$text = preg_replace('/#(\w+)/', ' <a href="tag/$1">$1</a>', $text);
echo $text;
于 2016-12-15T07:39:34.737 回答
0

正确答案是这样的。原因不止一个。但最重要的是,您需要考虑您的字符串是否包含 URL,否则所有其他答案都会中断。请参见下面的示例:

$text = "#test Lorem ipsum dolor sit amet, consectetur adipiscing elit. Vivamus #tristique non elit eu iaculis. Vivamus eget ultricies nisi. Vivamus hendrerit at mauris condimentum scelerisque. Donec nibh mauris, pulvinar et #commodo a, porta et tellus. Duis eget ante gravida, convallis augue id, blandit lectus. Mauris euismod commodo mi ut fringilla. Sed felis magna, rhoncus vitae mattis varius, sagittis a eros. Donec eget porta ipsum. #Mauris sed mauris ante. Suspendisse potenti. Donec a #pretium #augue, eget hendrerit orci. Integer cursus scelerisque consequat. http://www.example.com/#wdwd/dwdqwdqwdqw#dwqdqwdq";

$text = preg_replace('/(^|[\n\s])#([^\s"\t\n\r<:]*)/is', '$1<a href="http://twitter.com/search?q=%23$2">#$2</a>', $text);

echo $text;
于 2017-09-28T01:10:08.787 回答
-1

我结合了 Joe 和 jraede 的解决方案。

UTF-8 安全且正确的主题标签格式(无逗号等):

preg_replace('~(\#)([^\s!,. /()"\'?]+)~', '<a href="tag/$2">#$2</a>', $text);
于 2014-11-12T08:45:58.557 回答