Hashtags 有时会结合两个或多个单词,例如:
content marketing => #contentmarketing
如果我为一篇文章分配了一堆主题标签,并且该词在那篇文章中,即content marketing
. 如何获取该主题标签并检测构成该主题标签的单词?
如果主题标签是一个单词,这很简单:只需在文章中查找该单词即可。但是,如果哈希标签是两个或更多单词怎么办?我可以简单地将主题标签拆分为所有可能的索引,并检查产生的两个词是否在文章中。
所以对于#contentmarketing
,我会检查这些词:
- 内容营销
- 内容营销
- 内容营销
- ...
- 内容营销<=这就是答案!
- ...
但是,如果主题标签中有三个或更多单词,这将失败,除非我递归地拆分它,但这似乎非常不雅。
同样,这是假设散列标签中的单词在文章中。