1

我需要一个 SQL 查询来仅在两个句子之间获取常用词。例如:

句子1:这个网站很有帮助

句子 2:我需要一个有用的网站

结果应该是:网站有帮助

另外,如果我需要将句子 1 与表字段记录进行比较,以获取包含句子 1 最常用词的记录,我该怎么办?

4

1 回答 1

1

您的问题标题说 MSQL,所以我将您的问题视为 Sql Server 问题。

  1. 拆分功能

根据 SQL Server 版本/服务器配置,您将需要一个拆分函数,该函数可以在选择的分隔符上拆分字符串。这是一个这样的功能。

CREATE FUNCTION [dbo].[fnSplit](@data NVARCHAR(MAX), @delimiter NVARCHAR(5))
RETURNS @t TABLE (rowNum int IDENTITY(1,1), data NVARCHAR(max), descriptor varchar(255) NULL)
AS
BEGIN

    DECLARE @textXML XML;
    SELECT    @textXML = CAST('<d>' + REPLACE(@data, @delimiter, '</d><d>') + '</d>' AS XML);

    INSERT INTO @t(data)
    SELECT  RTRIM(LTRIM(T.split.value('.', 'nvarchar(max)'))) AS data
    FROM    @textXML.nodes('/d') T(split)

    RETURN
END
  1. 使用 split 函数查询常用词(有很多方法可以做到这一点,这里有一个)。 SELECT sentence1.data FROM dbo.fnSplit('This site is very helpful',' ') sentence1 INNER JOIN dbo.fnSplit('I need a helpful site',' ') sentence2 ON sentence1.data = sentence2.data
于 2012-12-13T17:54:56.710 回答