0

所以我的查询:

SELECT Tags, COUNT(Tags) AS Listings
FROM Job
WHERE datepart(year, dateposted)=2013
GROUP BY Tags
ORDER BY Listings DESC

输出:

+----------------------+----------+
|         Tags         | Listings |
+----------------------+----------+
| java c++             |       41 |
| software development |       41 |
| java c++ c#          |       31 |
|                      |       25 |
| sysadmin             |       25 |
| see jd               |       24 |
| java c++ ood         |       23 |
| java                 |       23 |
+----------------------+----------+

我希望它像这样出来:

+----------------------+----------+
|         Tags         | Listings |
+----------------------+----------+
| java                 |       118|
| c++                  |       95 |
| ood                  |       23 |
| see                  |       24 |
| jd                   |       24 |
| software development |       41 |
| sysadmin             |       25 |
| c#                   |       31 |
+----------------------+----------+

如何计算字段中的每个单词而不是整个字段?标签列是 nvarchar。

4

3 回答 3

8

首先,你的表结构很糟糕。将数据存储在这样的列表中会让您头疼,类似于您现在正在尝试做的事情。

拆分功能的问题是您不知道什么software development或其他多词标签是一个词还是两个词?

我认为解决此问题的唯一方法是使用标签创建表或使用类似于以下的派生表:

;with cte (tag) as
(
  select 'java' union all
  select 'c++' union all
  select 'software development' union all
  select 'sysadmin' union all
  select 'ood' union all
  select 'jd' union all
  select 'see' union all
  select 'c#'
)
select c.tag, count(j.tags) listings
from cte c
inner join job j
  on j.tags like '%'+c.tag+'%'
group by c.tag

请参阅SQL Fiddle with Demo。使用它你可以得到一个结果:

|                  TAG | LISTINGS |
|                 java |        9 |
|                  c++ |       10 |
| software development |        4 |
|             sysadmin |        2 |
|                  ood |        6 |
|                   jd |        3 |
|                  see |        2 |
|                   c# |        1 |

正如评论中指出的那样,上述问题是如何确定您是否有标签software,并且development这些将与上述查询匹配。

解决此问题的最佳解决方案是将标签存储在一个单独的表中,类似于:

create table tags
(
  tag_id int,
  tag_name varchar(50)
);

然后您可以使用 JOIN 表将您的作业连接到标签:

create table tag_job
(
  job_id int,
  tag_id int
);

一旦您进行了与此类似的设置,查询数据就会变得更加容易:

select t.tag_name,
  count(tj.tag_id) listings
from tags t
inner join tag_job tj
  on t.tag_id = tj.tag_id
group by t.tag_name

See demo

于 2013-08-29T20:51:03.513 回答
0

这就是我解决问题的方法。

SELECT TOP 50 Tags.s Tag, COUNT(Tags.s) AS Listings
FROM Job
CROSS APPLY [dbo].[SplitString](Tags,' ') Tags
WHERE NOT Job.Tags IS NULL and datepart(year,job.datecreated) = 2013
GROUP BY Tags.s
ORDER BY Listings DESC
于 2013-12-04T15:42:48.483 回答
0

您可能需要拆分单个单词。

这是关于 SQL Server 中拆分器的一个很好的系列: SqlServerCentral.com

不过,我看不出您将如何将“软件开发”区分为单个标签。如果您在其他地方有一个可接受的标签列表,您可能会使用它来执行计数。

如果您有可用标签列表,这是一种不需要拆分的方法。

Sql 小提琴示例

如果您的标签包含在另一个标签中,则此方法可能存在问题。即“软件”和“软件开发”

于 2013-08-29T20:28:54.783 回答