0

嗨,我在那个 MobApp 中有一个移动应用程序,客户可以看到有关的信息

钱,新闻,预测,建议,在这种情况下可以下载该应用程序我需要找出计数如何

多次客户访问金钱,新闻,预测,建议以及通过哪个参考代码客户

每天或下载日期单独下载的应用程序

日志表由如下列组成

id user_key url_accessed 参数 timestamp .. .........................................................................................

1 sdhbhjbh /user/money mobile_no=9999999 2015-01-08 13:06:33

2 cnbjknjk /user/news user_key=534d2135 2014-09-06 26:02:25

3 l;mjl;k; /下载参考=abcd 2014-10-22 07:37:57

在这里,我必须找到用户每天按日期访问该 url 的次数并计算访问次数

钱的网址,新闻,预测,咨询,下载

在这里,我将 SQL Server 与 Pentaho 数据集成一起使用

对于上述问题,我必须为带有列的 url_accessed 创建单独的 new_table

钱,新闻,天气,预测,下载。在这里,我需要将数据从 log_table 填充到 new_table

货币,新闻,天气,预测,下载列在此列中,数据必须计算在内

为了钱,计算新闻和所有专栏

使用 pentaho 数据集成。我该怎么做,帮我完成这个任务

4

2 回答 2

0

使用 PDI,您可以首先尝试使用 sql 查询(如上所述和此处)来获取用户的不同计数。

在此处输入图像描述

其次,您需要从 url 中找出正在访问的列。例如;如果用户访问了“/user/money”,那么他的标签访问将是“money”。新表中数据的总和需要在此表中。

第三,使用“Memory Group By”步骤获取标签访问的总和。检查下面的图像。[注意:我只使用了最小参数,你可以使用用户作为另一个条件]

第四,将此数据加载到某个临时表中,最后在单独的转换中,查询此临时表(用例语句)并根据您所需的格式/表加载数据。

我在这里给出了一个非常基本的示例。请检查一下。

希望这会帮助你:)

在此处输入图像描述

于 2015-01-14T18:29:54.007 回答
0

这可能会帮助你

Select user,URL,count(URL)
from table
where date=getdate() 
group by URL,user
于 2015-01-14T09:19:38.240 回答