问题标签 [gaps-in-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
476 浏览

sql - 如何旋转两个日期列并填充具有多个重叠日期期间的空白

我有一张包含员工缺勤条目的表格。这些行包含员工编号、缺勤的第一天和最后一天以及大量更多数据,例如缺勤类型、已批准等。

我想创建一个视图,其中列出了所有日期的缺勤条目。像这样的东西。

我还有一个日期表,CALENDARDAY其中包含日历中的所有日期以及周数、月份等相关信息,以帮助我了解日期人口。

我对此查询的尝试导致了以下代码:

我遇到的挑战是SELECT子查询,它要求TOP 1导致重叠缺勤仅返回给定日期缺勤的一名员工。此列上的ACOUNT返回当天缺席的人数。

我是不是想的太复杂了?我怎样才能轻松达到我想要的结果?任何帮助将不胜感激。

最好的问候,亚历山大

0 投票
1 回答
108 浏览

string - 单元格之间的 AWK 间隙

我有一个问题,请你帮帮我吗?我有 .txt 文件,我使用 awk 代码使用制表符分隔功能分隔列。我收到对齐列,但如果缺少某些信息,则整行向左转,信息将转移到另一列。请问你能帮帮我吗?我怎么能合并到这个代码中?太感谢了..

输出:

0 投票
1 回答
21 浏览

mysql - 如何获取数据库数据的空白

好吧,假设我有下表及其各自的值:

我希望知道哪些级别低于更高级别没有玩家。

在这种情况下,我想要结果:(1,3,5)

我正在使用 MYSQL,但任何数据库查询解决方案都可以帮助我解决。

谢谢。

0 投票
1 回答
185 浏览

pandas - 熊猫填补日期空白并用函数覆盖

我有一个包含 2 组的大数据框:分数和日期。熊猫工具是否有一种简单的可能性,可以用之前值的平均值(替代 ewma 等)来填补空白和缺失的分数。

首先,我通过分组覆盖分数,然后将修改后的分组df堆叠在一起。

0 投票
1 回答
1808 浏览

sql - SQL 查询在有间隙的列中查找范围的开始和结束

我在 Access 中有一个表,它有一个 SKU 列和它的 Sales 列。销售列有间隙,即 >=3 的空白或零。零将被视为空白并应被删除。间隙将被视为 >=3 空白或零。对于每个不同的 SKU,我想在其中找到连续范围的开始和结束以及计数(结束 - 开始 + 1)。

小例子:

结果集:

然后应将此结果集连接到原始表,以消除范围计数 <=13 的任何 SKU 行。只有在其 SKU 范围中具有最大计数的 SKU 范围应保存在表/记录集中。

我正在使用 MSAccess,但任何人都可以将其演示为 Access 查询和 SQL Server 查询吗?

=================== 编辑=========================

嗨@凯文,

我终于让查询工作并给了我正确的销售周范围,尽管我现在需要一些帮助才能将其连接回原始临时表以仅提取选择性行。JFYI,在运行此查询之前,我已更新所有销售 KPI 列以将 NULL(空白)替换为零。

  1. 我需要将 CTE 的哪些字段连接到暂存表字段才能仅在表中显示这些选择性期间行?

  2. 我相信这个查询可以被优化并变得更简洁。但是怎么做?

  3. 此外,如果我从上面的CorrectWeekPeriods中注释最后一个WHERE子句,并多次运行查询,我会得到不同的行数。我检查了执行计划,没有收到任何错误。

如果我只是取消注释WHERE 子句:

或者这个:

我得到了正确的最小和最大销售周范围。

  1. 另外,如果我取消注释

    WHERE C.Description='0241004245'

我得到执行计划中显示的错误:

但是,如果我保留最后一个 WHERE 子句的注释,我不会收到此错误。顺便说一句,我已经创建了上述索引,所以不知道为什么它要求我再次创建相同的索引。为什么会发生这种情况?

此外,最后几个注释代码是我试图创建但无法编写正确代码的规则。这是规则:

  1. 如果有 2 个或更多 SKU 销售周范围,则选择最大的一个(如果从 2011 年的第 1 周开始,则更好)。
  2. 排除 >52 的任何范围,使它们达到 <=52。
  3. 如果所有 SKU 销售周范围 >13 且 <=52,则只保留最大的一个(如果从 2011 年的第 1 周开始,则更好)。
  4. 排除任何范围 <=13。

希望有人可以指导我正确的方向(特别是我的主要观点 1 加入到 Staging 表以提取适当的 SKU 销售周范围)。

编辑...我只是再次取消注释最后一个 WHERE 子句:

并查看了执行计划。它在 SORT & HASH 上显示警告。警告信息是:

每次执行查询时,我都会得到不同的行数。该查询也需要大约 1 分钟的时间来执行。我认为它与yearweek表的联接有某种关系,但不知道如何解决这个问题。

非常感激任何的帮助。

嗨@凯文库克,

这是表定义:

0 投票
1 回答
1138 浏览

matlab - 在 MATLAB 中填充周期性时间序列中的数据空白

我正在寻找一种方法来使用 MATLAB 填充包含周期性数据的时间序列中的数据间隙(在这种情况下,频率等于潮汐频率,因此包括半昼夜和春季/间歇频率)。数据系列还包含噪声,我想将其叠加在填补时间间隙的人工数据之上。数据有一定的趋势,我想保留。理想情况下,我会研究一种在时间间隔两侧使用记录数据的方法。

无论如何在Matlab中这样做吗?

谢谢你。

唐纳德·约翰

0 投票
2 回答
118 浏览

sql - SQL 报告显示记录条目之间的差距

我编写了一个应用程序,其中记录了许多车辆的使用情况,如屏幕截图所示。

我想为个人使用之间的差距(以英里为单位)生成一份报告,因为除了应用程序中记录的旅行之外,不应使用这些车辆。

当当前记录请求里程表时会出现间隙 - 先前记录结束里程表产生大于 0 的数字 - 对于该特定汽车。查看不同颜色的圆圈。我怎样才能用 sql 实现这一点?我正在使用 oracle (11g) 但我想 sql 会相似。谢谢你。

样本输出:

车辆使用数据库
* 我意识到我应该使用包含差距的测试数据,尽管这些在实践中应该很少见。在这种情况下,

0 投票
2 回答
1743 浏览

r - R: How do I change gaps (holidays) in a time series of a daily index of the stock exchange by the previous day's information?

I'm usin R language and working with time series daily stock index from differents countries. In order to make comparisons between of differents indexes,(like correletaion, causality etc..) I need that all the series have the same number of lines, but because diferents holidays in diferents countries, the number of lines in each series change.

I'm working with extracted files from yahoo finance, with format .csv, like...

I need... for example, suppose that day 2010-01-07 is a holiday, in this case, the next line (line 1285) in the file is the day 2010-01-08:

In need fill the gap in 2010-01-07 with the previus day data, like :

How I can do this ???

My code is (look all the library that I tried using for solve my problem kkk)

Sorry about my bad english

0 投票
3 回答
175 浏览

sql - Postgresql 填补空白 - 给定分支的最新可用信息矩阵

我有一个包含导入文件索引的表,其中包含每个导入文件的日期和分支。

现在我需要做多个分支的合并,所以,我必须在我们假期的时候复制一些分支的信息,以便数据保持一致,基本上我需要用最新的可用信息来填补这些空白。

我尝试使用排名进行一些自联接,以便在它们之间切换并获取以前的数据,但它没有用。

我有一张桌子:

在这个例子中,我想做一个返回的查询:

这张表很小(几千行),所以性能应该不是大问题。

关于如何实现这一目标的任何想法?

现在我正在使用一个函数,它接收间隔日期的运行日期和分支作为参数,并回答作为参数传递的日期之前的最新日期(使用 max(rundate) where rundate <= '$1')

谢谢!

0 投票
2 回答
1010 浏览

r - R - 组合数据框中的向量填充日期中的空白

我将每月观察和建模的数据组织为向量:

其中 X1901.01.01 对应于 1901-01-01 等等。请注意,观测数据和建模数据中的日期并不完全重叠。

这只是一个样本——我的真实数据包含数千个观察结果。

NA将这些向量组合在分配给不匹配日期的数据框中并消除原始日期前面臭名昭著的“X”的最有效(即最快)方法是什么?

这将是生成的数据框: