问题标签 [data-tracing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
windows-search - 跟踪“Windows 搜索”查询
我可以通过注册表启用Windows Search的日志记录(见下文),但这仅捕获通过Windows Search的默认用户界面发送的查询。我想捕获Outlook 2003、Outlook 2007、OneNote 2007或任何其他访问SystemIndex
.
我想做的是分析这些查询,以便更好地了解如何为我用于搜索代码库(物理文件系统)的个人搜索实用程序(WinForms/WPF/ADO.NET/OleDb)构建查询。
我将如何跟踪在Windows Search的 SystemIndex 上执行的所有查询?
validation - 我们有 CSV / SSV。是什么| 分隔值叫什么?
我们有逗号分隔值的 CSV / 分号分隔值的 SSV。
那么a的名称是什么?分离值?
顺便说一句,它的名字是什么?象征?(我记得它是一个管道,但我认为这只是一个非官方名称或 smt)
debugging - 两个程序对象的运行时比较方法
我正在通过一种特定类型的代码测试,这种测试相当麻烦并且可以自动化,但我不确定最佳实践。在描述问题之前,我想明确表示我正在寻找适当的术语和概念,以便我可以阅读更多关于如何实现它的信息。当然,欢迎就最佳实践提出建议,但我的目标很明确:这种方法叫什么?
在最简单的情况下,我有两个程序接收一堆数据,生成各种中间对象,然后返回最终结果。当端到端测试时,最终结果会有所不同,因此需要找出差异发生在哪里。不幸的是,即使是中间结果也可能会有所不同,但并不总是以显着的方式存在(即某些差异是可以容忍的)。最后一个问题是,两个程序之间的中间对象可能不一定具有相同的名称,并且两组中间对象可能不完全重叠(例如,一个程序可能比另一个程序具有更多的中间对象)。因此,我不能假设在两个程序中创建的对象之间存在一对一的关系。
我正在考虑自动进行对象比较的方法如下(它大致受到文本语料库中的频率计数的启发):
- 对于每个程序,A 和 B:创建一个在整个执行过程中创建的对象的列表,可以以非常简单的方式对其进行索引,例如 a001、a002、a003、a004,...,对于 B(b001,.. .)。
- 令 Na = 在 A 中遇到的唯一对象名称的数量,类似地对于 Nb 和 B 中的对象名称。
- 创建两个表,TableA 和 TableB,分别包含 Na 和 Nb 列。条目将在每个触发器处为每个对象记录一个值(即,为每一行,接下来定义)。
- 对于 A 中的每个赋值,最简单的方法是获取所有 Na 项的哈希值;当然,对于那些没有变化的项目,可以使用 LOCF(最后一次观察结转),并且任何尚未观察到的对象都被简单地赋予一个 NULL 条目。对 B 重复此操作。
- 通过它们的哈希值匹配 TableA 和 TableB 中的条目。理想情况下,对象将以大致相同的顺序进入“词汇表”,因此顺序和散列值将允许人们识别值的序列。
- 根据散列值序列何时针对具有发散序列的任何对象发散,查找 A 和 B 之间对象中的差异。
现在,这是一种简单的方法,如果数据简单、原子且不易受到数值精度问题的影响,它可以很好地工作。但是,我相信数值精度可能会导致散列值发散,尽管如果差异大约在机器容差水平,则影响是微不足道的。
第一:这类测试方法和概念的名称是什么?答案不一定是上述方法,而是反映用于比较来自两个(或更多)不同程序的对象的方法类。
第二:对于我在步骤 3 和 4 中描述的内容,存在哪些标准方法?例如,“值”不仅需要是一个哈希值:还可以存储对象的大小——毕竟,如果两个对象的大小差异很大,它们就不可能相同。
在实践中,我倾向于比较少量的项目,但我怀疑当自动化时这不需要来自用户的大量输入。
编辑1:本文与比较执行痕迹有关;它提到了“代码比较”,这与我的兴趣有关,尽管我关心的是数据(即对象)而不是生成对象的实际代码。我只是略读它,但会更仔细地审查它的方法。更重要的是,这表明比较代码跟踪可以扩展到比较数据跟踪。 本文分析了代码跟踪的一些比较,尽管是在一个完全不相关的安全测试领域。
也许数据跟踪和堆栈跟踪方法是相关的。检查点有点相关,但它的典型用途(即保存所有状态)是多余的。
编辑 2:其他相关概念包括差异程序分析和远程系统监控(例如太空探测器),其中尝试使用本地实现重现计算,通常是克隆(想想 HAL-9000 与其地球上的克隆相比) . 我查看了单元测试、逆向工程、各种取证等等的路线。在开发阶段,可以确保与单元测试一致,但这似乎对仪器分析没有用处。对于逆向工程,目标可以是代码和数据一致性,但评估重新设计代码保真度的方法似乎并不容易找到。每个程序的取证很容易找到,但程序之间的比较似乎并不常见。
database-design - 关于客户画像系统的建议:书籍、文章等
我将使用 C# 为我们自己的电子商务网站开展客户分析项目(与 Google Analytics 类似但不同)。我对这种项目很陌生,客户分析项目也是一个全新的项目。你能给我一些建议吗?
我觉得应该有两个部分,第一个是“跟踪网站访问数据”,第二个是“分析跟踪数据”。
你能给我一些建议吗?谢谢:
- 什么样的设计模式最适合这种项目?(管道和过滤器?还是其他?)我正在使用 C#。
- 什么样的数据库最合适?RDBMS 还是文档数据库?
- 如何为存储跟踪数据的数据库表建模?
- 我可以使用哪些关键字在 Google 上搜索此主题?
- 你能给我推荐一些文章或书籍来阅读吗?(文章比较好,因为没那么多时间看书)
- 你认为我需要学习的任何其他东西。
提前致谢!
mysql - 在 MySQL 中跟踪数据更改(更新/删除)
我有一个数据库模式,其中用户数据使用外键引用存储,这些外键是管理员定义的。此外,有一些数据没有主键存储,但是我有其他约束来避免冗余和其他问题。
由于用户“更新”他们的信息时应用程序的要求,我必须从“更新”表中删除所有用户记录并再次重新插入所有用户记录。(我已经研究了所有其他选项)
现在由于我的搜索解决方案 (solr),我需要跟踪对用户数据的更改(更新/删除)。我正计划将最后提交的数据与实时数据进行比较。我担心每 20 分钟左右运行一个存储过程会是多么可持续,有没有更好的方法来使用 SQL 跟踪数据?
dataflow - 是否有一个工具可以跟踪所有给定代码库中的数据流?
是否有工具可以帮助跟踪指定变量的所有潜在用途?目前我需要这个用于 PHP 但也想知道是否有其他语言的(更好的)工具。
我发现http://phpcallgraph.sourceforge.net/会提供一些帮助,但它似乎绘制了函数树,包括最肯定不使用我想要遵循的数据的函数。从函数调用树中过滤掉所有那些“不相关”函数的选项显然是我正在寻找的。此外,我需要依次查看每个调用者函数的所有被调用函数(仅在传递特定变量/值时)。
需要在更改现有的、组织得不太好的代码时查看特定 DB 字段的值(ei 数据依赖关系)的所有可能用途,以了解其更改可能对代码产生什么影响以及在哪里进行相应修改,如果需要。
sql-server - 从不同的表中更新 GetDate 函数的日期
我对编写 SQL 还很陌生,而且我认为自己在编程的各个方面都是新手。我一直在为朋友做一个 sql 项目,并想跟踪更改。我正在使用 SQL Server 和 Transact-SQL。这是最基本的表格格式和关系:
表 1:HouseNo、StreetName、TerritoryNo(FK)
表 2:TerritoryNo(PK),跟踪
表之间的关系:TerritoryNo
基本上,只要 Table1 中的任何相应行发生更改,我都希望使用 getdate() 函数更新 Table2 中 TerritoryNo 的 Tracking 列。这怎么可能实现?或者这甚至可能吗?
感谢您的帮助,甚至回顾了这个话题!!
tsql - SQL Server 2014 跟踪信息
我对某些表中的行中的数据有疑问。我想知道他们是如何改变的。如果有人通过更新或代码应用程序进行了更改。不幸的是,我没有“更改跟踪 = 开启”选项,而且我无法使用功能 - 我收到错误消息
消息 22105,第 16 级,状态 1,第 1 行
有机会以某种方式检查吗?
sparql - 是否有一个 SPARQL 查询来将一个工作流的不同流程步骤跟踪到一行中
我使用 GraphDB 来存储不同的生产步骤。生产步骤以它们的步骤为代表,例如 A、B、C、D。属于一起的流程步骤由对象属性“:hasUpstreamProduktionsnummer”连接。
数据包含许多不同的工作流程。还缺少一些生产步骤。因此,工作流可以以 B 类的实例结束,也可以以 C 类的实例开始。
为了可视化工作流程,我需要创建一个表格,其中包含一行中的所有生产步骤,并为缺失的部分保留可用空间。例如:
我的方法是 :hasUpstreamProduktionsnummer 作为 transtiv 和以下:
对于工作流 1,查询将产生以下结果:
是否有任何选项可以在一行中查询它们?
有没有写查询效率更高的?就我而言,我需要为 B 和 C 写下相同的内容作为起点。
数据:
感谢您提前提供帮助!
normal-distribution - 如何使用 RosinRammlerDistribution 中的参数来调整粒子注入的配置文件
我正在尝试在将粒子注入气流的拉格朗日运动学解决方案中使用 RosinRammlerDistribution,即。
其中 minValue 和 maxValue 是被注入粒子的最小和最大直径,而据我所知,d 是平均直径值。参数 n 被描述为“形状”因子,但它的范围是多少?向正方向改变它是什么意思?d 和 n 的值是多少会产生偏向较小粒子的轮廓?我已经对此进行了一些探索,但是每次运行显示 5 秒的注射时间,在一台相当不错的机器上花费了我多达 2 个小时。此外,我在文献中找不到一个名为或与 RosinRammler 相关的方程,它使用这样的一组参数,因此我无法为各种参数绘制一个简单的方程图。这实际上与这些参数一起使用的方程将不胜感激,