问题标签 [analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database - 真实世界的 MySQL/Postgres 数据库模式示例和分析工具
我正在对模式演变进行分析,但实际上并没有真正实现一些演变并存储在版本控制中的真实世界数据库模式。到目前为止, Mediawiki(http://svn.wikimedia.org/svnroot/mediawiki/trunk/phase3/maintenance/tables.sql)似乎是一个非常好的候选者。我考虑过Bugzilla,但它们似乎没有像Mediawiki 那样的主干中的.sql 文件。必须执行构建数据库架构/表的 Perl 脚本 - 因此,我现在基本上必须下载整个 Bugzilla 文件夹以进行不同的修订,以了解架构更改,而不是像在 mediawiki(tables.sql) 中那样只获取一个文件。
问题 1: 我想知道你们中是否有人知道或使用过大型数据库模式,这些模式是开源的,处于修订控制之下,并且更改大到足以进行模式演化分析(最好有 DDL 脚本 - .sql 文件)。
问题 2: 此外,您是否遇到过任何可以对 .sql 文件(DDL 脚本)提供分析(表/列数、修订之间的补丁等)的工具。我发现的所有工具都需要在对它们进行任何分析之前将 .sql 文件加载到数据库中。
对于这两个问题,首选 MySQL 或 Postgres 作为数据库。
我感谢这个社区的其他成员的任何回应。
谢谢,
文卡特什曼陀罗巴
linux - 确定特定术语的词频
我是一名非计算机科学专业的学生,正在撰写一篇历史论文,该论文涉及确定许多文本中特定术语的频率,然后随着时间的推移绘制这些频率以确定变化和趋势。虽然我已经弄清楚如何确定给定文本文件的词频,但我正在处理(相对而言,对我而言)大量文件(> 100),并且为了保持一致性,我想限制频率计数中包含的词到一组特定的术语(有点像“停止列表”的反面)
这应该保持非常简单。最后,我需要的是我处理的每个文本文件的特定单词的频率,最好是电子表格格式(制表符描述的文件),这样我就可以使用该数据创建图表和可视化。
我每天都在使用 Linux,对使用命令行很舒服,并且喜欢开源解决方案(或者我可以用 WINE 运行的东西)。然而,这不是一个要求:
我看到了两种解决这个问题的方法:
- 找到一种方法去除文本文件中除预定义列表之外的所有单词,然后从那里进行频率计数,或者:
- 找到一种仅使用预定义列表中的术语进行频率计数的方法。
有任何想法吗?
c - 新的 C 代码动态工具分析
有人能告诉我有哪些新的 C 代码动态工具分析,比如 valdgrind 吗?
algorithm - 你如何检测字符串列表中的重复?
我有一系列 SQL 调用,我想用它来检测循环(以及因此不必要的重复 sql 调用),但它让我想到了这个更普遍的问题。
给定一个列表,说
[a,b,c,b,c,a,b,c,b,c,a,b,b]
有什么办法可以把它变成
a,[[b,c]*2,a]*2,b*2
或者,[a,[b,c]*2]*2,a,b*2
也就是说,检测重复(可能是嵌套的)。
analysis - Web 服务器日志分析工具
对于准确的 Web 日志分析工具以生成 IIS 日志报告有什么建议吗?我们使用了 WebTrends,但我觉得它并不准确。
winforms - 帮我分析这个调用堆栈,看看是什么调用了我的方法
好的,所以我有一个非常简单的表单,其中几乎没有逻辑,由演示者控制。有一个方法 public void Reset() 将表单重置为其初始状态。这应该只由演示者调用,并且在非常特殊的情况下(例如活动超时)。我遇到了一个问题,尽管在一些边缘情况下(例如,当我模拟我的应用程序失去数据库连接时) Reset() 方法在不应该被调用的时候被调用,我无法弄清楚是什么.
所以我在 Reset() 方法中设置了一个跟踪点并让它打印调用堆栈。奇怪的是,这引发了更多的问题。谁能帮我弄清楚对 Reset() 的调用来自哪里?我的调用堆栈在下面。
我应该解释的一件事是 DriverInterface2.UI.WinForms.NonInheritingForms.CheckInForm 您可以在调用堆栈中看到。这是 ICheckInForm(相关接口)的一个非常简单的实现,只需创建 CheckInForm 并将其委托给它。它存在只是因为我使用的是城堡温莎,并且连接从 Form 继承的类变得非常混乱。无论如何,该方法的全部内容是这样的:
这是调用堆栈:
c++ - 查看包含依赖项
有谁知道一种工具可以分析 C++ 代码库并显示哪些文件包含哪些头文件并突出显示冗余包含的图形表示?我使用了理解 C++,但它很昂贵,并且在大型(且封装不佳)代码库上很快变得非常笨拙。
graphics - 成像问题:如何确定图像质量?
我正在寻找确定摄影质量的方法(jpg)。我想到的第一件事是将文件大小与存储在其中的像素数量进行比较。还有其他方法吗,例如检查 jpg 中的噪声量?有没有人有关于这个主题的良好阅读链接或任何经验?顺便说一句,我正在处理的项目是用 C# (.net 3.5) 编写的,我使用 Aurigma Graphics Mill 进行图像处理。
提前致谢!
loops - 在复杂性分析中,为什么 ++ 被认为是 2 个操作?
在我的计算机科学 II 课上,教授认为 ++、--、*= 等是 2 个操作。但是,在组装级别,这并不是真正的两个操作。有人可以解释一下还是只是为了简单起见?
asp-classic - 找出真正的文件类型
我正在处理一个处理文件上传的 ASP 网页。仅允许上传特定类型的文件,例如 .XLS、.XML、.CSV、.TXT、.PDF、.PPT 等。
我必须确定一个文件是否真的与扩展名显示的类型相同。换句话说,如果将trojan.exe重命名为harmless.pdf并上传,应用程序必须能够发现上传的文件不是.PDF 文件。
您将使用什么技术来分析这些上传的文件?我在哪里可以获得有关这些文件格式的最佳信息?