问题标签 [standardized]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
980 浏览

handle - 标准化错误分类和处理

我需要标准化我如何“优雅地”分类和处理错误/异常。

我目前使用一个过程,通过该过程将错误报告给传递错误号、严重性代码、位置信息和额外信息字符串的函数。如果错误是致命的并且应用程序应该死掉,则此函数返回布尔值 true,否则返回 false。作为其过程的一部分,除了向用户提供视觉反馈外,该功能还记录到某些严重级别以上的错误。

错误编号索引解释错误类型的字符串数组,例如:“文件访问”、“用户输入”、“线程创建”、“网络访问”等。严重性代码是 0,1 的二进制或, 2 或 4,0=提供信息,1=user_retry,2=cannot_complete,4=cannot_continue。Location-info 是模块和函数,Extra-info 是参数和局部变量值。

我想把它变成一种标准的错误处理方式,我可以把它放在一个库中并在我的所有应用程序中重复使用。我主要在 Linux 上使用 C/C++,但也希望将生成的库与其他语言/平台一起使用。

  • 一个想法是扩展错误类型数组以指示给定严重级别的某些默认行为,但这是否应该成为所采取的操作并且不给用户选项?

  • 或者:这样的扩展是否应该是用户需要从中选择的选项的子数组?这样做的问题是,这些选项必须是通用的与编程相关的选项,这可能会完全让最终用户感到困惑。

  • 或者:每个使用 error-lib 例程的应用程序是否应该传递自己的错误或默认行为数组 - 但这会破坏库的目的......

  • 或者:是否应该在每个应用程序中处理严重性级别?

或者:你有什么建议?你如何处理错误?我该如何改进呢?

0 投票
13 回答
1972 浏览

standardized - 开发人员工具、语言、框架等是否应该在整个组织中标准化?

我目前工作的组织似乎正朝着向软件开发人员规定必须使用哪些工具、语言、框架等的方向前进。然而,没有人让我相信这是一件好事。我听到的主要论点是它会使培训更容易。但是,在开发软件 10 多年之后,我从来没有依靠培训来学习如何使用 IDE、编程语言或其他任何东西。所以我无法联系。

随着技术的快速发展,而我知道标准适应的速度很慢,我担心我的客户会有我无法轻松实施或无法高效实施的要求我应该这样做。例如,如果 Web 应用程序中有自动完成功能的 UI 要求,但尚未批准任何 API,我需要自己实现自动完成功能,而不是使用提供的众多 API 之一它开箱即用。

一个更激进的例子是,如果我的客户想要拥有 Google Wave 功能。在这种情况下,我希望能够灵活地配置我的开发环境(包括 IDE)并选择合适的框架(例如:GWT)来使用。

请提供反馈,说明您是否认为软件开发工具、语言等应该标准化,并提供几点支持您的论点。

0 投票
3 回答
4184 浏览

python - Python不是标准化语言?

我偶然发现了这个“编程语言列表”,发现像 Python 这样的流行语言没有标准化?为什么会这样,“标准化”到底是什么意思?

0 投票
2 回答
5372 浏览

r - R:使用均值和标准差函数进行标准化

我正在尝试做一个简单的转换。我使用了以下代码,它运行良好:

但是,我无法让以下代码工作:

我也试图让 mean 函数起作用:

但是,我不断收到以下错误:

所以我猜这与我如何使用 mean 和 sd 函数有关,但我无法弄清楚。

数据示例:

0 投票
5 回答
23944 浏览

preprocessor - 处理神经网络输入的文本字符串

我知道 ANN 输入必须被规范化、标准化等。撇开各种 ANN 的特性和模型不谈,我如何在 {0,1} 范围内或在 {-1} 范围内预处理 UTF-8 编码文本, 1} 在作为神经网络的输入之前?我一直在谷歌上搜索这个但找不到任何信息(我可能使用了错误的术语)。

  1. 那有意义吗?
  2. 这不是为神经网络预处理文本的方式吗?
  3. 有没有其他选择?

2013 年 11 月更新

我早就接受了皮特的正确答案。然而,我有严重的怀疑,主要是由于我最近对符号知识和 ANN 的研究。

Dario Floreano 和 Claudio Mattiussi在他们的书中解释说,通过使用分布式编码,这种处理确实是可能的。

实际上,如果您尝试使用 google 学者搜索,就会发现大量的神经科学文章和论文,这些文章和论文介绍了如何假设大脑使用分布式编码来编码符号知识。

Teuvo Kohonen在他的论文“自组织地图”中解释说:

有人可能认为,将神经适应定律应用于符号集(被视为一组矢量变量)可能会创建一个显示符号之间“逻辑距离”的地形图。然而,与连续数据相比,存在符号的不同性质的问题。对于后者,相似性总是以自然的方式出现,作为它们连续编码之间的度量差异。对于没有定义度量的离散符号项目(例如单词)不再适用。符号的本质与它的编码是分离的。

然而,Kohonen 确实设法处理了 SOM 中的符号信息!

此外,Alfred Ultsch 教授在他的论文“神经网络与符号知识处理的集成”中准确地处理了如何在人工神经网络中处理符号知识(例如文本)。Ultsch 提供以下处理符号知识的方法:神经近似推理、神经统一、内省和综合知识获取。尽管在谷歌学者或其他任何地方都找不到关于这方面的信息。

皮特在他的回答中关于语义是正确的。ANN 中的语义通常是不连贯的。然而,在参考之后,提供了研究人员如何使用 RBM 的见解,这些 RBM 被训练以识别不同单词输入的语义相似性,因此拥有语义应该不是不可能的,但如果需要语义,则需要分层方法或辅助 ANN .

使用子符号神经网络进行自然语言处理,Risto Miikkulainen,1997 年 在单词观察上训练受限玻尔兹曼机,GEDahl,Ryan.P.Adams,H.Rarochelle,2012 年

2021 年 1 月更新

NLP 和深度学习领域的研究在过去几年中出现了复苏,自从我提出这个问题以来。现在有机器学习模型可以解决我试图以多种不同方式实现的目标。

对于遇到此问题并想知道如何在深度学习或神经网络中预处理文本的任何人,这里有一些有用的主题,它们都不是学术性的,但很容易理解,它们应该可以帮助您开始解决类似的任务:

在我问这个问题的时候,RNN、CNN 和 VSM 即将开始使用,现在大多数深度学习框架都支持广泛的 NLP 支持。希望以上有所帮助。

0 投票
1 回答
1631 浏览

r - R 插入符号 glmnet 标准化 = FALSE

我正在尝试使用该caret软件包来玩模型的alpha关卡glmnet。问题是我使用的数据都是虚拟变量,我不想glmnet标准化它们。通常,如果我只是使用glmnet或单独使用cv.glmnet,我会添加

是否有caret关闭标准化的设置?

0 投票
0 回答
90 浏览

r - 我正在尝试按集群填充 NA

我有数据“学院”。它有许多 NA。

根据标准化数据,我制作了 11 个集群和 11 个集群的数据集。现在原始数据College 有一个观察结果。它有许多 NA,但并非所有都是 NA。但是,其列值未标准化。

我希望它具有除 NA 之外的标准化值,以便确定它应该属于 11 个集群中的哪个。

如果您有任何答案,请告诉我。

0 投票
1 回答
52 浏览

r - 在数据集中,我想将每个元素更改为 p 值

我有一个数据集,9X12 矩阵。数据集被标准化为正常,所以我可以比较每个元素。

为了更好地比较,我想将每个值更改为 p 值。

我怎样才能做到?(请使用上面的矩阵。)

请告诉我。

0 投票
2 回答
1341 浏览

r - 如何按组缩放变量

我非常感谢您在这个问题上的帮助。我有以下数据集,我想创建一个新变量,该变量将包含给定因子变量的每个级别的标准化值(z 分布)。

我的目标是创建一个新变量,其中包含为每个因子水平(男孩和女孩)分别计算的 z 值。

还有一个问题。我主要想用 z 值创建一个变量。如果我想应用另一个函数,例如计算每个因子水平的分位数分布,会不会类似?

谢谢您的帮助!

0 投票
2 回答
1169 浏览

machine-learning - 神经网络 - 训练集和验证集是否需要单独的标准化?

我正在训练这个 5-5-2 反向传播神经网络,在阅读了 LeCun 的这篇很棒的文章后,我开始将他提出的一些想法付诸实践。

目前我正在使用我自己制作的 10 倍交叉验证算法对其进行评估,基本上是这样的:

我的输入和输出是标准化的(0 均值,方差 1),我使用的是 tanh 激活函数。所有网络算法似乎都能正常工作:我使用相同的实现来近似 sin 函数,它做得很好。

现在,问题正如标题所暗示的那样:我应该分别标准化每个训练/验证集还是只需要标准化整个数据集一次

请注意,如果我做后者,网络不会产生有意义的预测,但我更喜欢有一个更“理论”的答案,而不是只看输出。

顺便说一句,我用 C 实现了它,但我对 C++ 也很满意。