问题标签 [normalize]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
internet-explorer - TinyMCE 和引导程序冲突
我使用 tinyMCE 编辑器来编辑我网站上的文章内容,并使用 bootstrap.css 来设置内容样式。当我在 Internet Explorer 中这样做时,我遇到了一些麻烦。TinyMCE 通过设置宽度和高度属性的本机浏览器方法调整图像大小。但是 Bootstrap 使用 normalize.css,它会重置图像的宽度和高度,并打破 IE 中的宽度和高度属性。我能做些什么来避免这种情况?在将文章内容提交到服务器之前,我需要将属性转换为样式,但是getContent 事件上的插入处理程序无济于事
java - 从略有不同的多个文件映射多个列
我正在寻找一种很好的实用方法来处理多个文件之间的元数据规范化,这些文件的架构略有不同,用于 Talend 中的批处理 ETL 作业。
我有几百个历史报告(每个大约 25K 到 200K 记录),每个 excel 文件大约有 100 到 150 列。所有文件的大多数列名都是相同的(98% 重叠),但是存在细微的邪恶差异:
- 不同的列顺序
- 不同的列名(有时使用,有时不使用缩写)
- 不同的列数
- 有时列在单词之间有空格,有时是点、破折号或下划线
- 等等
除了编写专门的应用程序或通过手动更正它们来强制所有文件,是否有任何好的免费工具或方法可以以智能或半自动的方式提供文件列名之间的差异和更正?
string - 如何在 WP7 中从字符串中删除重音符号
我想从 Windows Phone 7 中的字符串中删除重音符号(变音符号)。这里的解决方案适用于 .NET(桌面版)。但是,WP7 字符串没有Normalize
方法。
有人建议从 string 更改为 byte,但我不知道他的意思。如何去除口音?
javascript - 如何规范化 JavaScript 中的正数列表?
我有一个充满正 int 值的数组,我怎样才能规范化这个列表,使最大值始终为 100?先感谢您!
sql - 如何使用 XSLT 和一个键来规范化 SQL Server 生成的 XML
当我从 SQL Server 查询数据 AS XML 时,它通常会生成重复的 XML 节点。通常我可以调整查询以消除这种情况,但并非总是如此。对于那些我不能的时候,我最终得到了这样的 XML:
请注意,有两个彼此相邻的 <House> 节点,它们的属性相同。它们仅在子节点上有所不同。我正在尝试创建一个 XSLT,它将采用相同的兄弟节点,并将它们折叠成一个包含所有子节点超集的节点。在示例中,<House houseId="3"> 将包含 <Dog> 和 <Human> 节点。像这样:
不仅合并了两个相同的 House 节点,还合并了重复的 Dog 和 Human 节点。但请注意,在两个不同的 <House> 节点下列出的 <Dog dogId='13' name='Rover'> 节点并未合并,因为它们不相同。(由于他们的祖先。)这就是我想要的:组合匹配的兄弟节点。
因为 XML 是由 SQL 生成的,所以 XSLT 将处理许多不同名称和排列的节点。因此,我无法对节点名称进行硬编码。但我可以放心,每个节点都会有一个相应的 id 属性,该属性将包含一个数值。例如:<House houseId="3">、<Dog dogId="17"> 和 <Flea fleaId="13">。
我也知道根节点没有属性,所以我可以开始处理根节点的子节点。
我的策略是为每个节点创建一个 xsl:key,其中节点的键值是其祖先节点与 id 值的串联。示例键值在下面的评论中
因此,两个看似匹配的 <Dog dogId='13' name='Rover'> 将通过它们的祖先来区分:
<Xml><House houseId="3"><Dog dogId='13' name='Rover'>
houseId=3;dogId=13
对比
<Xml><House houseId="5"><Dog dogId='13' name='Rover'>
houseId=5;dogId=13
这样,可以组合重复(兄弟)节点。不幸的是,我很难理解如何使用 XSL 和 xslt:key 来实现它。任何帮助将不胜感激。
math - 按比例标准化
我有一个二维数据数组(C),其中C(:,1)的值对应于C(:,2)。C(:,2)从 0.0001:0.0001:1 变化,即 10,000 个值。我需要计算d(log(C(i,1))) / d(log(C(i,2))),我只需计算log(C(i,1)) / log(C (i,2))。但是当 C(i,2) 接近 1 时,分母接近 0,并且商会上升。控制这一点的一种方法是使用参数对其进行规范化,但我不确定如何做到这一点。有人对此有任何想法吗?
css - 使用 Twitter 引导程序规范化样式表
我刚刚开始一个我正在使用 Twitters Bootstrap 的项目,并且想知道它是否有自己的重置规则。
通常我会使用规范化样式表来帮助我的网站在跨浏览器上看起来更一致,但 Bootstrap 需要这样做吗?
javascript - 在 javascript 中规范化现有数据集的最有效方法
我有一个想要标准化的平面数据集。数据集是存在的,源是不可更改的,因此定义更好的数据结构不是一种选择。我已经设法“规范化”并重组数据,但我不确定当行数开始增长时它的效率如何?这就是我所拥有的,就像我说的那样,它只是在寻找更优雅的解决方案......
这是理想输出的样子
sql - 有什么更好的方法来创建我的食物数据库?
我承担了创建一个关系数据库的项目,该数据库将包含我们在现代烹饪中使用的所有基本成分。正如您可以想象的那样,将有数千个项目。我没有太多的 sql 经验,所以我无法找到一种看似有效的存储成分的方法。如果你去这里http://en.wikipedia.org/wiki/Outline_of_food_preparation#General_ingredients你可以看到我目前正试图放入我的数据库的列表。
我的数据库当前有一个表格,用于食品 ex 的每个主要和子类别。谷物的桌子和小麦的不同桌子。起初这样做似乎没问题,但后来我意识到还会有几十个子类别。对于该 wiki 列表中的每个项目,我必须创建更多表和更多表。我觉得过多的表格会使我的项目效率很低。有没有更好的方法来创建我的数据库?还是我走在正确的轨道上?这是我的表中列的示例:
parent INT(11) 将是任何父表的外键,所以我认为它们都会以这种方式连接。任何建议表示赞赏!~谢谢
preprocessor - 处理神经网络输入的文本字符串
我知道 ANN 输入必须被规范化、标准化等。撇开各种 ANN 的特性和模型不谈,我如何在 {0,1} 范围内或在 {-1} 范围内预处理 UTF-8 编码文本, 1} 在作为神经网络的输入之前?我一直在谷歌上搜索这个但找不到任何信息(我可能使用了错误的术语)。
- 那有意义吗?
- 这不是为神经网络预处理文本的方式吗?
- 有没有其他选择?
2013 年 11 月更新
我早就接受了皮特的正确答案。然而,我有严重的怀疑,主要是由于我最近对符号知识和 ANN 的研究。
Dario Floreano 和 Claudio Mattiussi在他们的书中解释说,通过使用分布式编码,这种处理确实是可能的。
实际上,如果您尝试使用 google 学者搜索,就会发现大量的神经科学文章和论文,这些文章和论文介绍了如何假设大脑使用分布式编码来编码符号知识。
Teuvo Kohonen在他的论文“自组织地图”中解释说:
有人可能认为,将神经适应定律应用于符号集(被视为一组矢量变量)可能会创建一个显示符号之间“逻辑距离”的地形图。然而,与连续数据相比,存在符号的不同性质的问题。对于后者,相似性总是以自然的方式出现,作为它们连续编码之间的度量差异。对于没有定义度量的离散符号项目(例如单词)不再适用。符号的本质与它的编码是分离的。
然而,Kohonen 确实设法处理了 SOM 中的符号信息!
此外,Alfred Ultsch 教授在他的论文“神经网络与符号知识处理的集成”中准确地处理了如何在人工神经网络中处理符号知识(例如文本)。Ultsch 提供以下处理符号知识的方法:神经近似推理、神经统一、内省和综合知识获取。尽管在谷歌学者或其他任何地方都找不到关于这方面的信息。
皮特在他的回答中关于语义是正确的。ANN 中的语义通常是不连贯的。然而,在参考之后,提供了研究人员如何使用 RBM 的见解,这些 RBM 被训练以识别不同单词输入的语义相似性,因此拥有语义应该不是不可能的,但如果需要语义,则需要分层方法或辅助 ANN .
使用子符号神经网络进行自然语言处理,Risto Miikkulainen,1997 年 在单词观察上训练受限玻尔兹曼机,GEDahl,Ryan.P.Adams,H.Rarochelle,2012 年
2021 年 1 月更新
NLP 和深度学习领域的研究在过去几年中出现了复苏,自从我提出这个问题以来。现在有机器学习模型可以解决我试图以多种不同方式实现的目标。
对于遇到此问题并想知道如何在深度学习或神经网络中预处理文本的任何人,这里有一些有用的主题,它们都不是学术性的,但很容易理解,它们应该可以帮助您开始解决类似的任务:
在我问这个问题的时候,RNN、CNN 和 VSM 即将开始使用,现在大多数深度学习框架都支持广泛的 NLP 支持。希望以上有所帮助。