问题标签 [parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
6 回答
11481 浏览

sql - 有没有办法解析 SQL 查询以提取列名和表名?

我在单独的文本文件中有 150 多个 SQL 查询,我需要分析这些查询(只是实际的 SQL 代码,而不是数据结果),以便识别所有使用的列名和表名。最好是每列和表格出现的次数。使用嵌套的 SELECT 语句等编写一个全新的 SQL 解析程序比看起来要复杂得多。

必须有一个程序或代码可以做到这一点(或接近这个),但我还没有找到它。

0 投票
6 回答
17003 浏览

c# - C# Casting 与 Parse

以下哪个是 C# 中更好的代码,为什么?

或者

最终,是强制转换还是解析更好?

0 投票
9 回答
4262 浏览

c# - 在 C# 中解析确切日期不应强制您创建 IFormatProvider

如果我错了,请有人纠正我,但是在 C# 中解析 yyyy/MM/dd(或其他特定格式)日期应该

但不,C# 强制您创建一个 IFormatProvider。

是否有一种 app.config 友好的设置方式,所以我不需要每次都这样做?

0 投票
10 回答
22221 浏览

javascript - 解析字符串:提取单词和短语 [JavaScript]

我需要在以空格分隔的术语列表中支持确切的短语(用引号括起来)。因此,用空格字符分割相应的字符串是不够的。

例子:

我想知道这是否可以通过单个 RegEx 来实现,而不是执行复杂的解析或拆分和重新加入操作。

任何帮助将不胜感激!

0 投票
6 回答
4816 浏览

php - PHP 中的容错 HTML/XML/SGML 解析

我有一堆类似 HTML 的遗留文档。例如,它们看起来像 HTML,但有额外的组成标签,这些标签不是 HTML 的一部分

我需要解析这些文件。PHP 是唯一可用的工具。这些文档并不接近于格式良好的 XML。

我最初的想法是在 PHP DOMDocument 上使用 loadHTML 方法。但是,这些方法会阻塞 HTML 标签,并且会拒绝解析字符串/文件。

我能想出的唯一解决方案是使用字符串替换函数对文件进行预处理,该函数将删除无效标签并用有效的 HTML 标签替换它们(可能是带有标签名称 id 的跨度)。

有没有更优雅的解决方案?一种让 DOMDocument 知道其他标签被认为是有效的方法吗?PHP 是否有一个不同的、强大的 HTML 解析类/对象?

(如果不是很明显,我不认为正则表达式是一个有效的解决方案)

更新:假标签中的信息是这里目标的一部分,所以像 Tidy 这样的东西不是一个选择。此外,我正在寻找某种程度的(如果不是全部的话)格式良好的清理方法,这就是为什么我首先寻找 DomDocument 的 loadHTML 方法的原因。

0 投票
19 回答
142720 浏览

.net - 如何将查询字符串解析为 .NET 中的 NameValueCollection

我想将一个字符串解析p1=6&p2=7&p3=8成一个NameValueCollection.

当您无权访问Page.Request对象时,最优雅的方法是什么?

0 投票
12 回答
12969 浏览

algorithm - 如何从写成单词的数字中读取值?

众所周知,数字可以写成数字,也可以用它们的名字来称呼。虽然可以找到很多将 123 转换为 123 的示例,但我找不到如何将其反过来转换的好示例。

一些警告:

  1. 基数/名义或序数:“一”和“第一”
  2. 常见拼写错误:“四十”/“四十”
  3. 百/千:2100 -> “2100”和“2010”
  4. 分隔符:“十一百五十二”,还有“十一百五十二”或“十一百五十二”等等
  5. 俗语:“三十多岁”
  6. 分数:'三分之一','五分之二'
  7. 常用名称:“一打”、“半”

可能还有更多尚未列出的警告。假设算法需要非常健壮,甚至可以理解拼写错误。

我应该阅读哪些领域/论文/研究/算法来学习如何编写所有这些?信息在哪里?

PS:我的最终解析器实际上应该理解 3 种不同的语言,英语、俄语和希伯来语。也许在稍后阶段会添加更多语言。希伯来语也有男性/女性数字,例如“one man”和“one woman”有不同的“one”——“ehad”和“ahat”。俄语也有其自身的一些复杂性。

谷歌在这方面做得很好。例如:

http://www.google.com/search?q=two+thousand+and+one+hundred+plus+5+dozen+and+four+fifths+in+decimal

(反过来也可以http://www.google.com/search?q=999999999999+in+english

0 投票
11 回答
139256 浏览

c# - C# 有像 Java 那样的字符串标记器吗?

我正在做简单的字符串输入解析,我需要一个字符串标记器。我是 C# 新手,但已经编写了 Java,C# 应该有一个字符串标记器似乎很自然。可以?它在哪里?我该如何使用它?

0 投票
7 回答
516 浏览

parsing - 解析文件的工具

我试图找出解析 GE Logician MEL 跟踪文件以使其更易于阅读的最佳方法。

它有像

我可以通过程序来完成它,但是在我使用过所有正则表达式之后,我发现很难相信没有任何东西可以让我以类似的方式定义解析文件的规则。我错了吗?

0 投票
7 回答
6675 浏览

php - 是否有用于 Javascript 或 PHP 的解析表达式语法 (PEG) 库?

我发现自己被用于描述域特定语言的解析表达式语法形式主义所吸引,但到目前为止,我发现的实现代码是用 Java 和 Haskell 等语言编写的,这些语言在我的组织的共享托管环境中对 Web 服务器不友好不得不忍受。

有谁知道任何用于 Javascript 或 PHP 的 PEG 库或 PackRat 解析器生成器?当然,可以生成 Javascript 或 PHP 源代码的任何语言的代码生成器都可以解决问题。