问题标签 [parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
8918 浏览

ms-access - 在 MS Access 中解析文本

我有包含字符串的列。该列中的字符串如下所示:

第一串/第二串/第三串

我需要解析这个,所以我有两个值:

值 1:FirstString/SecondString 值 2:ThirdString

我实际上可以有更长的字符串,但我总是需要它像 [string1/string2/string3/...][stringN] 那样分开

我需要结束的是:

第 1 列:[string1/string2/string3/etc....] 第 2 列:[stringN]

我无论如何都找不到这样做的权限。有什么建议么?我需要正则表达式吗?如果是这样,有没有办法在查询设计器中做到这一点?

更新:这两个表达式都给我这个错误:“您输入的表达式包含无效的语法,或者您需要将文本数据括在引号中。”

0 投票
1 回答
3407 浏览

java - 为什么我无法在 Java 中解析具有模式“MMMMM dd”的 SimpleDateFormat?

我需要将像“February 12, 1981”这样的字符串解析为日期。我使用SimpleDateFormat。但如果我这样做:

我得到 java.text.ParseException。

我试图减少它以查看问题所在。第一的:

作品。然后:

不再起作用了。有谁知道为什么?我也试过了new SimpleDateFormat("MMMMM' 'dd")

我正在使用 JRE 1.6.0_06。

0 投票
24 回答
144749 浏览

sql - SQL:从全名字段中解析名字、中间名和姓氏

如何使用 SQL 从全名字段中解析名字、中间名和姓氏?

我需要尝试匹配与全名不直接匹配的名称。我希望能够获取全名字段并将其分解为名字、中间名和姓氏。

数据不包括任何前缀或后缀。中间名是可选的。数据格式为“First Middle Last”。

我对一些实用的解决方案感兴趣,可以让我完成 90% 的工作。如前所述,这是一个复杂的问题,因此我将单独处理特殊情况。

0 投票
8 回答
1475 浏览

python - 在 Perl 或 Python 中模拟类似 lex 的功能

这是交易。有没有办法根据多个正则表达式在一行中对字符串进行标记?

一个例子:

我必须根据不同的正则表达式获取所有 href 标记、它们对应的文本和其他一些文本。所以我有 3 个表达式,并且想对行进行标记并提取与每个表达式匹配的文本标记。

我实际上是使用 flex 完成的(不要与 Adob​​e 混淆),它是旧 lex 的一个实现。lex 通过基于表达式执行“动作”提供了一种优雅的方式来做到这一点。也可以控制 lex 读取文件的方式(基于块/行的读取)。

问题是 flex 实际上生成了实际执行标记化工作的 C/C++ 代码。我有一个包含所有这些东西的 make 文件。我想知道 perl /python 是否可以以某种方式做同样的事情。只是我想用一种编程语言本身做我喜欢的一切。

标记化只是我想要在我的应用程序中做的事情之一。

除了 perl 或 python 之外,任何语言(也可以是函数式)都可以做到这一点吗?

我确实在这里阅读了 PLY 和 ANTLR(解析,我在哪里可以了解它)。

但是有没有办法在 python 本身中自然地做到这一点?请原谅我的无知,但这些工具是否用于任何流行的产品/服务?

谢谢你。

0 投票
4 回答
758 浏览

vb.net - 解析此文件的最佳方法是什么?

我只是想知道是否有人知道我可以解析帖子底部文件的好方法。

我有一个数据库设置,每个部分都有正确的表,例如参考表、调用者表、位置表。每个表都有相同的列,显示在下面的文件中

我真的很想要一些具有相当遗传性的东西,所以如果文件布局发生变化,它不会让我很困惑。目前,我只是一次读取一行文件,并使用 case 语句来检查我所在的部分。

有人能帮我解决这个问题吗?

PS。我正在使用 VB,但 C# 或其他任何东西都可以,文档中的 x 只是我已空白的个人信息

谢谢,内森

文件:--->

0 投票
13 回答
27778 浏览

c# - 如何将格式化的电子邮件地址解析为显示名称和电子邮件地址?

给定电子邮件地址:“Jim”<jim@example.com>

如果我尝试将其传递给 MailAddress,则会出现异常:

指定的字符串不是电子邮件地址所需的格式。

如何在 C# 中将此地址解析为显示名称 (Jim) 和电子邮件地址 (jim@example.com)?

编辑:我正在寻找 C# 代码来解析它。

EDIT2:我发现 MailAddress 引发了异常,因为我在电子邮件地址字符串的开头有一个空格。

0 投票
7 回答
29492 浏览

c# - 从文本文件中读取固定宽度的记录

我有一个充满记录的文本文件,其中每条记录中的每个字段都是固定宽度。我的第一种方法是简单地使用 string.Substring() 解析每条记录。有没有更好的办法?

例如,格式可以描述为:

一个包含两条记录的示例文件可能如下所示:

我只是想确保我没有忽略比 Substring() 更优雅的方式。


更新: 我最终使用了 Killersponge 建议的正则表达式:

然后我使用以下内容访问这些字段:

0 投票
5 回答
24600 浏览

perl - 如何在列表中拆分管道分隔的字符串?

在工作中,我们正在开发一个客户可以使用的时事通讯系统。作为实习生,我的工作之一是帮助解决较小的难题。在这种情况下,我需要做的是扫描电子邮件服务器的日志以查找退回的邮件,并将电子邮件和电子邮件退回到“错误电子邮件数据库”的原因添加。

bad emails 表有两列:'email' 和 'reason' 我使用以下语句从日志中获取信息并将其发送到 Perl 脚本

如果您对更高效的 awk 脚本有建议,那么我也会很高兴听到这些建议,但我主要关注的是 Perl 脚本。awk 通过管道将“foo@bar.com|reason forbounce”传送到 Perl 脚本。我想接收这些字符串,将它们拆分为 | 并将两个不同的部分放入数据库中各自的列中。这是我所拥有的:

0 投票
9 回答
189478 浏览

regex - 用于解析目录和文件名的正则表达式

我正在尝试编写一个正则表达式,它将使用匹配组解析出完全限定路径的目录和文件名。

所以...

会承认group 1 to be "/var/log/xyz"group 2 to be "10032008.log"

看起来很简单,但我无法让匹配组为我的生活工作。

注意:正如一些受访者所指出的,这可能不是正则表达式的好用处。一般来说,我更喜欢使用我正在使用的语言的文件 API。我实际上想要做的事情比这更复杂一点,但解释起来会困难得多,所以我选择了一个每个人都熟悉的域,以便最简洁地描述根本问题。

0 投票
6 回答
1225 浏览

.net - 解析 T-SQL 以参数化查询

我目前正在处理的应用程序会生成大量 SQL 内联查询。然后将所有生成的 SQL 移交给数据库执行类。我想为数据执行类编写一个解析服务,它将接受这样的查询:

并把它变成这样的东西:

在 c# 或 vb.net 中已经写过任何可以为我完成此任务的东西吗?这是为这个项目重构 DAL 之前的一个权宜之计。

更新:伙计们,我有一个从经典 ASP 移植到 ASP.NET 的巨大应用程序,其中包含数千行内联 SQL。唯一的优点是所有生成的 sql 都交给了数据执行类。我想在执行之前捕获 sql 并动态参数化它们作为重写整个应用程序的权宜之计。