问题标签 [text-parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 解析问题
此代码有效:
我被困在两个问题上:
1 - 如何使用自定义函数来解析令牌。例如,如果我想使用一些自定义逻辑而不是正则表达式来确定数字是否是邮政编码。代替:
也许:
2 - 如何确定字符串解析到的内容。“80001”解析为“zipcode”,但我如何使用 pyparsing 确定这一点?我不是为它的内容解析一个字符串,而只是为了确定它是什么类型的查询。
java - 我在哪里可以了解有关在 Java 中解析文本的更多信息?
这学期我在上数据结构课程(Java 中),但我们对文本文件进行了大量解析以填充我们设计的结构。重点是结构本身,而不是解析算法。我在该领域感到有点虚弱,想知道是否有人可以向我指出有关该主题的书籍或网站。设计模式、库、样式等。谢谢!
python - Python:读取每个键多行的配置文件
我正在编写一个小型数据库测试套件,它读取带有查询和预期结果的配置文件,例如:
这很好用;我使用 Python 的string.partition('=')
.
我的问题是很长的 SQL 查询。目前,我只是将这些查询粘贴为单行,这是丑陋且不可维护的。
我想找到一种优雅的 Pythonic 方式来读取表达式的右侧,即使跨越多行。
笔记:
- 我的 SQL 查询可能包含
=
- 我不喜欢在
"
右手边强制 s 的想法,因为有许多现有文件没有它。
编辑:
ConfigParser很棒,但它迫使我在多行条目的每一行的开头添加一个空格或制表符。这可能是一个巨大的痛苦。
提前致谢,
亚当
java - Java 缓冲阅读器文本文件解析
我真的很难解析文本文件。我有一个文本文件,格式如下
等等 但是,ID 可以表示两个值之一,0 表示它是一个新字段,或 -1 表示它与最后一个新字段相关。相关字段可以自我重复的次数是无限的。这是发生问题的地方。
因为我在库中有一个方法,它采用新浮点数的 ArrayList,然后是相关浮点数的 ArrayList 的 ArrayList。
当我尝试为此编写逻辑时,我只会越来越深入地嵌入 while 循环。
我真的很感激任何关于我应该如何去做的建议。提前致谢。
这是我到目前为止的代码。
新代码
linq - 使用 LINQ 和 File.ReadAllLines() 读取下一行
我有一个代表项目的文件,在一行中有项目 GUID,后跟 5 行描述该项目。
例子:
我试图首先访问此文件以使项目的 GUID 符合使用 LINQ 提供的标准,例如 where line.Contains("line1").. 这样我将获得整行,我将从那里提取 GUID,我想将此 GUID 传递给另一个应该“再次”访问文件的函数,找到该行(在哪里line.Contains("line1") && line.Contains("8e2803d1-444a-4893-a23d-d3b4ba51baee")
并从该行开始读取接下来的 5 行。
有什么有效的方法吗?
java - 解析和翻译从文本到 xml
我需要将用特定领域语言编写的程序翻译成 xml 表示。这些程序采用简单文本文件的形式。你会建议我什么方法?我应该使用什么 api:
- 解析用这种语言编写的文本文件。
- 根据我获得的令牌和令牌流编写 xml。
我的标准更多的是快速和更容易的开发,而不是内存或计算时间效率。
非常感谢凯坦
language-agnostic - 如何读取多种格式的地址,如谷歌地图
请注意,在谷歌地图上,您可以以任何您喜欢的方式输入地址。只要它是一个有效的地址......谷歌地图会读取它。
在一些红宝石书中,我看到了类似这样的代码片段,但带有电话号码。
有什么想法可以为地址完成吗?
用您选择的语言。
编辑:
我不在乎一个“有效”的地址。我只想解析一个地址。所以 123 fake street, WA, 34223 将是一个地址,所以 123 fake street WA 34223
c# - 文本解析,条件文本
我有一个带有占位符的文本模板,我解析它以便用实际值替换占位符。
文本模板:
我使用 StringBuilder.Replace() 替换占位符
现在我想做更高级的算法。有些代码行是有条件的。它们必须要么完全删除,要么保留。
文本模板
Employer 行应仅在雇用人员时出现(由布尔变量 Person.IsEmployed 控制)。
更新:我可以使用打开/关闭标签。如何在字符串 A 和 B 之间找到文本?我可以使用正则表达式吗?如何?
java - 解析字符串,语法文件
我如何将下面的字符串分成它的部分。我需要分开的是每个 < Word > 包括字符串其余部分的尖括号。所以在下面的情况下,我会得到几个字符串 1.“我必须和你分手,因为” 2.“<原因>”(没有空格) 3.”。但我们还是“4.”<免责声明> “ 5.” 。
以下是我目前拥有的(它丑陋......)
php - 如何在外部项目中使用 Wordpress 的 http.php?
答:使用Curl实现...
我正在尝试从托管在另一台服务器上的管道分隔文本文件中解析数据,该文件又将插入数据库中。我猜我的主机(1and1)在php.ini中禁用了allow_url_fopen 。
错误信息 :
代码 :
Wordpress 有这个很酷的 http.php 文件。有更好的方法吗?如果没有,我该如何使用 http.php 来完成这项任务?谢谢你们..