问题标签 [fileparsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
66 浏览

r - 如何在 R 中读取特定格式的文件?

我想阅读一个文件,其中每一行代表一个包含日期、一些文本和数字的数据集。例子:

没有通用的分隔字符(如 CSV 中),但可以很好地描述格式,因为可以使用制表符、字符和文本。

是否有一个函数可以获取格式和文件的描述并用给定的数据填充 data.frame。

0 投票
1 回答
4689 浏览

bison - 使用 flex 和 bison 解析文件

我需要使用 flex 和 Bison 解析以下文件:

新文件

我想阅读上面的文件,为此我写了这段代码

词汇表

yacc.y

首先,我只是尝试打印文件的第二行,但我无法打印任何内容。请帮帮我我该怎么办??

编译通过以下方式完成:

0 投票
0 回答
117 浏览

java - 如何在 apache Apache Commons CVS 中验证 cvs 文件头

我想使用 Apache Commons CVS 解析 CVS 文件。并且可能存在用户传递错误的标题行的情况,例如 5 而不是 1。如果包含所有字符串而不是其他数据类型(如整数),是否有任何方法可以验证传递给 cvsParser 的标题行。

0 投票
0 回答
39 浏览

python - 用于聚合文件中的变量的python程序

我一直在尝试在 python 中读取一个文件,其中包含各种节目和各种频道的观众人数。我想为“ABC”频道选择节目,然后找到该频道中每个节目的观众总数。文本文件如以下链接所示:

文本文件

我已经达到了一个点,即我对每个节目的观众人数求和,而不要求节目是否在“ABC”频道播出。这是代码:

现在我被卡住了,我不知道如何进一步进行。

0 投票
2 回答
5143 浏览

javascript - 使用 D3.js 解析上传的 CSV 文件

我是 d3.js 的新手,所以我知道这对某些人来说可能是一个愚蠢的问题,所以请多多包涵。我正在尝试解析用户上传的 csv 文件并在控制台中打印它的输出。当我提供 CSV 文件的绝对路径时,我能够解析 CSV 文件,但是当我尝试对文件上传功能执行相同操作时,我在控制台中没有得到任何输出。

工作 Javascript 代码..

控制台输出...

新的 HTML 代码..

修改后的 Javascript 代码(不工作) ..

由于没有关于如何处理用户上传的 CSV 文件的官方文档,我无法弄清楚我哪里出错了。有没有办法可以使用 HTML5 文件阅读器?请帮忙..

0 投票
2 回答
244 浏览

xml - GWT - 上传前读取文件内容

我有一个要求,需要创建一个表单,用户可以一次上传多个文件。附加要求是:

  1. 上传前执行点击侧验证。如果多个文件之一的类型不是.XML.ZIP,则不要将请求发送到服务器,向用户抛出警报消息。

  2. 逐一(上传前)读取 XML 文件(使用 DOM 完整解析 XML)以验证它们。继续解析和验证 XML 文件,并告诉用户“好友,您尝试上传的 ABC.xml 文件有一个不正确的标签!'

所有这些都必须在客户端使用 GWT 完成。可能吗?

0 投票
2 回答
547 浏览

python - Python - 解析文件需要帮助。有没有办法忽略 EOF 字符?

我有一个二进制文件,我正在尝试从中提取字符串,并且我有很多时间这样做。:(

我目前的策略是使用 Python 读取文件(使用以下函数之一:read()、readline() 或 readlines())。接下来,我解析该行(逐个字符)并查找特殊字符“ô”,在大多数情况下,它直接跟随我想要的字符串!最后,我从记录所有我识别为“有效”的字符的特殊字符中向后解析。

在一天结束时,我想要前面的时间戳和行内的下 3 个字符串。

结果:

在输入示例第 1 行中,“读取”函数不会读取整行(显示在输出图像中)。我相信这是因为该函数将二进制文件解释为 EOF 字符,然后停止读取。

在示例的第 2 行中,有时会出现“特殊字符”,但它不在我要提取的字符串之后。:(

有没有更好的方法来解析这些数据?如果没有,有没有办法解决示例行#1中看到的问题?

当我将行打印为已读时输入数据和结果输出数据的示例。如您所见,使用时它不会读取整行readlines() 当我将行打印为已读时输入数据和结果输出数据的示例。 如您所见,使用 readlines() 时它不会读取整行

我的字符串提取算法,不是很健壮。 我的字符串提取算法,不是很健壮。

仅供参考,效率不一定是重要的。

0 投票
1 回答
46 浏览

bash - 如何根据扩展名解析文件

我的情况是某些目录中有不同类型的文件(具有不同的扩展名)。我不知道特定目录中存在什么类型的文件。让我们假设以下情况:

所有五个目录 1、2、3、4、5 都有一个公共路径:

简而言之,1、2、3、4、5在dir3中。

例如,
目录 1 和 3 的文件扩展名为.txt
目录 2、4、5 的文件扩展名为.gz

我现在正在这样做:

输出已创建,但其中很少是空白的。我确定输入具有我在grep中使用的字符串。我认为我正在使用的脚本正在覆盖文件。

如何通过首先搜索文件扩展名并相应地执行 cat 或 zcat 来执行此操作?请建议?

编辑:

我还尝试了以下方法:

0 投票
1 回答
400 浏览

bash - 使用 shell 脚本解析 CSV 文件

我一直在尝试编写将解析 CSV 文件并以指定格式提供输出的脚本。

输入文件采用以下格式。

输出应采用以下格式(仅显示输入第一行的少数输出行):

我需要在第一行之后为每一行打印第 1 列和第 4 列,然后是列名(来自文件的第 1 行),:以及第 6..NF 列的列值(完全忽略第 2、3、5 列)。一条输入线产生许多输出线。

我写的脚本:

该脚本正在运行,但在同一行上显示所有参数,但不显示其名称。我如何解决它?

0 投票
3 回答
1491 浏览

java - java程序有条件地从文件中读取行

我是 Java 编码的新手。我将这段代码放在一起以读取以下文本文件中“开始”和“结束”标记之间的所有行。

开始

你好

你好

如何

正在做?

结尾

我的程序如下......

程序只读取前两行“hi hello”,就好像 if 条件不存在一样。我觉得这个错误非常基本,但请纠正我。