问题标签 [fixed-length-file]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
912 浏览

python - 如何在python中将固定长度文件转换为csv文件?

在文件中,每列都有固定大小。

是否有任何可用的库或函数可以轻松转换为 CSV 文件?

文件中有四列。

样本记录

我想直接将该文件转换为 CSV。

0 投票
1 回答
186 浏览

regex - 可以为固定宽度文件编写正则表达式吗?

我一直在收到固定宽度的文件,我需要在其中过滤掉一些值。

例如,字符串包含下面提到的值。我想从中分离出 3 个字段(从第 1 到第 2、第 3 到第 7 和第 8 到第 10)

  1. 这可以通过正则表达式实现吗?我尝试了不同的正则表达式,但无法为固定宽度的字符串生成正则表达式。

编辑 :

  1. 是否可以丢弃第一个和第三个字段而只获得第二个作为正则表达式的输出?在上面的例子中,如果输入字符串是“AA123X45ZZ”,那么输出就是“123X4”。

谢谢, 安基特

0 投票
0 回答
138 浏览

python-2.x - 有没有办法在 Python 2.x 中使用 csv.reader() 模块读取固定长度的文件

我有一个固定长度 0001ABC,DEF1234 的文件,例如:文件定义是:

我需要将此数据加载到表中。我尝试使用 CSV 模块并定义了每个字段的固定长度。除了名称字段外,它工作正常。对于 NAME 字段,仅加载 ABC 之前的值。原因是:当我使用 CSV 模块时,它将 0001ABC 视为一个值,并且只解析到该值。

我在读取文件时尝试使用 escapechar = ',',但它从数据中删除了 ','。我也试过 quoting=csv.QUOTE_ALL 但这也没有用。

打印命令的输出:

row: ['0001ABC','DEF1234'] data: 0001ABC

0001ABC,DEF1234理想情况下,我希望在变量中看到整个集合: data. 然后我可以使用代码中提到的解析将其分解为不同的字段。

你能告诉我哪里出错了吗?

0 投票
1 回答
289 浏览

scala - spark scala中的固定长度解析

我已经创建了数据框,输入是这样的:

在下面的元数据信息的基础上,我们需要拆分上面的数据框并创建一个新的数据框,具有列名称 id、name 和 class,它的开始和索引位置在这个 json 元数据中给出。

输出 :

为了加载 df,我创建了列表:

从这个列表中,我创建了数据框

需要知道从元数据创建数据帧的顺序更好的方法。由于创建的列表会将所有数据带到驱动程序节点。

0 投票
2 回答
903 浏览

c# - C# - 读取、编辑和保存 FixedLength 文件

我需要阅读 FixedLenght 文件,编辑其中的一些数据,然后将该文件保存到某个位置。这个应该做所有这些的小应用程序应该每 2 小时运行一次。

这是文件的示例:

14000 美国 A111 78900

14000 美国 A222 78900

14000 美国 A222 78900

我需要查找 A111 和 A222 之类的数据,并将所有 A111 替换为例如 A555。我试过使用 TextFieldParser 但没有任何运气......这是我的代码。我能够得到数组的元素,但我不知道下一步该怎么做......

这是 Berkouz 的解决方案,但仍然存在问题,当保存到文件时,数组的项目不会在输出中替换。编码:

0 投票
1 回答
424 浏览

c# - 处理映射器属性中的空值

我正在尝试读取一个平面文件并执行一些过程。为此,我定义了一个映射器。该映射器将为每个属性分配值。在文档中,日期将用yyMMdd格式表示,它可以有“ ”或000000空值。这意味着,如果日期是 6 个零或 6 个空格,则输出应为空。我试图通过定义 NullFormater 来做到这一点。但是没有用。

这是我尝试过的:

==============================

0 投票
0 回答
628 浏览

java - 如何使用 Spring Batch 跳过空行

我正在使用 Spring Batch 读取固定长度的平面文件,我想跳过空行和不正确的行以进行批处理。在下面的示例中,我还想跳过以字符“------”开头的行。

你能帮我举一个使用跳过策略或其他方式的例子吗?

我的文件:

0 投票
1 回答
59 浏览

xml - BeanIO定长文件编写器Scala-避免写入一个字段

我正在尝试使用固定长度文件 BeanIO 库从 scala 案例类编写一个 csv 文件。

示例代码

但我想避免 dob 写入 csv 文件。如果我从 xml 中删除该行,它将引发错误

除了从案例类中删除它或将字段长度设为“零”之外,任何人都可以提出任何建议。

0 投票
1 回答
74 浏览

hadoop - 在 Hive 上使用 RegexSerde 时无法执行选择计数 (*)

我正在从固定长度的平面文件中读取数据,并应用了以下脚本:

我运行了select * from `test_table`.`test_data` 查询,它运行良好。

当我运行select count(1) from `test_table`.`test_data`查询时,它给出了以下错误。

谁能告诉我究竟Error creating SerDe for LLAP IO意味着什么,以及我该如何解决这个问题?

0 投票
1 回答
25 浏览

bean-io - BeanIO如何在fixedLength中跳过/过滤@Group

我正在尝试读取固定长度的文件。我想提取文档列表,但仅使用具有字段值“BB”的 RecordHeader (RH) 进行过滤。因此,使用 recordHeader 跳过 Document 等于:

这是我的课堂文档的一个例子

这是我的类 RH 的一个例子

这是一个固定长度文件的例子:

感谢帮助