mainframe - 按字段长度排序

Question

我想编写一个排序JCL，其中我想对可变记录长度文件进行排序

输入文件：

Mark aaaaaaa
Amy bbbbbb
Paula ccccccccccc

按升序对空格前的字段长度进行排序。这是对第一个 col/word Mark、Amy 等的长度进行排序。基于它们的长度。

第二个类似于按降序对空格后的字段进行排序，但如果字段中的任何元音应该始终是第一个，然后是其余数据。来到第二部分，这里就像空格或 aaaaa、bbbbb 和 ccccc 之后的字段，我们需要按降序（按字母顺序）对其进行排序，但我们还需要检查该字段是否为元音，如果有元音，则该字段将总是作为顶部，所以预期的输出将是这样的：考虑到上面的输入文件输出文件将是：

Mark aaaaaaaa
Paula cccccc
艾米 bbbbbb

现在这里 vovel 就像在第一条记录中一样，其中包含 aaaa 位于顶部，其余数据按降序排序。我想实现这一目标。

score 1 · Accepted Answer

你所问的根本不是一件简单的事情:-)

虽然 DFSORT 具有许多内在功能，但无法找到非空格字符序列的长度。

所以你必须自己动手。

尽管使用固定长度的记录（不同的技术）也可以完成该任务，但使用可变长度的记录更容易。

因为字段也是可变长度的，所以您需要 PARSE 来分隔字段。对于可变长度或可变位置的字段，PARSE 通常是答案。

PARSE 创建固定长度的解析字段，因此您必须知道文本的最大长度。在此示例中，为每个选择 30。

解决方案将逐步发展，因为您需要确保对它的理解。这些片段以“独立”代码的形式呈现，您可以运行这些代码并查看会发生什么：

选项副本

  INREC IFTHEN=(WHEN=INIT, 
                 PARSE=(%01=(ENDBEFR=C' ',
                             FIXLEN=30), 
                        %02=(FIXLEN=30))),


        IFTHEN=(WHEN=INIT, 
                 BUILD=(1,4,%01,%02))

如果你运行它，你会得到这个输出：

MARK                          AAAAAAA                       
AMY                           BBBBBB                        
PAULA                         CCCCCCCCCCC

INREC 在 SORT 之前运行，因此要在 SORT 之前对数据进行任何更改，请使用 INREC。OUTREC 在 SORT 之后运行，OUTFIL 在 OUTREC 之后运行。

目前，BUILD 只是显示 PARSEd 字段包含您想要的输出（不要担心大小写，如果您使用大小写混合，它会是这样）。

WHEN=INIT 表示“在以下 IFTHEN 语句（如果有）之前对每条记录执行此操作”。您可以使用多个 WHEN=INIT，并且您必须使用某种类型的多个 IFTHEN 来在多个阶段转换数据。

BUILD 中的 1,4 用于每个可变长度记录具有的记录描述符字 (RDW)，并且在 SORT 中创建可变长度当前记录时始终是必需的，但我们将在此处将其用于另一个目的出色地。

下一阶段是“扩展”记录，因为我们需要对两个字段进行排序。对于可变长度记录，您可以“在前面”扩展。一般来说：

BUILD=(1,4,extensionstuff,5)

这会生成当前记录的新版本，首先是旧当前记录中的 RDW，然后“做一些事情”来创建扩展，然后从位置 5（可变长度记录上的第一个数据字节）复制到记录的结尾。

虽然 RDW 是“复制”的，但当时 RDW 的值是无关紧要的，因为它将为 BUILD 计算。一开始它必须是一个 RDW，除了实际的 RDW 之外，你不能只放任何东西。

需要的另一个组件是扩展 SORT 键的记录。我们需要第一个字段的长度，我们需要一个“标志”来指示是否对包含元音的第二个字段“提前排序”。对于长度，有一个两字节的二进制值会很方便。现在，我们只是为这些东西保留字节：

OPTION COPY
INREC BUILD=(1,4,2X,2X,X,5)

2X是两个空格，X是一个空格，所以一共有五个空格。它本来可以写成 5X，在最终的代码中最好这样，但现在更清楚了。运行它，您将看到以五个空格为前缀的记录。

有两个任务。第一个字段的长度，以及第二个字段是否包含元音。

第一项任务的关键是将 PARSEd 字段中的空白替换为“nothing”。这将导致每替换一个空白，记录就会缩短一个。保存原始当前记录的长度，用当前记录的长度和定长（30）计算得出数据的长度。

第二个任务的关键应用了类似的技术。这一次，更改第二个 PARSEd 字段，将 a、e、i、o、u 替换为“nothing”。那么如果长度和原来的一样，就没有元音了。

FINDREP 看起来像这样：

     IFTHEN=(WHEN=INIT, 
              FINDREP=(IN=C' ', 
                       OUT=C'', 
                       STARTPOS=n1, 
                       ENDPOS=n2)),

您需要元音的变体：

     IFTHEN=(WHEN=INIT, 
              FINDREP=(IN=(C'A',C'E',C'I',C'O',C'U'), 
                       OUT=C'', 
                       STARTPOS=n1, 
                       ENDPOS=n2)),

跑步：

  OPTION COPY 

  INREC IFTHEN=(WHEN=INIT, 
                 PARSE=(%01=(ENDBEFR=C' ',
                             FIXLEN=30), 
                        %02=(FIXLEN=30))),

        IFTHEN=(WHEN=INIT, 
                 BUILD=(1,4,2X,X,%02)), 

        IFTHEN=(WHEN=INIT, 
                 OVERLAY=(5:1,2)), 

        IFTHEN=(WHEN=INIT, 
                  FINDREP=(IN=(C'A', 
                               C'E', 
                               C'I', 
                               C'O', 
                               C'U'), 
                           OUT=C'', 
                           STARTPOS=8, 
                           ENDPOS=38)), 

        IFTHEN=(WHEN=(1,4,BI,EQ,5,2,BI), 
                OVERLAY=(7:C'N'))

如果你运行它，你会看到标志（第三个数据位置）现在是空格（表示存在元音）或“N”。不用担心所有的“A”都消失了，它们仍然藏在 %02 中。

OVERLAY 可以对当前记录进行更改，而无需创建新的替换记录（这是 BUILD 所做的）。在创建新的当前记录长度后，您将在下面看到使用 OVERLAY 来获取新的记录长度（BUILD 将从 RDW 获取原始记录长度）。

其他任务的类似过程。

我已经包含了一些额外的测试数据，并对您的 SORT 订单做出了进一步的假设。这是完整的，带注释的（注释可以保留，它们不影响处理），代码：

* PARSE CURRENT INPUT TO GET TWO FIELDS, HELD SEPARATELY FROM THE RECORD. 
* 
  INREC IFTHEN=(WHEN=INIT, 
                 PARSE=(%01=(ENDBEFR=C' ', 
                             FIXLEN=30), 
                        %02=(FIXLEN=30))), 

* MAKE A NEW CURRENT RECORD, RDW FROM EXISTING RECORD, THREE EXTENSIONS, AND 
* A COPY OF THE FIRST PARSED FIELD. 
* 
        IFTHEN=(WHEN=INIT, 
                BUILD=(1,4, 
                       2X, 
                       2X, 
                       X, 
                       %01)), 

* STORE THE LENGTH OF THE NEW CURRENT RECORD ON THE CURRENT RECORD. 
* 
        IFTHEN=(WHEN=INIT, 
                 OVERLAY=(5: 
                            1,2)), 

* REPLACE BLANKS WITH "NOTHING" WITHIN THE COPY OF THE PARSED FIELD. THIS WILL 
* AUTOMATICALLY ADJUST THE RDW ON THE CURRENT RECORD. 
* 
        IFTHEN=(WHEN=INIT, 
                  FINDREP=(IN=C' ', 
                           OUT=C'', 
                           STARTPOS=10, 
                           ENDPOS=40)), 

* CALCULATE THE LENGTH OF THE NON-BLANKS IN THE FIELD, BY SUBTRACTING PREVIOUS 
* STORED RECORD-LENGTH FROM CURRENT RECORD-LENGTH (FIRST TWO BYTES, BINARY, OF 
* RDW) AND ADDING 30 (LENGTH OF PARSED FIELD). 
* 
        IFTHEN=(WHEN=INIT, 
                OVERLAY=(5: 
                           1,2,BI, 
                           SUB, 
                            5,2,BI, 
                           ADD, 
                            +30, 
                           TO=BI, 
                           LENGTH=2)), 

* MAKE A NEW CURRENT RECORD, COPYING RDW AND THE VALUE CALCULATED ABOVE, BLANKS
* (COULD BE COPIED) AND THEN THE SECOND PARSED FIELD. 
* 
        IFTHEN=(WHEN=INIT, 
                 BUILD=(1,4, 
                        5,2, 
                        2X, 
                        X, 
                        %02)), 

* AGAIN SAVE THE LENGTH OF THE NEW CURRENT RECORD. 
* 
        IFTHEN=(WHEN=INIT, 
                 OVERLAY=(7: 
                            1,2)), 

* CHANGE ALL VOWELS TO "NOTHING". THIS WILL AUTOMATICALLY ADJUST THE RDW. FOR
* MIXED-CASE JUST EXTEND THE IN TO INCLUDE LOWER-CASE VOWELS AS WELL. 
* 
        IFTHEN=(WHEN=INIT, 
                 FINDREP=(IN=(C'A', 
                              C'E', 
                              C'I', 
                              C'O', 
                              C'U'), 
                          OUT=C'', 
                          STARTPOS=10, 
                          ENDPOS=40)), 

* CALCULATE NUMBER OF VOWELS. 
* 
        IFTHEN=(WHEN=INIT, 
                 OVERLAY=(7: 
                            7,2,BI, 
                           SUB, 
                            1,2,BI, 
                           TO=BI, 
                           LENGTH=2)), 

* MAKE A NEW CURRENT RECORD TO BE SORTED, WITH BOTH PARSED FIELDS. 
* 
        IFTHEN=(WHEN=INIT, 
                 BUILD=(1,4, 
                        5,2, 
                        7,2, 
                        9,1, 
                        %01, 
                        %02)), 

* SET THE FLAG TO "OUTSORT" THOSE RECORDS WITH A VOWEL IN THE SECOND FIELD. 
* 
        IFTHEN=(WHEN=(7,2,BI,EQ,0), 
                 OVERLAY=(9: 
                            C'N')) 

* SORT ON "OUTSORT FLAG", LENGTH OF NAME (DESCENDING), NAME, 2ND FIELD. 
  SORT FIELDS=(9,1,CH,A, 
               5,2,CH,D, 
               10,30,CH,A, 
               40,30,CH,A) 

* FIELDS NEEDED TO BE IN FIXED POSITION FOR SORT, AND EXTENSION FIELDS NO 
* LONGER NEEDED. ALSO REMOVE BLANKS FROM THE TWO FIELDS, KEEPING A SEPARATOR   
* BETWEEN THEM. THIS COULD INSTEAD BE DONE ON THE OUTFIL. 
* 
  OUTREC BUILD=(1,4, 
                10,60, 
                 SQZ=(SHIFT=LEFT, 
                      MID=C' ')) 

* CURRENTLY THE VARIABLE-LENGTH RECORDS ARE ALL THE SAME LENGTH (69 BYTES) SO 
* REMOVE TRAILING BLANKS. 
* 
  OUTFIL VLTRIM=C' '

广泛的测试数据：

MARK AAAAAAA 
AMY BBBBBB 
PAULA CCCCCCCCCCC
PAULA BDDDDDDDDDD
IK JJJJJJJJJJO

您还可以通过从代码末尾“一次删除一行”来查看代码是如何工作的，因此您可以查看转换如何到达该点，或者通过运行代码从开始一次增加一行编码。

您和您的同事理解代码很重要。

有一些合理化的机会。如果你能解决这些问题，这意味着你理解了代码。大概。

mainframe - 按字段长度排序

1 回答 1

Related

Reference