0

我无法理解正则表达式。请提供复制粘贴解决方案。

任务

我有一个曾经是字幕的文本文档。它包含时间戳和大量换行符。我想去掉时间戳和换行符,得到一个同质的文本块。

我有的

0:04:10.700,0:04:11.360
but

0:04:11.360,0:04:15.680
but it was plenty big you know the silo itself would have easily been

0:04:16.180,0:04:18.420
as wide as this room is

0:04:18.420,0:04:23.200
and perhaps larger and many, many, story's tall, you know because it was nested underground

我想得到什么

但是它太大了,你知道筒仓本身很容易和这个房间一样宽,而且可能更大,而且很多很多,故事很高,你知道因为它嵌套在地下

请注意,删除换行符后,必须在每行文本之前输入一个空格,以便与前面的文本分开。

谢谢!

4

1 回答 1

0

您可能会使用:

\n*\d+:\d+:\d+\.\d+,\d+:\d+:\d+\.\d+\n(.*)

这将匹配

\n* # 零个或多个换行符
\d+:\d+:\d+\.\d+ # 使用一位或多位数字、冒号和点匹配模式
, # 匹配逗号
\d+:\d+:\d+\.\d+ # 使用一位或多位数字、冒号和点匹配模式
\n # 匹配新行
(.*) # 捕获任意字符零次或多次(第 1 组)

替换为第 1 组和一个空格$1

于 2018-02-18T12:11:46.287 回答