1

我正在尝试从 Youtube 视频中获取转录文本并将其解析为文档进行编辑。我已经能够删除放置在其中的大部分 HTML 标记。但是,我想删除下面的代码,这是已经被解析成单个字符串的时间戳和偏移量。

我试过这个,但我不擅长正则表达式:

/^\d{2}\:\d{8}\"\>$/gm

在 Regex101 测试仪(https://regex101.com/r/a9wi2j/3/)中,它可以工作,但在 EditPad 替换中,它不能。

EditPad 中的什么正则表达式会删除所有以 below 结尾的行">

03:17197850">
that so if you have production staff you
03:21201780">
can create logins like that for them and
03:24204299">
then they have access to all the
03:25205739">
information and everything they need but
03:27207359">
they can't go in and adjust pricing on
03:30210060">
4

1 回答 1

0

您之前需要删除反斜杠,>因为在早期版本的 EditPad\>中已被解释为单词边界,而最近的版本不支持此标记。

您也需要m像在提供的演示中那样启用标志:

(?m)^\d{2}\:\d{8}\">$
于 2018-03-14T14:42:06.770 回答