我正在尝试从 Youtube 视频中获取转录文本并将其解析为文档进行编辑。我已经能够删除放置在其中的大部分 HTML 标记。但是,我想删除下面的代码,这是已经被解析成单个字符串的时间戳和偏移量。
我试过这个,但我不擅长正则表达式:
/^\d{2}\:\d{8}\"\>$/gm
在 Regex101 测试仪(https://regex101.com/r/a9wi2j/3/)中,它可以工作,但在 EditPad 替换中,它不能。
EditPad 中的什么正则表达式会删除所有以 below 结尾的行">
?
03:17197850">
that so if you have production staff you
03:21201780">
can create logins like that for them and
03:24204299">
then they have access to all the
03:25205739">
information and everything they need but
03:27207359">
they can't go in and adjust pricing on
03:30210060">