我正在尝试从充满 html 标签的 IMDB 前 250 名列表(来自页面源)中解析电影名称。我有一个正则表达式,但是当我使用 grep 命令运行它时,一段时间后它会转储核心。命令如下:
grep -o -P ">[[A-Z]+\w* ([a-zA-Z]+\w* ?)*<" film.xml
。这个核心转储的原因是什么?
问问题
561 次
我正在尝试从充满 html 标签的 IMDB 前 250 名列表(来自页面源)中解析电影名称。我有一个正则表达式,但是当我使用 grep 命令运行它时,一段时间后它会转储核心。命令如下:
grep -o -P ">[[A-Z]+\w* ([a-zA-Z]+\w* ?)*<" film.xml
。这个核心转储的原因是什么?