我有一个大型的 CT 扫描结果和印象数据库。我正在尝试构建一个正则表达式,它搜索一个整数或浮点数,后跟'mm',它与前面或后面的单词'nodule'相邻。这是我到目前为止的正则表达式:
nodule_4mm_size = "(?s).*?([0-4]*\.*[0-9]+\s*[mM]{2})[\w\W]{0,24}[Nn]odule|(?s)[Nn]odule[\w\W]{0,24}.*?([0-4]*\.*[0-9]+\s*[mM]{2})”
但是,我需要确保这些发现之前没有之前或之前的测量。放射科医生参考以前的扫描。所以我正在尝试消极的回顾,就像这样:
(?<!previously measured)\?[Nn]odule[\w\W]{0,24}[^\.\d]([0-4]\s*[mM]{2}|[0-3]\.[0-9]\s*[mM]{2}|4\.0+\s*[mM]{2})
但是,我无法让它工作。以以下段落为例。
“例如,最大的结节位于右下叶,目前测量为 4.4 毫米(图像#82,系列 3),之前在 2011 年 9 月 1 日测量为 3.6 毫米。”
在这种情况下,我希望正则表达式命中 4.4 毫米而不是 3.6 毫米。此外,如果发现多个命中,我只想保留找到的最大尺寸。例如,
“例如,最大的结节位于右下叶,目前尺寸为 4.4 毫米(图像 #82,系列 3),之前在 2011 年 9 月 1 日测量为 3.6 毫米。发现另一个结节的尺寸为 2.2 毫米。
在这种情况下,我想确保仅识别出 4.4 毫米。
任何帮助将不胜感激。只是无法让这种负面的后视效果发挥作用!谢谢!