我正在尝试从许多标题中标记标题级别(级别 1、级别 2、级别 3)。使用来自 HTML 的字体大小信息。首先,我使用正则表达式来获取字体大小,例如
"<span style=\"font-family:\'(.+?)\'"->1=fontfamily;
"<span style=\"font-family(.+?)font-size:\'(.+?)\'"->2=font size;
现在我需要使用字体大小信息和基于它的标签标题级别来比较所有这些标题大小。
输入:
<span style="font-family:'Times New Roman'; font-size:'14pt'"><span class="">MATERIALS AND METHODS</span></span>
<span style="font-family:'Times New Roman'; font-size:'12pt'"><span class="">Chemicals</span></span>
<span style="font-family:'Times New Roman'; font-size:'10pt'"><span class="">HILIC-MS Profiling of Metabolites</span>