我对提取和构建有关餐厅菜单的信息很感兴趣。需要的是从表单中的菜单中提取项目category / name / price
例如,我们有以下网站。这里我们有一个饮料区,还有一些项目。对于那个网站,我希望能够提取
Drink / Cappuccino / € 1,50
SANDWICHES / filled sandwich, pistolet (round roll) or emperor roll / € 1,30
etc ...
当然,它不应仅限于本网站。
我能看到的唯一处理方法是应用一堆正则表达式,但我不相信列出所有可能的菜名是可行的。
我知道这个话题对于一个问题来说可能太宽泛了,但无论如何,任何对相关文章或书籍的建议或参考都将不胜感激。