0

我目前正在探索不同的方法来判断和预测各种优惠和营销活动的表现。我有一个指标列表,我现在正在使用这些指标来预测性能,例如:

  • 发送报价的日期
  • 天气
  • 时间
  • +更多

对于我的绩效指标,我使用

  • 兑换率(对于发送的每个优惠,兑换了多少次) - 这就是我判断成功的方式

但最重要的指标之一是报价本身,我知道它是以文本字符串的形式出现的。

以下是一些用户生成的示例。

  • 大披萨减 4.00 美元
  • 下一个订单可享受 20% 的折扣
  • 购买任意一款巧克力奶昔,再获半价
  • 两包 7.50 美元
  • 购买任何商品即可免费获得 cookie

..还有数百个

现在,我知道这些文本字符串中有非常重要的信息,但我不知道分析它和提取关键信息的最佳方法。例如,在本文中,它显示了产品的广告、折扣、美元金额、折扣百分比等。我需要一种通用的方法来遍历每个字符串(我假设通过一些标记化的方法),并提取相关的信息。

我希望获得一些关于如何分析这些字符串的输入,最终目的是生成一个基于字符串的数据集(以及其他上述数据点),我可以将其用于预测。

我正在使用 python 3.0 编写我的代码。

任何意见是极大的赞赏。谢谢。

4

0 回答 0