我正在为我正在实现的两个功能寻找新的想法。
1.) 文本分割功能:
Ex:
User Query: Resolved Query:
----------- ---------------
It has lotsofwordstogether It has lots of words together
I am using normal recursion or DP solution using unigrams probability.
2.) 搭配类型:
Ex:
User Query: Resolved Query:
---------- ---------------
I like t shirts in Wal mart I like t-shirts in Walmart
不知道该怎么做。我目前唯一的想法是将句子标记化并将无意义的标记与先前的标记或下一个标记组合以形成可以根据一元组进行检查的单词。
这些解决方案对我的要求来说很慢(尤其是第一个)。我想一起使用这些功能。寻找更好的想法。