python - 为聊天机器人定制语料库的最佳方式或最佳实践是什么？

翻译自：https://stackoverflow.com/questions/57117409 2019-07-19T17:48:00.800

222 次

我们一直在为需要创建请求和跟踪与服务相关的问题的用户创建一个聊天机器人。

我们一直在用聊天机器人的智能进行一些测试，有 800k 的寄存器数据，我也在用许多不同的请求方式创建和复制行。

有2种问题：

- 由于我们的语料库中有这么多具有相同答案的寄存器，我们得到的单一结果答案是完全错误的。

- 得到答案需要很长时间，假设我们的网络已经训练好了。

from chatterbot import ChatBot
from chatterbot.trainers import ChatterBotCorpusTrainer
from chatterbot.trainers import ListTrainer

chat = ChatBot('luis')

# Create a new trainer for the chatbot
train = ChatterBotCorpusTrainer(chat)

# Train the chatbot based on the spanish corpus
# C:\Users\mcarvajalr\AppData\Local\Continuum\anaconda3\envs\Chatterbot\Lib\site-packages\chatterbot_corpus\data\spanish
train.train("chatterbot.corpus.spanish.trivia",
            "chatterbot.corpus.spanish.greetings",
            "chatterbot.corpus.spanish.DesbloqueoAD_rev03")

conversa = [
    "Quien es pacman",
    "Es una fantasma"
]

train = ListTrainer(chat)
train.train(conversa)

# Get a response to an input statement
chat.get_response("pacman ")
chat.get_response("desbloqueo cuenta")

python - 为聊天机器人定制语料库的最佳方式或最佳实践是什么？

0 回答 0

Related

Reference