1

据我了解,您可以使用documents参数或file参数来告诉 openai 您要执行搜索的标签。我使用documents参数得到了预期的结果。我使用该file参数得到了不令人满意的结果。我希望他们是一样的。

使用documents参数执行搜索时..

response = dict(openai.Engine('davinci').search(
    query='sitcom',
    #file=file_id,
    max_rerank=5,
    documents=["white house", "school", "seinfeld"],
    return_metadata=False))

..我得到了预期的结果..“情景喜剧”以 771 分赢得了搜索。

{'object': 'list', 'data': [<OpenAIObject search_result at 0xb5e8ef48> JSON: {
  "document": 0,
  "object": "search_result",
  "score": 147.98
}, <OpenAIObject search_result at 0xb5ebd148> JSON: {
  "document": 1,
  "object": "search_result",
  "score": 211.021
}, <OpenAIObject search_result at 0xb5ebd030> JSON: {
  "document": 2,
  "object": "search_result",
  "score": 771.348
}], 'model': 'davinci:2020-05-03'}

现在尝试使用file参数创建一个temp.jsonl包含内容的文件..

{"text": "white house", "metadata": "metadata here"}
{"text": "school", "metadata": "metadata here"}
{"text": "seinfeld", "metadata": "metadata here"}

然后我将文件上传到openai服务器..

res = openai.File.create(file=open('temp.jsonl'), purpose="search")

在哪里..

file_id = res['id']

我等到文件被服务器处理然后..

response = dict(openai.Engine('davinci').search(
    query='sitcom',
    file=file_id,
    max_rerank=5,
    #documents=["white house", "school", "seinfeld"],
    return_metadata=False))

但是当我执行搜索时收到以下消息..

No similar documents were found in file with ID 'file-LzHkASUxbDjTAWBhHxHpIOf4'.Please upload more documents or adjust your query.

只有当我的查询与标签完全匹配时,我才会得到结果。

response = dict(openai.Engine('davinci').search(
    query='seinfeld',
    file=file_id,
    max_rerank=5,
    #documents=["white house", "school", "seinfeld"],
    return_metadata=False))

{'object': 'list', 'data': [<OpenAIObject search_result at 0xb5e74f48> JSON: {
  "document": 0,
  "object": "search_result",
  "score": 668.846,
  "text": "seinfeld"
}], 'model': 'davinci:2020-05-03'}

我究竟做错了什么?documents使用参数或参数的结果不应该相同file吗?

4

1 回答 1

1

重读文档,似乎在使用file参数而不是documents参数时,服务器首先使用提供的基本“关键字”搜索query来缩小结果范围,然后最终使用相同的语义搜索重新排列这些结果query

这令人失望。

只是为了提供一个工作示例..

{"text": "stairway to the basement", "metadata": "metadata here"}
{"text": "school", "metadata": "metadata here"}
{"text": "stairway to heaven", "metadata": "metadata here"}

现在使用查询“led zeppelin's most Famous song stairway”,服务器会将结果缩小到文档 0 和文档 2,查找“楼梯”标记的匹配项。然后它将执行语义搜索并对它们进行评分。文档 2(“通往天堂的阶梯”)的相关性得分最高。

使用查询“通往地下层的楼梯”将为文档 0(“通往地下室的楼梯”)提供最高相关性分数。

这是令人失望的,因为查询必须对关键字搜索和语义搜索都有用。

在我原来的帖子中,关键字搜索没有提供任何结果,因为该查询只是为语义搜索而设计的。使用该documents参数时,仅执行语义搜索,这就是它在这种情况下起作用的原因。

于 2021-12-23T01:52:05.783 回答