问题标签 [vespa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vespa - 在 Vespa 中创建动态父子关系
我有一个文档(文档类型 A),其中包含多个(任意数量)相同类型的子文档(文档类型 B)。vespa 文档中的以下链接讨论了父子关系。
http://docs.vespa.ai/documentation/search-definitions.html#document-references
为此,我们必须定义一个引用类型字段,然后从引用的文档中导入任何字段。如果我想要来自父文档的多个文档引用怎么办。我不能定义类似的东西,
当然,我会很难导入某个字段,因为所有子引用都具有相同的字段。
假设子文档类型是模型,父文档类型是汽车,基本上,我想要一个嵌套文档,其中我还需要基于父字段和子字段进行查询的能力。假设我在 (3,5) 范围内搜索带有轮辐的梅赛德斯汽车,在父文档中搜索梅赛德斯品牌(父文档字段),然后我想选择梅赛德斯汽车结果的模型(car1、car2、 ...)具有从 3 到 5 的轮辐(子文档字段),(car1[model 1, model 4, model 6], car2[model 2, model 3, model 5])。基本上,命中应该是梅赛德斯品牌的,并且在所有这些命中中,内部命中都是具有 3-5 个轮辐的车型。
vespa - 如何为“按性别从音乐组中选择计数(DISTINCT user_id),计数(*)”构造yql
我尝试了以下 yql 语句
并得到一个错误:“code”:5,“message”:“搜索失败:不能为多个兄弟姐妹使用输出标签'count()'。”,
vespa - docprocservice和容器上的频繁GC
我正在对 vespa 进行性能测试,容器看起来很慢,无法处理传入的更多请求。查看vespa.log,有很多GC分配失败的日志。但是,系统资源非常低(CPU<30%,mem<35%)。有什么配置可以优化吗?
顺便说一句,看起来 docprocservice 默认在内容节点上运行,如何为 docprocservice 调整 jvmargs?
vespa - 我可以依赖 sddocname 被索引吗?
在您的文档中找不到“sddocname”是否被自动索引的任何地方,因此在通过 sddocname 进行查询时,我可以完全依靠最佳性能。谢谢你的答案
vespa - 如何将自定义 DocumentOperation 从处理器发送到 DocumentProcessing 管道?
场景:我已经坚持了很长时间,我认为解决方案可能很容易,但我看不到它,这就是场景:
问题是执行永远不会到达MyFirstDocumentProcessor
,可能是因为请求不是从document_api
端点开始的(故意)。没有抛出错误,只是处理路线永远不会到达文档处理器链,我认为应该是因为MyObjectProcessor
我正在做:
我从这里得到了这个想法:https ://github.com/vespa-engine/vespa/blob/master/docproc/src/test/java/com/yahoo/docproc/util/SplitterJoinerTestCase.java
但在那个测试中我看到了这条线splitter.process(p);
,我无法找到在处理器内工作的合适替代品,在这种情况下,我只有Request
,Execution
和DocumentProcessingHandler
我希望精通 Vespa con 的人对此有所了解,这只是我无法桥接的处理链上的最后一跳:|
vespa - 在 Vespa 中使用 tensorflow 神经模型重新排序
我使用 tensorflow 训练了一个 rankprob 模型。模型的输入是一个查询和 2 个文档。该模型的输出是 doc1 与 doc2 相比排名更高的概率。是否可以将此模型用作 Vespa 中的 2 级重新排名?如果是,有人可以指出我的相关文件吗?
vespa - NO_SPACE - enumStoreLimitReached - 使用的枚举存储地址空间
我正在尝试提供 Vespa 索引,但遇到 NO_SPACE 错误:
我的 Vespa 节点通过 Docker 运行,机器上有卷。以下是使用的卷:
所以,如果我是对的,数据应该存储在/data/1目录中,并根据df
:
那里还有很多空间。所以我想知道,如果 Vespa 没有查看正确的磁盘分区来检查它是否使用了超过 90% 的磁盘空间。
vespa - 如何在 Vespa 中执行全文搜索?
我正在尝试对某些文档的某个字段进行全文搜索,并且正在寻找您的建议。我首先尝试执行此类请求:
但它向我返回了字段完全匹配且不包含除给定字符串之外的其他信息的文档,因此我尝试了 YQL 中的等效项:
我得到了完全相同的结果。但是,当我进一步阅读文档时,我发现了 MATCHES 指令,它确实给了我我正在寻找的结果,通过这种请求:
虽然我不知道为什么,但对于这种类型的一些请求,我遇到了这种类型的超时错误:
所以我通过添加大于默认超时值来解决这个问题:
我的问题是,我是否以正确的方式进行全文搜索,我该如何改进它?
编辑:这是相应的搜索定义:
bigdata - Vespa 应用程序中的自定义搜索
我已经向我的 vespa 应用程序提供了 20 个文件。我希望如果我使用 search="first" 触发查询,那么我应该获得前 10 个文档,如果我使用 search="second" 触发查询,那么我应该获得接下来的 10 个文档。我该如何实现这一点。我必须使用 Searcher 类还是有其他方法可以做到这一点?请帮忙。
bigdata - 在 vespa 中实现自定义搜索器
我在 Vespa 中使用 Searcher 类的实现创建了基本搜索应用程序。我已经使用我的应用程序一一提供了以下这些文件。
我的 Searcher 类如下:
现在,当我使用 API 进行搜索时:
我得到了结果:
但我应该得到这个结果输出:
我做错了什么或者我应该怎么做?