问题标签 [human-language]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
117 浏览

sorting - Cassandra 可以对特定人类语言的列进行排序吗?

当归结为对 Cassandra 表中的行中的列进行排序时,看起来我们仅限于四种不同的数据类型。我能看到的四种类型是:

BytesType、AsciiType、UTF8Type、IntegerType

但是,要以给定语言正确排序,可以使用strcoll(),它利用语言环境并最终根据语言将某些字符排序在其他字符之前或之后。

例如,在法语中,e字符上有重音符号,排序如下:

... de é ê è ë f ...

我想这UTF8Type不会像法语使用者那样使该功能正常工作。

是让它发挥作用的唯一方法,在 Cassandra 中实际实现我们自己的排序吗?(啊,我不喜欢 Java ......)

0 投票
1 回答
82 浏览

elasticsearch - 如何使用 elasticsearch 在查询中使用特殊命令进行搜索?

我有一个包含许多文档的弹性索引。一个文件代表一些事件。每个事件都有一个日期和地理位置。

我想发送这样的查询:“洛杉矶的一些活动”、“明天的一些活动”、“我附近的一些活动”......

我怎样才能用弹性构建这个解决方案?

0 投票
1 回答
897 浏览

nltk - Nltk .most_common(),它返回的顺序是什么?

我在某些句子中使用以下方法找到了二元组的频率:

在打印出具有最常见频率的二元组时,一个出现了 7 次,而所有其他 95 个二元组只出现了 1 次。然而,当将二元组与我的句子进行比较时,我看不到所有频率为 1 的二元组被打印出来的逻辑顺序。有谁知道 .most_common() 打印二元组的方式是否有任何逻辑,或者它是随机生成的

提前致谢

0 投票
0 回答
56 浏览

human-language - python可以理解人类语言吗?

几个月前我开始学习python。然而,我在网上找到了一份工作,我的客户希望我编写一个 Web 应用程序来分析故事并获得标题、人物、谚语、道德和歌曲等功能。我通过标签和索引实现了这一点。

但他进一步表示,他希望代码能够理解故事并自行生成道德和其他一些东西,而不需要在代码中将道德标记为本地获取。

这些故事是尼日利亚语言的,我不知道这是否可能。请问这可能吗?