问题标签 [phrases]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
110 浏览

java - 哪个是在 android 应用程序中存储“报价”的最佳方式

我正在创建一个应用程序,它可以包含大量消息(比如说大约 10,000 条)。用户可以浏览它们、查看、选择、发送(例如,显示报价并允许发送给某人的那些应用程序)。存储这些消息的最佳方式应该是什么?在 strings.xml 或我自己的 xml 文件中。该应用程序应该离线工作,所以我不考虑使用任何互联网连接或远程数据库,甚至 SQLite(一旦用户安装应用程序时消息将随应用程序一起提供)。当用户第一次执行应用程序时,想法是获取所有这些消息(来自字符串或其他 xml)并创建一个 SQLite 数据库。你有什么建议?

0 投票
2 回答
788 浏览

python - Word2vec gensim - 使用短语时计算单词之间的相似度不起作用

使用gensim word2vec模型来计算两个词之间的相似度。用 250mb 的维基百科文本训练模型得到了很好的结果——相关词对的相似度得分约为 0.7-0.8。

问题是,当我使用该Phraser模型将短语相加时,相同单词的相似度得分几乎为零。

短语模型的结果:

这可能意味着我没有正确使用 Phraser 模型。

我的代码:

单独尝试 pharser 模型看起来效果很好:

>>>vectorizer.phraser['new', 'york', 'city', 'the', 'san', 'francisco'] ['new_york', 'city', 'the', 'san_francisco']

什么会导致这种行为?

试图找出解决方案:

根据 gojomo 的回答,我尝试创建一个PhraserIterator

使用这个迭代器我试图训练我的Word2vec模型。

Word2vec 训练日志:

经过这次训练 - 任何两个相似度计算产生零:

所以似乎迭代器运行不正常,所以我使用 gojomo 技巧检查了它:

及其工作。

可能是什么问题?

0 投票
1 回答
61 浏览

database - 获取","后面的数据,用python取词

我想从左到右获取句子末尾“,”后面的 D 列中的数据,以获取链接生物中的短语:

[1]:(http://prntscr.com/fye9hi)“这里”

有人不能帮助我请....

这是我的代码,但它不能像我想要的那样运行。

0 投票
1 回答
183 浏览

javascript - JavaScript密码函数允许空格

在学习 JavaScript 5 天后,我写了一个只加密大小写字母的函数。

问题是现在我正试图让它也适用于短语(如果用户输入是“Cats are great”,那么预期的输出是“Jhaz hyl nylha”),但我在让空格保持不变时遇到了问题。

我试图改变/^[a-zA-Z]+$//^[a-zA-Z\s]+$/但没有奏效。

PS:是的,这是一个家庭作业,但我已经得到了一个成绩,因为我刚刚开始学习,我仍在努力改进我的功能并学习更多,任何帮助将不胜感激。

0 投票
1 回答
32 浏览

cortana - 动态填充 VoiceCommand PhraseList,找不到错误 VoiceCommandSet

我正在寻找一种动态填充我的 VCD 文件的方法。我有一个来自 Windows 文档的代码片段,内容如下:

但是,当我将它放入我的 App.OnActivated() 版本时,Visual Studio 显示一个错误,指出 VoiceCommandSet 不包含在“Windows.ApplicationModel.VoiceCommands.VoiceCommandDefinition”中。我的问题是:

我在错误的地方这样做吗?你知道任何示例项目,显示如何正确地做到这一点?(我查看了 Adventure Works,但没有在那里找到这些行)或者我错过了一些我不知道的参考资料?

0 投票
3 回答
698 浏览

oop - OOP中“祖先”的对面

我正在寻找用来描述继承祖先的孩子的最佳术语。

例如,“汽车”对象可能源自其祖先“车辆”。但是,有没有比导数更好/更合适的词用于逆?

0 投票
1 回答
238 浏览

nlp - 如何提取英语口语短语和表达的含义

我正在研究提取日常生活中使用的表达的含义。例如,对于人类来说,这句话显然The meal we had at restaurant A tasted like food at my granny's.意味着食物很美味。

我如何使用工具或技术来提取这个含义?

到目前为止,我发现的方法是首先使用 Stanford CoreNLP POS 标记提取短语,然后使用 Word Sense Induction 工具推导出短语的含义。但是,由于 WSI 工具用于在单词具有多种含义时获取其含义,​​因此我不确定它是否是最好的工具。

提取含义的最佳方法是什么?或者是否有任何工具可以识别短语并提取其含义?

任何帮助深表感谢。提前致谢。

0 投票
0 回答
38 浏览

r - 可以将 readLines 用于 R 的 ngram 处理吗?

我试图计算由一到八个单词组成的短语的频率。我一直在阅读有关此处和其他地方的短语文本挖掘的信息,并发现使用 ngram 标记化将是最好的方法。

但是,当我从 .txt 文件中复制和粘贴文本时,它会出现多行的未识别符号错误。是否可以在 ngram_Tokenizer 代码中使用该readLines函数代替 X ?例如:

Bigram_Tokenizer<-function(X(readLines(file.choose())(Ngram_tokenizer(X(readLines(file.choose(),WekaControl(min=#,max=#)GitHubGist ( 1 ) 上的 tomkauffman 给出的示例中?

当我复制 readLines 打印输出时,它会出现'unexpected [ in [' 我需要在两个“X”条目中包含相同的文本吗?

谢谢你,本·M。

0 投票
1 回答
86 浏览

xml - 使用 XSLT 进行单词和短语计数

我们想为我们公司生产的产品的文档建立一个字典,以创建一个固定的术语,因此我们想计算特定单词和短语的频率。

这可以通过几种不同的方式解决,但我们想要以某种方式解决的是编写一个 XSLT 算法,它可以识别短语,因为特定的单词经常一起出现(所以我们不必事先指定所有的短语和他们所有的版本都有不同的变位、词缀等)。

您认为,这个任务可以用 XSLT 完成,还是我们应该关注其他解决方案?

如果有人对我们应该如何开始有任何有用的建议,我将非常乐意听到您的想法并就此进行对话!