问题标签 [sentence]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
1888 浏览

java - 用Java自动完成句子

假设我有大约 1000 个句子要在用户输入字段时作为建议提供。

我正在考虑运行lucene in memory search,然后将结果输入suggestions set.

用于运行搜索的trigger将是space charand exit from the input field

我打算使用它,GWT因此客户端只需从服务器获取结果。

我不想做谷歌正在做的事情;他们在其中完成每个单词,然后对每组关键字提出建议。我只想检查关键字并据此提出建议。有点像当我在stackoverflow上输入问题的标题时。

以前有没有人做过这样的事情?是否已经有我可以使用的库?

0 投票
1 回答
286 浏览

iphone - 无法在 UIWebView 的 HTML 页面中选择多个句子

我有下面这样的 HTML 页面:

<html>

<body>

<div id='0>

<span id='0'>Hi </span>

<span id='1'>How </span>

<span id='2'>Are </span>

<span id='3'>You</span>

</div>

<br><br>

<div id='1>

<span id='4'>welcome </span>

<span id='5'>to </span>

<span id='6'>our </span>

<span id='7'>place</span>

</div> <br><br> </body> </html>

我正在尝试在加载了这样的 HTML 的 iPhone webView 中选择多个句子。但我选择而不是选择句子块。

我必须改变什么?

0 投票
2 回答
1844 浏览

antlr - 解析不同单词类型的句子

我正在寻找一种用于分析两种句子的语法,这意味着用空格分隔的单词:

  1. ID1:单词不以数字开头的句子
  2. ID2:单词不以数字和数字开头的句子

基本上,语法的结构应该看起来像

@Bart
我只是尝试添加两个标记'_''"'作为 lexer-ruleSpecial供以后在 lexer-rule 中使用Word。即使我没有Special在以下语法中使用,我在 ANTLRWorks 1.4.2 中得到以下错误:
The following token definition can never be match because prior tokens match the same input: Special
But when I add fragmentbefore Special,我没有得到那个错误。为什么?

Special然后应在 lexer-rule 中使用 Lexer- rule Word

0 投票
5 回答
2241 浏览

java - 如何使用正则表达式拆分文本,但拆分后的单词继续保留正则表达式分隔符?

我有一个文本并使用这个简单的正则表达式将其拆分为单词:[ \n]. 它使用空格和换行符将文本拆分为单词。

我想知道是否有办法在拆分的单词中保留空格或换行符,因为我将在一些处理后使用它来进行简单的句子检测。

我正在使用该String#split方法。

0 投票
2 回答
4200 浏览

ruby-on-rails - 如何用一句话“变换”一个数组?

我正在使用 Ruby on Rails v3.0.9,我想在一个句子中“转换”一个字符串数组,包括标点符号。也就是说,如果我有一个如下所示的数组:

我想得到\构建:

我怎样才能做到这一点?

0 投票
4 回答
35361 浏览

c# - 将句子拆分成单词,但 C# 中的标点符号有问题

我见过一些类似的问题,但我正在努力实现这一目标。

给定一个字符串,str="月球是我们的天然卫星,即它围绕地球旋转!" 我想提取单词并将它们存储在一个数组中。预期的数组元素将是这个。

我尝试使用 String.split(','\t','\r') 但这不能正常工作。我还尝试删除 . 和其他标点符号,但我也希望解析出像“ie”这样的字符串。实现这一目标的最佳方法是什么?我也尝试使用 regex.split 无济于事。

肯定会欣赏一些在正确方向上的推动。

0 投票
1 回答
173 浏览

regex - 尝试使用正则表达式操作文档中的行

我的文本文档格式不适合我的目的,我不得不进行一些更改。但是现在我有另一个问题,就是很多句子自己“搁浅”了,像这样:

有谁知道用正则表达式表示句子的方法?我想将这些句子与上面或下面的段落连接起来。我发誓在问之前我搜索了谷歌和这个网站。

编辑:抱歉,我无法访问我的原始帖子,并且无法评论 Amber 的答案。我会为以后的问题注册一个帐户。另外,我忽略了我正在使用 Notepad++ 的事实。

0 投票
3 回答
2106 浏览

javascript - Javascript(jQuery)删除长文本的最后一句

我正在寻找一个足够聪明的 javascript 函数来删除一大段文本的最后一句话(实际上是一个段落)。一些显示复杂性的示例文本:

现在我可以拆分.并删除数组的最后一个条目,但这不适用于以?or结尾的句子,!并且某些句子以引号结尾,例如something: "stuff."

这该怎么做?什么是合适的算法?

编辑-长文本是指我的段落中的所有内容,而句子是指一个实际的句子(不是一行),因此在我的示例中,最后一句话是:He later described it as: "Something insane."删除那个时,下一个是She did not know, "I think we should move past the fence!", she quickly said."

0 投票
3 回答
367 浏览

php - PHP:用逗号分割句子,平行结构除外

我想将一个集合沿着逗号分成几部分,除非它包含并行结构。

例如,给定这些句子(http://owl.english.purdue.edu/owl/resource/623/01/):

玛丽喜欢远足、游泳和骑自行车。

玛丽喜欢远足、游泳和骑自行车。

我只会沿着第一个逗号分割这些,所以我会得到:

也许使用前瞻性的正则表达式,检查至少 2-3 个未被逗号包围的空格?

0 投票
2 回答
1436 浏览

java - 关于在句子中查找单词的 Java 查询

我正在使用斯坦福的 NLP 解析器 (http://nlp.stanford.edu/software/lex-parser.shtml) 将一段文本拆分为句子,然后查看哪些句子包含给定的单词。

到目前为止,这是我的代码:

我使用“java TokenizerDemo testfile.txt wall”从命令行运行代码

testfile.txt 的内容是:

所以我希望程序检测第一句中的“墙”(“墙”作为命令行中的第二个参数输入)。但是该程序没有检测到“墙”,因为它从不打印“是!”。程序的输出是:

来自斯坦福解析器的 DocumentPreprocessor 正确地将文本拆分为两个句子。问题似乎与使用 equals 方法有关。每个单词都有类型“edu.stanford.nlp.ling.Word”。我已经尝试访问该单词的底层字符串,因此我可以检查该字符串是否等于“wall”,但我不知道如何访问它。

如果我将第二个 for 循环写为“for (Word word : sentence) {”,那么我会在编译时收到不兼容的类型错误消息。