问题标签 [sentence]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 用Java自动完成句子
假设我有大约 1000 个句子要在用户输入字段时作为建议提供。
我正在考虑运行lucene in memory search
,然后将结果输入suggestions set
.
用于运行搜索的trigger
将是space char
and exit from the input field
。
我打算使用它,GWT
因此客户端只需从服务器获取结果。
我不想做谷歌正在做的事情;他们在其中完成每个单词,然后对每组关键字提出建议。我只想检查关键字并据此提出建议。有点像当我在stackoverflow上输入问题的标题时。
以前有没有人做过这样的事情?是否已经有我可以使用的库?
iphone - 无法在 UIWebView 的 HTML 页面中选择多个句子
我有下面这样的 HTML 页面:
<html>
<body>
<div id='0>
<span id='0'>Hi </span>
<span id='1'>How </span>
<span id='2'>Are </span>
<span id='3'>You</span>
</div>
<br><br>
<div id='1>
<span id='4'>welcome </span>
<span id='5'>to </span>
<span id='6'>our </span>
<span id='7'>place</span>
</div>
<br><br>
</body>
</html>
我正在尝试在加载了这样的 HTML 的 iPhone webView 中选择多个句子。但我选择而不是选择句子块。
我必须改变什么?
antlr - 解析不同单词类型的句子
我正在寻找一种用于分析两种句子的语法,这意味着用空格分隔的单词:
- ID1:单词不以数字开头的句子
- ID2:单词不以数字和数字开头的句子
基本上,语法的结构应该看起来像
@Bart
我只是尝试添加两个标记'_'
并'"'
作为 lexer-ruleSpecial
供以后在 lexer-rule 中使用Word
。即使我没有Special
在以下语法中使用,我在 ANTLRWorks 1.4.2 中得到以下错误:
The following token definition can never be match because prior tokens match the same input: Special
But when I add fragment
before Special
,我没有得到那个错误。为什么?
Special
然后应在 lexer-rule 中使用 Lexer- rule Word
:
java - 如何使用正则表达式拆分文本,但拆分后的单词继续保留正则表达式分隔符?
我有一个文本并使用这个简单的正则表达式将其拆分为单词:[ \n]
. 它使用空格和换行符将文本拆分为单词。
我想知道是否有办法在拆分的单词中保留空格或换行符,因为我将在一些处理后使用它来进行简单的句子检测。
我正在使用该String#split
方法。
ruby-on-rails - 如何用一句话“变换”一个数组?
我正在使用 Ruby on Rails v3.0.9,我想在一个句子中“转换”一个字符串数组,包括标点符号。也就是说,如果我有一个如下所示的数组:
我想得到\构建:
我怎样才能做到这一点?
c# - 将句子拆分成单词,但 C# 中的标点符号有问题
我见过一些类似的问题,但我正在努力实现这一目标。
给定一个字符串,str="月球是我们的天然卫星,即它围绕地球旋转!" 我想提取单词并将它们存储在一个数组中。预期的数组元素将是这个。
我尝试使用 String.split(','\t','\r') 但这不能正常工作。我还尝试删除 . 和其他标点符号,但我也希望解析出像“ie”这样的字符串。实现这一目标的最佳方法是什么?我也尝试使用 regex.split 无济于事。
肯定会欣赏一些在正确方向上的推动。
regex - 尝试使用正则表达式操作文档中的行
我的文本文档格式不适合我的目的,我不得不进行一些更改。但是现在我有另一个问题,就是很多句子自己“搁浅”了,像这样:
有谁知道用正则表达式表示句子的方法?我想将这些句子与上面或下面的段落连接起来。我发誓在问之前我搜索了谷歌和这个网站。
编辑:抱歉,我无法访问我的原始帖子,并且无法评论 Amber 的答案。我会为以后的问题注册一个帐户。另外,我忽略了我正在使用 Notepad++ 的事实。
javascript - Javascript(jQuery)删除长文本的最后一句
我正在寻找一个足够聪明的 javascript 函数来删除一大段文本的最后一句话(实际上是一个段落)。一些显示复杂性的示例文本:
现在我可以拆分.
并删除数组的最后一个条目,但这不适用于以?
or结尾的句子,!
并且某些句子以引号结尾,例如something: "stuff."
这该怎么做?什么是合适的算法?
编辑-长文本是指我的段落中的所有内容,而句子是指一个实际的句子(不是一行),因此在我的示例中,最后一句话是:He later described it as: "Something insane."
删除那个时,下一个是She did not know, "I think we should move past the fence!", she quickly said."
php - PHP:用逗号分割句子,平行结构除外
我想将一个集合沿着逗号分成几部分,除非它包含并行结构。
例如,给定这些句子(http://owl.english.purdue.edu/owl/resource/623/01/):
玛丽喜欢远足、游泳和骑自行车。
玛丽喜欢远足、游泳和骑自行车。
我只会沿着第一个逗号分割这些,所以我会得到:
也许使用前瞻性的正则表达式,检查至少 2-3 个未被逗号包围的空格?
java - 关于在句子中查找单词的 Java 查询
我正在使用斯坦福的 NLP 解析器 (http://nlp.stanford.edu/software/lex-parser.shtml) 将一段文本拆分为句子,然后查看哪些句子包含给定的单词。
到目前为止,这是我的代码:
我使用“java TokenizerDemo testfile.txt wall”从命令行运行代码
testfile.txt 的内容是:
所以我希望程序检测第一句中的“墙”(“墙”作为命令行中的第二个参数输入)。但是该程序没有检测到“墙”,因为它从不打印“是!”。程序的输出是:
来自斯坦福解析器的 DocumentPreprocessor 正确地将文本拆分为两个句子。问题似乎与使用 equals 方法有关。每个单词都有类型“edu.stanford.nlp.ling.Word”。我已经尝试访问该单词的底层字符串,因此我可以检查该字符串是否等于“wall”,但我不知道如何访问它。
如果我将第二个 for 循环写为“for (Word word : sentence) {”,那么我会在编译时收到不兼容的类型错误消息。