问题标签 [sentence]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
4 回答
1674 浏览

c++ - 基于 C++ 中句子的数组

可能重复:
在 C++ 中拆分字符串

如何将一堆用空格分隔的单词读入数组?

说我有这句话:

“我喜欢青蛙”

而这个数组:

我想做

举个例子。(请不要告诉我对我刚刚写的句子进行硬编码,这是一个例子。)

0 投票
2 回答
1378 浏览

c++ - C++ 无法获取 strtok 的用户输入

我一直在 C++ 中遇到此代码的问题:

我实际上希望我的程序用户生成要放入 char 短语 [100] 的短语,但我无法弄清楚在不搞砸翻译的情况下启动输入的正确语法。

这是一个将短语翻译成猪拉丁语的程序。

0 投票
2 回答
1011 浏览

sql - 将 SQL VARCHAR2 日期更改为另一种日期格式

我在数据库中有一个日期(存储为 VARCHAR2),格式为:

我想做一个SQL语句来获取:

我的目标是手动添加(我知道可以从数据库中导出数据,然后导入 Excel,但我想手动添加)到 Excel 作为可识别的日期。

我的 SQL 语句应该如何?

我试图通过以下方式做到这一点:

但我只能获得:

谢谢

0 投票
2 回答
755 浏览

nlp - 如何将文本修剪成一定长度的完整句子?

我正在寻找一种将未知文本修剪到一定长度的解决方案。只保留完整的句子。

所以像这样的文字

应该变成

字符限制为 50、40(和 20 与 --find-next-sentence-ending)。

我读过很多 SO question - 大多数答案都是

但这显然不适用于上述句子和其他类似句子。其他人建议使用斯坦福文本解析器或 OpenNLP。它们真的很酷,但不适用于典型应用。您不会在 Ruby/PHP 服务器上安装 Java,只是为了修剪文本,对吧。所以我正在寻找一些 80/20 的解决方案,它与语言无关,并且能够处理出现的典型案例。

我想不出比这更有问题的句子(在下一个句子的开头包含日期、非点句结尾和非 ascii 字符,以及“限制”句中间的非结尾点)。

我还创建了一个 GIST (https://gist.github.com/4051035) 供您分叉和玩 - 分叉确保用户可以点击此问题的不同解决方案,所以请使用它;) 我想提出这个问题comunity-wiki,但它似乎不适用于问题 - 仅用于答案。因此,请在评论中添加任何建议/相关的 SO 问题。谢谢。

0 投票
1 回答
182 浏览

pdf - 如何重新组合拆分的句子?

我正在处理已转换为文本的 PDF。问题?有时,由于不稳定的 PDF 格式和/或 PDF 到文本的转换,句子会被拆分。

因此,我正在寻找有助于“重组”被拆分的句子的工具。页眉或页脚通常是罪魁祸首。其他元素,例如数字和图表,也可以发挥作用,但它们不是我现在最关心的问题。

这个问题可以通过以下几种方式解决:

  1. 在进行 NLP 句子检测之前删除页眉和页脚肯定会有所帮助。我不知道执行此操作的工具。你知道工具或方法吗?(删除页码的一般想法在理论上是“容易的”:找到大约每页出现一次的连续递增数字。)

  2. 使用可以判断句子语法正确可能性的 NLP 解析器会有所帮助。这样我就可以比较两个句子的语法正确性和它们合并的正确性。(据我所知,Stanford Parser 不评估语法正确性。)您知道可以提供帮助的工具吗?

如果您有解决问题的建议、答案或其他方法,请告诉我。

0 投票
3 回答
261 浏览

php - 模式匹配统一的句子结构

我有一个结构统一的句子,我想使用正则表达式从句子中挑选出某些单词。例如句子结构如下:

其中引号中的单词是硬编码的,而没有引号的单词是可变的。例如,基于该句子结构,以下句子适用:

我需要帮助想出一个与此匹配的正则表达式模式,并允许我解析出 [train] 和 [stop]。我的正则表达式 kunfu 很弱,我需要一些帮助。

0 投票
0 回答
223 浏览

classification - Weka动态句子分类

您能否给我一些提示,我是否(以及如何)可以在 WEKA 中做到这一点?

我有很多句子,然后我收到一个必须分类的新句子。

现有类别是在现有句子的基础上产生的。首先,如何创建这些类别?

然后,当新句子出现时,我如何将其归类为先前创建的类别之一(不是新的类别)。

0 投票
4 回答
457 浏览

regex - 正则表达式匹配特定句子加上日期和时间

我已经尝试弄清楚如何使正则表达式匹配特定的内容,然后是日期和时间。我这辈子都想不通!

我想匹配以下句子,当然日期和时间可能是随机的:

书房 25/01/2013 吉隆坡。14.03 skrev

所以它应该像这样匹配:Den dd/mm/yyyy kl。hh.mm skrev

请注意,时间采用 24 小时格式。

有人可以在这里帮忙吗?我可以很容易地找到一个匹配日期或时间的例子,但我不知道如何将它与这个特定的句子结合起来:(

提前致谢

0 投票
1 回答
244 浏览

php - 如何在 PHP 中编辑句子之间的空格?

我目前正在使用

要在 PHP 中编辑句子,但我有一个问题,这里有一个例子:

这是我的示例文本。在这句话之后,点后面没有空格。还有一些其他的句子。

我该怎么办?我希望 PHP 在这种情况下添加空格,但不是在已经有空格或以“...”结尾的句子之后

另一个不受欢迎的行为是数字。例如 :

在彩票中赢得 1.000.000 是多么棒的事!

我真的不希望它1. 000. 000在编辑后变成。

也一样C.J.。它必须留下C.J.而不是C. J.

所以简而言之,在以下情况下应该有空格:

  • “。” 跟数字(可以是其他符号)
  • 当有多个点如“...”时忽略
  • 当点前有 1 或 2 个字母时忽略。
0 投票
1 回答
1154 浏览

c++ - 在 C++ 中存储带有标点符号的句子

这是我第一次来这里,我是 C++ 的初学者。我想知道在阅读文本文件时如何用标点符号分割句子。

IE

结果将在我的向量中出现(假设我已将 endl 用于显示向量的每个内容):

  • 嘿,你怎么样?
  • Java很棒。
  • 很棒的 C++ 很棒!

到目前为止,这是我的代码:

这是我的结果:

  • 你?
  • 伟大的。
  • 惊人的!

你能解释为什么我不能得到前一个词并修复它吗?