问题标签 [sentence]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - C++ 无法获取 strtok 的用户输入
我一直在 C++ 中遇到此代码的问题:
我实际上希望我的程序用户生成要放入 char 短语 [100] 的短语,但我无法弄清楚在不搞砸翻译的情况下启动输入的正确语法。
这是一个将短语翻译成猪拉丁语的程序。
sql - 将 SQL VARCHAR2 日期更改为另一种日期格式
我在数据库中有一个日期(存储为 VARCHAR2),格式为:
我想做一个SQL语句来获取:
我的目标是手动添加(我知道可以从数据库中导出数据,然后导入 Excel,但我想手动添加)到 Excel 作为可识别的日期。
我的 SQL 语句应该如何?
我试图通过以下方式做到这一点:
但我只能获得:
谢谢
nlp - 如何将文本修剪成一定长度的完整句子?
我正在寻找一种将未知文本修剪到一定长度的解决方案。只保留完整的句子。
所以像这样的文字
应该变成
字符限制为 50、40(和 20 与 --find-next-sentence-ending)。
我读过很多 SO question - 大多数答案都是
但这显然不适用于上述句子和其他类似句子。其他人建议使用斯坦福文本解析器或 OpenNLP。它们真的很酷,但不适用于典型应用。您不会在 Ruby/PHP 服务器上安装 Java,只是为了修剪文本,对吧。所以我正在寻找一些 80/20 的解决方案,它与语言无关,并且能够处理出现的典型案例。
我想不出比这更有问题的句子(在下一个句子的开头包含日期、非点句结尾和非 ascii 字符,以及“限制”句中间的非结尾点)。
我还创建了一个 GIST (https://gist.github.com/4051035) 供您分叉和玩 - 分叉确保用户可以点击此问题的不同解决方案,所以请使用它;) 我想提出这个问题comunity-wiki,但它似乎不适用于问题 - 仅用于答案。因此,请在评论中添加任何建议/相关的 SO 问题。谢谢。
pdf - 如何重新组合拆分的句子?
我正在处理已转换为文本的 PDF。问题?有时,由于不稳定的 PDF 格式和/或 PDF 到文本的转换,句子会被拆分。
因此,我正在寻找有助于“重组”被拆分的句子的工具。页眉或页脚通常是罪魁祸首。其他元素,例如数字和图表,也可以发挥作用,但它们不是我现在最关心的问题。
这个问题可以通过以下几种方式解决:
在进行 NLP 句子检测之前删除页眉和页脚肯定会有所帮助。我不知道执行此操作的工具。你知道工具或方法吗?(删除页码的一般想法在理论上是“容易的”:找到大约每页出现一次的连续递增数字。)
使用可以判断句子语法正确可能性的 NLP 解析器会有所帮助。这样我就可以比较两个句子的语法正确性和它们合并的正确性。(据我所知,Stanford Parser 不评估语法正确性。)您知道可以提供帮助的工具吗?
如果您有解决问题的建议、答案或其他方法,请告诉我。
php - 模式匹配统一的句子结构
我有一个结构统一的句子,我想使用正则表达式从句子中挑选出某些单词。例如句子结构如下:
其中引号中的单词是硬编码的,而没有引号的单词是可变的。例如,基于该句子结构,以下句子适用:
我需要帮助想出一个与此匹配的正则表达式模式,并允许我解析出 [train] 和 [stop]。我的正则表达式 kunfu 很弱,我需要一些帮助。
classification - Weka动态句子分类
您能否给我一些提示,我是否(以及如何)可以在 WEKA 中做到这一点?
我有很多句子,然后我收到一个必须分类的新句子。
现有类别是在现有句子的基础上产生的。首先,如何创建这些类别?
然后,当新句子出现时,我如何将其归类为先前创建的类别之一(不是新的类别)。
regex - 正则表达式匹配特定句子加上日期和时间
我已经尝试弄清楚如何使正则表达式匹配特定的内容,然后是日期和时间。我这辈子都想不通!
我想匹配以下句子,当然日期和时间可能是随机的:
书房 25/01/2013 吉隆坡。14.03 skrev
所以它应该像这样匹配:Den dd/mm/yyyy kl。hh.mm skrev
请注意,时间采用 24 小时格式。
有人可以在这里帮忙吗?我可以很容易地找到一个匹配日期或时间的例子,但我不知道如何将它与这个特定的句子结合起来:(
提前致谢
php - 如何在 PHP 中编辑句子之间的空格?
我目前正在使用
要在 PHP 中编辑句子,但我有一个问题,这里有一个例子:
这是我的示例文本。在这句话之后,点后面没有空格。还有一些其他的句子。
我该怎么办?我希望 PHP 在这种情况下添加空格,但不是在已经有空格或以“...”结尾的句子之后
另一个不受欢迎的行为是数字。例如 :
在彩票中赢得 1.000.000 是多么棒的事!
我真的不希望它1. 000. 000
在编辑后变成。
也一样C.J.
。它必须留下C.J.
而不是C. J.
所以简而言之,在以下情况下应该有空格:
- “。” 不跟数字(可以是其他符号)
- 当有多个点如“...”时忽略
- 当点前有 1 或 2 个字母时忽略。
c++ - 在 C++ 中存储带有标点符号的句子
这是我第一次来这里,我是 C++ 的初学者。我想知道在阅读文本文件时如何用标点符号分割句子。
IE
结果将在我的向量中出现(假设我已将 endl 用于显示向量的每个内容):
- 嘿,你怎么样?
- Java很棒。
- 很棒的 C++ 很棒!
到目前为止,这是我的代码:
这是我的结果:
- 你?
- 伟大的。
- 惊人的!
你能解释为什么我不能得到前一个词并修复它吗?