问题标签 [punctuation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
572 浏览

python - 在标点符号后拆分字符串,同时包含标点符号

我正在尝试通过正则表达式将一串单词拆分为单词列表。我还是一个正则表达式的初学者。

我正在使用 nltk.regex_tokenize,它产生的结果很接近,但不是我想要的。

这是我到目前为止所拥有的:

我希望输出如下:

我有一个“表情符号”的解决方法,所以我最关心的是引号。

0 投票
4 回答
22552 浏览

r - 删除 R 中除撇号外的所有标点符号

我想使用 R 的 gsub 从文本中删除除撇号之外的所有标点符号。我对正则表达式相当陌生,但正在学习。

例子:

电流输出(不带撇号)

期望的输出(我希望撇号不要留下)

0 投票
1 回答
348 浏览

c - 在 C 中使用 sscanf 读取带有空格的字符串时导致错误的标点符号

更新:正确初始化字符串char string[sizeof buffer - 1]已经解决了崩溃问题,但我仍然很好奇有多个标点符号与它有什么关系!

我正在尝试从“某些文本”形式的文件中读取字符串。到目前为止,使用sscanf该模式\"%[^\"]\"对我来说非常有效,但是一旦我开始在字符串中添加标点符号,程序就开始崩溃。

似乎只有在使用多个标点符号时才会出现错误,无论它是什么标点符号或标记的位置。无论文件中带有标点符号的行的位置如何,它也会发生(即,即使最后一行没有标点符号,错误仍然会发生)。

无论如何,下面是我到目前为止的代码:

以下是我尝试过的一些数据。在标记为“不成功”的地方,程序编译、运行所有内容,并在退出前崩溃。

如果此问题得到解决,我计划使用更复杂的模式,并且在%d \"%[^\"]\" \"%[^\"]\"发生此错误之前成功地使用该模式读取数据。提前感谢您的任何答案。

0 投票
2 回答
144 浏览

zend-framework - 使用 Zend_Translate 处理标点符号

目前,我正在尝试将 Zend_Translate 应用于我正在从事的项目。常规文本工作得很好,但我在翻译表格时遇到了问题。

翻译适配器在 Zend_Registry 中注册,使用 Zend_Translate 作为键。这在大多数情况下都可以正常工作,除非在显示表单之前进行翻译。

代码示例:

假设“Bedrijfsgegevens”在对应的翻译源文件中被翻译,那么上面一行将输出为“Bedrijfsgegevens:”,而下面一行输出“Business information”。

据我所知,有三种方法可以解决这个问题。可以通过在用冒号连接之前调用存储的 Zend_Translate_Adapter 来解决它,但这会产生很多不必要的代码。另一种选择是在翻译文件中加入标点符号,但这意味着每种标点符号都应该有一个翻译。第三个选项是简单地从图例中删除冒号,但这不是我想要的。

我的问题:有没有办法告诉 Zend_Translate 忽略标点符号?

0 投票
1 回答
2116 浏览

python - Python正则表达式标点识别

我被这个难住了。我只是在学习正则表达式,无法弄清楚为什么这不会返回标点符号。

这是正则表达式正在解析的一段文本文件:

APRIL/NNP是/VBZ/DT最残忍/JJ月/NN,/,育种/VBG丁香/NNP出/RB/IN/DT死/JJ陆/NN

我认为在方括号中的“\”将允许它返回一个“”,但它不起作用。

任何帮助,将不胜感激。

0 投票
3 回答
1548 浏览

parsing - 是否有所有国际句号标点符号的字符集?

我正在尝试将 utf-8 字符串解析为“一口大小”的段。例如,我想将文本分解为“句子”。

是否有与所有语言的句子结尾相对应的字符(或正则表达式)的全面集合?我正在寻找可以捕捉拉丁语时期、感叹号和问号、中文和日文句号等的东西。

像上面这样的东西,但相当于一个逗号也会很棒。

0 投票
3 回答
22371 浏览

r - 如何将包含撇号的 .csv 文件读入 R?

我很难让 R 读取包含撇号的 .txt 或 .csv 文件。

我的一些专栏包含描述性文字,例如“关注客户需求”或“警长的副手”。我的文件在 Excel 中正确打开(即所有数据出现在正确的单元格中;有 3 列和大约 8000 行,并且没有丢失数据)。但是当我要求 R 读取文件时,会发生以下情况:

(第 520 行是包含撇号的第一行。)

如果我进入 .txt 或 .csv 文件并手动删除所有撇号,则 R 会正确读取文件。但是,如果可以的话,我宁愿保留撇号。

我是 R 新手,如果有任何帮助,我将不胜感激。

0 投票
11 回答
154549 浏览

python - 如何在 Python 中打印后在两个变量之间添加空格

我对 Python 还很陌生,所以我正在尝试一些简单的代码。但是,在其中一种实践中,我的代码应该在左侧显示一些以英寸为单位的数字,并在右侧显示数字的转换;

我希望在它们之间留出一些空间来打印输出;

我不知道该怎么做。我到处搜索,但我只能找到试图摆脱空间的人。如果有人能引导我朝着正确的方向前进,我将不胜感激。

哦,我刚刚意识到我使用的是 Python 2.7,而不是3.x。不确定这是否重要。

0 投票
1 回答
43 浏览

html - 标点开始放在我的行首

所以这可能是一个简单的错误,我不能真正发布我的整个代码,因为它非常长。但长话短说。

当我输入

这是结果

我敢肯定这是我搞砸的简单事情。

有什么建议么?另外,真正奇怪的是,如果我在省略号后添加一个字母,标点符号将被更正..

0 投票
1 回答
169 浏览

unicode - Unicode 通用类别中的 GC=Mark 和 GC=Punctuation 有什么区别?

我无法理解一些概念。在 Unicode 规范中,有一个名为general category的属性。

好的,我了解字母(通常的字符;GC=L)、数字(如数字 0-9 和其他具有数值的字符;GC=N)和分隔符(分隔符;GC=Z)是什么。但是很难区分符号 ( GC=S)、标点符号 ( GC=P) 和标记 ( GC=M)。

我查找了它们的列表,但找不到概念上的差异。而且这份文件对我帮助不大。所有这些有什么区别?