问题标签 [punctuation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在标点符号后拆分字符串,同时包含标点符号
我正在尝试通过正则表达式将一串单词拆分为单词列表。我还是一个正则表达式的初学者。
我正在使用 nltk.regex_tokenize,它产生的结果很接近,但不是我想要的。
这是我到目前为止所拥有的:
我希望输出如下:
我有一个“表情符号”的解决方法,所以我最关心的是引号。
r - 删除 R 中除撇号外的所有标点符号
我想使用 R 的 gsub 从文本中删除除撇号之外的所有标点符号。我对正则表达式相当陌生,但正在学习。
例子:
电流输出(不带撇号)
期望的输出(我希望撇号不要留下)
c - 在 C 中使用 sscanf 读取带有空格的字符串时导致错误的标点符号
更新:正确初始化字符串char string[sizeof buffer - 1]
已经解决了崩溃问题,但我仍然很好奇有多个标点符号与它有什么关系!
我正在尝试从“某些文本”形式的文件中读取字符串。到目前为止,使用sscanf
该模式\"%[^\"]\"
对我来说非常有效,但是一旦我开始在字符串中添加标点符号,程序就开始崩溃。
似乎只有在使用多个标点符号时才会出现错误,无论它是什么标点符号或标记的位置。无论文件中带有标点符号的行的位置如何,它也会发生(即,即使最后一行没有标点符号,错误仍然会发生)。
无论如何,下面是我到目前为止的代码:
以下是我尝试过的一些数据。在标记为“不成功”的地方,程序编译、运行所有内容,并在退出前崩溃。
如果此问题得到解决,我计划使用更复杂的模式,并且在%d \"%[^\"]\" \"%[^\"]\"
发生此错误之前成功地使用该模式读取数据。提前感谢您的任何答案。
zend-framework - 使用 Zend_Translate 处理标点符号
目前,我正在尝试将 Zend_Translate 应用于我正在从事的项目。常规文本工作得很好,但我在翻译表格时遇到了问题。
翻译适配器在 Zend_Registry 中注册,使用 Zend_Translate 作为键。这在大多数情况下都可以正常工作,除非在显示表单之前进行翻译。
代码示例:
假设“Bedrijfsgegevens”在对应的翻译源文件中被翻译,那么上面一行将输出为“Bedrijfsgegevens:”,而下面一行输出“Business information”。
据我所知,有三种方法可以解决这个问题。可以通过在用冒号连接之前调用存储的 Zend_Translate_Adapter 来解决它,但这会产生很多不必要的代码。另一种选择是在翻译文件中加入标点符号,但这意味着每种标点符号都应该有一个翻译。第三个选项是简单地从图例中删除冒号,但这不是我想要的。
我的问题:有没有办法告诉 Zend_Translate 忽略标点符号?
python - Python正则表达式标点识别
我被这个难住了。我只是在学习正则表达式,无法弄清楚为什么这不会返回标点符号。
这是正则表达式正在解析的一段文本文件:
APRIL/NNP是/VBZ/DT最残忍/JJ月/NN,/,育种/VBG丁香/NNP出/RB/IN/DT死/JJ陆/NN
我认为在方括号中的“\”将允许它返回一个“”,但它不起作用。
任何帮助,将不胜感激。
parsing - 是否有所有国际句号标点符号的字符集?
我正在尝试将 utf-8 字符串解析为“一口大小”的段。例如,我想将文本分解为“句子”。
是否有与所有语言的句子结尾相对应的字符(或正则表达式)的全面集合?我正在寻找可以捕捉拉丁语时期、感叹号和问号、中文和日文句号等的东西。
像上面这样的东西,但相当于一个逗号也会很棒。
r - 如何将包含撇号的 .csv 文件读入 R?
我很难让 R 读取包含撇号的 .txt 或 .csv 文件。
我的一些专栏包含描述性文字,例如“关注客户需求”或“警长的副手”。我的文件在 Excel 中正确打开(即所有数据出现在正确的单元格中;有 3 列和大约 8000 行,并且没有丢失数据)。但是当我要求 R 读取文件时,会发生以下情况:
(第 520 行是包含撇号的第一行。)
如果我进入 .txt 或 .csv 文件并手动删除所有撇号,则 R 会正确读取文件。但是,如果可以的话,我宁愿保留撇号。
我是 R 新手,如果有任何帮助,我将不胜感激。
python - 如何在 Python 中打印后在两个变量之间添加空格
我对 Python 还很陌生,所以我正在尝试一些简单的代码。但是,在其中一种实践中,我的代码应该在左侧显示一些以英寸为单位的数字,并在右侧显示数字的转换;
我希望在它们之间留出一些空间来打印输出;
我不知道该怎么做。我到处搜索,但我只能找到试图摆脱空间的人。如果有人能引导我朝着正确的方向前进,我将不胜感激。
哦,我刚刚意识到我使用的是 Python 2.7,而不是3.x。不确定这是否重要。
html - 标点开始放在我的行首
所以这可能是一个简单的错误,我不能真正发布我的整个代码,因为它非常长。但长话短说。
当我输入
这是结果
我敢肯定这是我搞砸的简单事情。
有什么建议么?另外,真正奇怪的是,如果我在省略号后添加一个字母,标点符号将被更正..
unicode - Unicode 通用类别中的 GC=Mark 和 GC=Punctuation 有什么区别?
我无法理解一些概念。在 Unicode 规范中,有一个名为general category的属性。
好的,我了解字母(通常的字符;GC=L
)、数字(如数字 0-9 和其他具有数值的字符;GC=N
)和分隔符(分隔符;GC=Z
)是什么。但是很难区分符号 ( GC=S
)、标点符号 ( GC=P
) 和标记 ( GC=M
)。
我查找了它们的列表,但找不到概念上的差异。而且这份文件对我帮助不大。所有这些有什么区别?