问题标签 [non-alphanumeric]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
118 浏览

python-3.x - 如何删除并仅保留某些非字母数字字符?

我的 df 看起来像这样:

当我像这样删除非字母数字字符时:

列如下所示:

如何告诉代码不要在方括号中删除任何内容,而是将所有非字母数字字符放在方括号外?

新的 df 应该是这样的:

0 投票
1 回答
47 浏览

java - 仅打印有效的字母数字字符串

仅打印有效的字母数字字符串

例如,普通版印刷品是:

但我只需要打印这一行:

我在 if 运算符中尝试此regex操作,但不起作用。

0 投票
2 回答
2029 浏览

regex - 如何选择所有非字母数字记录并将其删除?

我想选择包含非字母数字的记录并从字符串中删除这些符号。我期望的结果是只有数字和字母的字符串。

我对正则表达式并不是很熟悉,有时它真的很令人困惑。下面的代码来自类似问题的答案。但它也返回只有字母和空格的记录。我还尝试使用/s以防某些空格不是空格而是制表符。但我得到了同样的结果。

另外,我想删除除字母、数字和空格之外的所有符号、字符。我发现一个从谷歌命名的函数removesymbols可以参考。但似乎这个功能根本不存在。该网站介绍removesymbols的是https://cloud.google.com/dataprep/docs/html/REMOVESYMBOLS-Function_57344727。如何删除所有符号?我不想使用replace,因为有很多符号,而且我不知道它们有各种非字母数字。

0 投票
0 回答
100 浏览

pdf - r 中的制表器库在 PDF 中识别表格上的非字母数字(符号)字符时出现问题

我正在使用 r 中的制表器库从位于公共网站(https://www.waterboards.ca.gov/sandiego/water_issues/programs/basin_plan/docs/update082812/Chpt_2_2012.pdf的 PDF 内的表格中捕获数据)。

我感兴趣的示例表位于 PDF 的第 23 页(第 2-21 页,文档开头有几个空白页)。该表格具有非标准格式和不同的符号(单元格中的非字母数字字符)。我想从这个文档中提取大部分(如果不是全部的话)表。

我想最终得到一个包含带有代码的字符的表格(即,带有 999 的黑色圆圈,带有 777 的白色圆圈,以及带有 -99 的符号等)。

Tabulizer 在将黑圈转换为一致的字母数字代码并保留加号的大部分情况下做得很好,但在带有白圈的 REC1 列上遇到问题,这很奇怪,因为它似乎可以识别其他列上的奇异字符.

有人可以帮忙解决这个问题吗?我也尝试选择表格区域,但输出更糟。下面是我正在使用的 r 代码。

我知道我可以使用 PDF 的内置选择和导出工具为文档中的所有表格手动完成此过程,但希望自动化该过程。

0 投票
1 回答
428 浏览

python - 根据python中的列数据类型将列添加到显示布尔值的数据框

我正在尝试根据确定正在迭代的当前列是字母数字、字母还是数字,将列添加到布尔值的数据框中。不幸的是,对于每个布尔测试,每一列都给出了 False。目标是对于给定的列,如何添加另一列来显示给定列中的行是否是字母数字?我不想遍历列中的每一行,因为这非常耗时。我需要这样做,因为可能存在我不知道给定列中将包含什么数据类型的情况。

0 投票
1 回答
111 浏览

javascript - 使用非字母数字字符时如何使填充空格的结果具有相似的长度?

我正在使用 javascript,我希望以下输出console.log()具有相同的长度。

但是,当前的输出如下:

我想要的输出如下:

我正在根据这里的解释尝试我的示例String.prototype.padEnd()

如何做到这一点?

0 投票
1 回答
87 浏览

pandas - 使用 excel 中的 pandas 读取非字母字符

我正在尝试使用 UTF-8 编码的 pandas读取此文件。

英文字母字符被正确读取,但那些不是英文字母的字符无法正确读取。我尝试通过将编码从 更改为utf8来阅读cp1252ASCII但对我没有任何帮助。

有关更多详细信息,请参见图像。 UTF8 编码

ascii 编码

0 投票
0 回答
263 浏览

sorting - 标准的非字母数字排序顺序

大多数系统/程序中使用的非字母数字字符是否有标准化的排序顺序?例如,当我创建一堆以符号作为第一个字符的项目,然后Name在 Windows 10 中排序时,我得到以下顺序:

在此处输入图像描述

但是这有什么标准吗?0-9 和 AZ 的顺序当然是显而易见的,所以我想知道在计算中是否有任何非字母数字的正常顺序。

0 投票
1 回答
98 浏览

googletest - 有没有办法创建包含非字母数字字符的 GoogleTest 参数化测试用例?

我正在对几个 XML 文件执行一些验证测试,其中一些文件的名称中包含连字符。我创建了一个包含文件名(不包括扩展名)的参数化测试用例,但 GoogleTest 失败,因为

注意:测试名称必须是非空的、唯一的,并且只能包含 ASCII 字母数字字符或下划线。因为 PrintToString 为 std::string 和 C 字符串添加了引号,所以它不适用于这些类型。

我的想法是在 PrintToStringParamName 中用非字母数字字符替换下划线来打印文件名。但如果可能的话,我宁愿保持参数化名称与文件名相同。

有没有办法以某种方式绕过这个限制?我无法永久更改文件名,也无法使用其他测试框架。

0 投票
1 回答
197 浏览

python - 如何使用正则表达式删除python中某个字符串的前导和尾随非字母数字字符?

如何在某个子字符串之前和之后删除给定字符串中的前导和尾随非字母字符?请参阅下面的示例

input_string = m#12$my#tr!#$g%

output_string = m12my#tr!g

在这种情况下,子字符串是my#tr!

给定输入字符串,如何获得输出字符串?

我在下面的尝试删除了所有前导字符(包括字母数字)。请参阅下面的代码片段)。我尝试修改\W+而不是修改.+

感谢任何关于我如何为此目的使用正则表达式模式的想法。