“non-alphanumeric”的相关标签问题

0 投票

2 回答

118 浏览

python-3.x - 如何删除并仅保留某些非字母数字字符？

我的 df 看起来像这样：

当我像这样删除非字母数字字符时：

列如下所示：

如何告诉代码不要在方括号中删除任何内容，而是将所有非字母数字字符放在方括号外？

新的 df 应该是这样的：

2019-01-28T16:21:03.163

0 投票

1 回答

47 浏览

java - 仅打印有效的字母数字字符串

仅打印有效的字母数字字符串

例如，普通版印刷品是：

但我只需要打印这一行：

我在 if 运算符中尝试此regex操作，但不起作用。

java alphanumeric non-alphanumeric

2019-04-16T01:58:59.477

0 投票

2 回答

2029 浏览

regex - 如何选择所有非字母数字记录并将其删除？

我想选择包含非字母数字的记录并从字符串中删除这些符号。我期望的结果是只有数字和字母的字符串。

我对正则表达式并不是很熟悉，有时它真的很令人困惑。下面的代码来自类似问题的答案。但它也返回只有字母和空格的记录。我还尝试使用/s以防某些空格不是空格而是制表符。但我得到了同样的结果。

另外，我想删除除字母、数字和空格之外的所有符号、字符。我发现一个从谷歌命名的函数removesymbols可以参考。但似乎这个功能根本不存在。该网站介绍removesymbols的是https://cloud.google.com/dataprep/docs/html/REMOVESYMBOLS-Function_57344727。如何删除所有符号？我不想使用replace，因为有很多符号，而且我不知道它们有各种非字母数字。

regex google-bigquery non-alphanumeric

2019-07-25T14:42:12.603

0 投票

0 回答

100 浏览

pdf - r 中的制表器库在 PDF 中识别表格上的非字母数字（符号）字符时出现问题

我正在使用 r 中的制表器库从位于公共网站（https://www.waterboards.ca.gov/sandiego/water_issues/programs/basin_plan/docs/update082812/Chpt_2_2012.pdf的 PDF 内的表格中捕获数据）。

我感兴趣的示例表位于 PDF 的第 23 页（第 2-21 页，文档开头有几个空白页）。该表格具有非标准格式和不同的符号（单元格中的非字母数字字符）。我想从这个文档中提取大部分（如果不是全部的话）表。

我想最终得到一个包含带有代码的字符的表格（即，带有 999 的黑色圆圈，带有 777 的白色圆圈，以及带有 -99 的符号等）。

Tabulizer 在将黑圈转换为一致的字母数字代码并保留加号的大部分情况下做得很好，但在带有白圈的 REC1 列上遇到问题，这很奇怪，因为它似乎可以识别其他列上的奇异字符.

有人可以帮忙解决这个问题吗？我也尝试选择表格区域，但输出更糟。下面是我正在使用的 r 代码。

我知道我可以使用 PDF 的内置选择和导出工具为文档中的所有表格手动完成此过程，但希望自动化该过程。

pdf symbols pdf-scraping non-alphanumeric pdftables

2019-12-10T01:38:18.297

0 投票

1 回答

428 浏览

python - 根据python中的列数据类型将列添加到显示布尔值的数据框

我正在尝试根据确定正在迭代的当前列是字母数字、字母还是数字，将列添加到布尔值的数据框中。不幸的是，对于每个布尔测试，每一列都给出了 False。目标是对于给定的列，如何添加另一列来显示给定列中的行是否是字母数字？我不想遍历列中的每一行，因为这非常耗时。我需要这样做，因为可能存在我不知道给定列中将包含什么数据类型的情况。

python pandas dataframe alphanumeric non-alphanumeric

2019-12-10T18:41:13.577

0 投票

1 回答

111 浏览