0

这可能不是一个编程问题,但我在 Google 上找不到任何答案。

我目前有一些文本挖掘任务并进行数据清理。我经常遇到一些不可读的神秘字符。

这些字符是:&#x003b2&#x00025

所有这些都以特定的模式开始,因此我相信它们代表了一些 Excel 不可读的编码。

有没有办法转换它们?我需要知道这些字符的确切含义才能知道是否应该删除它们。

4

2 回答 2

3

这些可能是 Unicode 字符,以十六进制格式编写为 HTML 实体。

  • &#x003b2是“希腊小写字母 BETA”(β)。
  • &#x00025是“百分号”(%)。
于 2015-11-23T17:18:48.483 回答
2

它们看起来像格式化的十六进制值(如果您使用字符,可能是 unicode)。您可能将它们称为0x003B2and0x00025或许多其他方式。

于 2015-11-23T17:17:37.593 回答