我有一个大的 csv 文件,使用 weka 进行聚类需要文件中的数据。在某些列中,数字包括 * 符号,例如 45.8* 。在转换为 .arff 之前,如何编辑文件以从整个列中删除这些星星。(特别是 2 列)谢谢。
如果您只需要这样做一次,那么使用Find and Replace怎么样?输入波浪号 ( ~
) 因为它*
在查找/替换中具有特殊含义。
如果您需要多次执行此操作,您可以编写一个自动执行此操作的 VBA 宏,或者只使用宏记录器为您生成一个宏。
如果您只是想*
从文件中删除所有内容,则可以使用正则表达式。它们可以帮助您查找和删除某些字符或模式。