5

有问题的部分是:

   self.H = np.multiply(self.H, np.divide(np.matmul(preprocessing.normalize(self.W).T, np.multiply(self.X, np.power(self.A, self.beta - 2)))), np.matmul(self.W.T, np.power(self.A, self.beta - 1)) + self.sparsity)

A、W、H 是 Panda 数据帧。Beta 和稀疏度是整数。

它们的初始化是:

    self.W = pd.DataFrame(np.random.randint(100,size=(self.X.shape[0], self.K)))
    self.H = pd.DataFrame(np.random.randint(0,100,size=(self.K, self.X.shape[1])))
    self.W = preprocessing.normalize(self.W)
    self.A = self.W.dot(self.H)
4

1 回答 1

2

Type Error: can't multiply sequence by non-int of type 'float'意思就是它所说的。您不能将非数字(非整数)数据类型与编号数据类型相乘。例如,您不能将字符串与数字相乘。

您提交的上述代码实际上有效。但是,由于您收到此错误,我假设上面的代码只是您实际代码的代理。所以,我将告诉我如何解决我在做类似事情时遇到的相同错误。


假设有一个 csv 文件包含一个类的主题标记,如下表所示

|      | Maths | English |
| Adam |  98   |   78    |
| John |  34   |   89    |

如您所见,有一个行索引和一个列索引。如果你跑

marks = pd.read_csv("marks.csv")

marks将有 3 列,第一列包含学生的姓名。Pandasread 假设第一列是数据的一部分。现在,如果你将它与一个Numpy数组相乘,你会得到一个错误。因为,数字不能与字符串相乘。

为了解决这个问题,我们需要明确告诉 pandas 文件的第一列是行索引。

marks = pd.read_csv("marks.csv", index_col=0)

该参数index_col告诉文件中的哪一列作为行索引。你可以在他们的文档中详细了解这一点,这里

于 2018-05-31T03:04:32.773 回答