2

我的矩阵看起来像这样。

 ['Hotel', ' "excellent"', ' "very good"', ' "average"', ' "poor"', ' "terrible"', ' "cheapest"', ' "rank"', ' "total reviews"']
 ['westin', ' 390', ' 291', ' 70', ' 43', ' 19', ' 215', ' 27', ' 813']
 ['ramada', ' 136', ' 67', ' 53', ' 30', ' 24', ' 149', ' 49', ' 310 ']
 ['sutton place', '489', ' 293', ' 106', ' 39', ' 20', ' 299', ' 24', ' 947']
 ['loden', ' 681', ' 134', ' 17', ' 5', ' 0', ' 199', ' 4', ' 837']
 ['hampton inn downtown', ' 241', ' 166', ' 26', ' 5', ' 1', ' 159', ' 21', ' 439']
 ['shangri la', ' 332', ' 45', ' 20', ' 8', ' 2', ' 325', ' 8', ' 407']
 ['residence inn marriott', ' 22', ' 15', ' 5', ' 0', ' 0', ' 179', ' 35', ' 42']
 ['pan pacific', ' 475', ' 262', ' 86', ' 29', ' 16', ' 249', ' 15', ' 868']
 ['sheraton wall center', ' 277', ' 346', ' 150', ' 80', ' 26', ' 249', ' 45', ' 879']
 ['westin bayshore', ' 390', ' 291', ' 70', ' 43', ' 19', ' 199', ' 813']

我想从中删除第一行和第 0 列并创建一个新矩阵。

我该怎么做呢?

通常在java左右Id使用如下代码:

 for (int y; y< matrix[x].length; y++)
     for(int x; x < matrix[Y].length; x++)
      {
        if(x == 0 || y == 0)
         {
           continue
          }
          else
           {
             new_matrix[x][y] = matrix[x][y];
           }


      }

在 python 中有没有这样的方法来迭代和选择性地复制元素?

谢谢


编辑

当我遍历矩阵时,我还尝试将每个矩阵元素从字符串转换为浮点数。

这是我根据以下答案更新的修改代码。

A = []
f = open("csv_test.csv",'rt')
try:
    reader = csv.reader(f)
    for row in reader:
        A.append(row)
 finally:
     f.close()

 new_list = [row[1:] for row in A[1:]]
 l = np.array(new_list)
 l.astype(np.float32)
 print l

但是我收到一个错误

  --> l.astype(np.float32)
       print l


      ValueError: setting an array element with a sequence.
4

3 回答 3

5

如果您有一个列表列表,那么:

new_list = [row[1:] for row in current_list[1:]]

因此,创建一个忽略第一行的新矩阵,然后对于之后的每一行,忽略第一列。

如果它碰巧是 a numpy.array,那么您可以使用:

your_array[1:,1:]
于 2012-10-24T03:05:25.713 回答
3

基本理念

这是我想出的:

>>> import numpy as np
>>> l = [['hotel','good','bad'],['hilton',1,2],['ramada',3,4]]
>>> a = np.array(l) # convert to a numpy array to make multi-dimensional slicing possible
>>> a
array([['hotel', 'good', 'bad'],
       ['hilton', '1', '2'],
       ['ramada', '3', '4']], 
      dtype='|S4')
>>> a[1:,1:] # exclude the first row and the first column
array([['1', '2'],
       ['3', '4']], 
      dtype='|S4')
>>> a[1:,1:].astype(np.float32) # convert to float
array([[ 1.,  2.],
       [ 3.,  4.]], dtype=float32)

您可以将二维列表传递给 numpy 数组构造函数,对二维数组进行切片以删除第一行和第一列,然后使用该astype方法将所有内容转换为浮点数。

全部在一条线上,那就是:

>>> l = [['hotel','good','bad'],['hilton',1,2],['ramada',3,4]]
>>> np.array(l)[1:,1:].astype(np.float32)
array([[ 1.,  2.],
       [ 3.,  4.]], dtype=float32)

价值错误

你得到 aValueError因为你实际上有一个锯齿状的数组。使用问题中代码中的变量new_list,您可以向自己证明这一点:

>>> [len(x) for x in new_list]
[9, 9, 9, 9, 9, 9, 9, 9, 9, 8]

最后一行的长度只有 8,而不是像所有其他行一样的 9。给定一个 2d 锯齿状列表,numpy.array构造函数将创建一个 1d numpy 数组,其中 a dtypeof object。该数组中的条目是 Python 列表。该astype调用正在尝试将 Python 列表转换为float32,但失败了。我猜这只是人为错误的情况。如果你修复了丢失的条目,你应该很高兴。

于 2012-10-24T03:41:24.700 回答
0

嵌套列表推导是您所需要的。例子:

def remove_from_matrix(matrix, columns, rows):
    return [
           [float(matrix[row_num][col_num])
           for col_num in range(len(matrix[row_num])) 
           if not col_num in columns]

           for row_num in range(len(matrix))
           if not row_num in rows]
于 2012-10-24T04:32:24.130 回答