4

我正在使用一个由数字列表组成的 Pandas 系列,以单词为索引:

$10             [1, 0, 1, 1, 1, 1, 1]
$100                        [0, 0, 0]
$15                               [1]
$19                            [0, 0]
$1?                            [1, 1]
$20                         [0, 1, 1]
$20-$40                           [0]

我正在尝试编写一些简单的代码来创建一个新系列,该系列仅包含包含长度为“n”或更大的列表的项目。

有点像系列的列表理解。

谢谢你的帮助

4

2 回答 2

3

您应该避免list在对象中使用 s Series,但是您可以像这样执行您的要求:

编辑:用法

# DON'T use `eval` in production I'm just using it for convenience here
In [7]: s = read_clipboard(sep=r'\s{2,}', index_col=0, header=None, squeeze=1).map(eval)

In [8]: s
Out[8]:
0
$10        [1, 0, 1, 1, 1, 1, 1]
$100                   [0, 0, 0]
$15                          [1]
$19                       [0, 0]
$1?                       [1, 1]
$20                    [0, 1, 1]
$20-$40                      [0]

In [20]: n = 3

In [21]: s.map(len) >= n
Out[21]:
0
$10         True
$100        True
$15        False
$19        False
$1?        False
$20         True
$20-$40    False
Name: 1, dtype: bool

In [22]: s[s.map(len) >= n]
Out[22]:
0
$10     [1, 0, 1, 1, 1, 1, 1]
$100                [0, 0, 0]
$20                 [0, 1, 1]
Name: 1, dtype: object

您不应该list在对象中使用 s ,Series因为它们是object底层的数组,而不是Series可以利用numpy.

于 2013-08-17T17:55:33.947 回答
1

尝试这个:

s[s.map(len) >= n]
于 2013-08-17T17:57:17.657 回答