2

我正在尝试在 Numpy 数组上收集股票数据,其中股票价格的日期位于第一列。当我将数据直接转换为数组时,我会得到[ 30.99 32.08 32.12 ... 318.66 315.77 323.5 ]下面的代码。

import numpy as np
import yfinance as yf

def price(ticker):
    company = yf.Ticker(ticker)
    price = company.history(period="10y")
    array = np.array(price)
    return array
aapl = price("AAPL")
Aaple = aapl[:, 0]

如果我使用数据框,我会得到这个

def price(ticker):
    company = yf.Ticker(ticker)
    price = company.history(period="10y")
    df = pd.DataFrame(price)
    df.drop(df.columns[i], axis=1)
    return df
aapl = price("AAPL")
print(aapl)


                  Open    High     Low   Close     Volume  Dividends  Stock Splits
Date                                                                          
2010-05-27   30.99   31.40   30.81   31.33  166570600       0.00           0.0
2010-05-28   32.08   32.08   31.33   31.77  203903700       0.00           0.0
...            ...     ...     ...     ...        ...        ...           ...

2020-05-22  315.77  319.23  315.35  318.89   20450800       0.00           0.0
2020-05-26  323.50  324.20  316.50  316.73   30880340       0.00           0.0

我可以重置数据帧索引df.reset_index()并能够访问日期。为什么我无法访问数组中的日期,解决方法是什么?我不想使用数据帧,因为数组要快得多。

4

1 回答 1

1

我遇到了同样的问题,这些是周末和节假日,市场在这些日期关闭。转换为 numpy 数组是有问题的,因为日期是或者datetime其余string数据是float. 要保留第一列,您需要将其转换为floatint使用儒略日函数https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Timestamp.to_julian_date.html

于 2020-05-26T22:26:59.800 回答