问题标签 [stock-data]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
mysql - 将数据从多个 CSV 加载到 MySQL
我正在尝试将多个 csv 文件加载到 mysql 中以创建这些多个文件的单个表。我在mysql中加载了一个名为symbols的表,其中有一列名为ticker,所有行值都代表A、B、C等符号。我想循环这些行以创建一个路径,/path/A.csv
以便我可以阅读来自所有这些文件的数据以创建新表 all_tickers。
之前我在 SQL Server 中使用以下代码执行此操作:
为了在 MySQL 中复制结果,我将上面的代码更改为如下:
我在处理WITH
SQL Server 中用于将其转换为 MySQL 的子句时遇到问题。
由于我是 MySQL 新手,我认为这是主要问题。如果代码中还有其他问题,请提出建议。
mysql - 如何优化一个大的mysql表(股票数据)
我有一个具有以下结构的表,
我没有找到分解它的想法,在前端演示中,我需要显示所有这些列。我正在写一个查询,例如,
该表有数百万条记录,并且每天都会添加新记录。现在的问题是每个查询都需要花费大量时间来生成输出。在带有 DigitalOcean 的 4GB VPS 和一些配置中,它运行良好。但是,在 Godaddy 业务托管中,它的运行速度非常缓慢。
我想知道将列分成多个表并使用 JOIN 语句是否更好。它会提高性能吗?或者我需要遵循其他优化逻辑。
正如 Madhur 所建议的,我已将 INDEX 添加到日期、符号和市场。它提高了上面的查询速度,但是下面的查询仍然需要很多时间。
在此先感谢,拉吉布
python - Pandas / SQL 数据类型的困难?
我有一些看起来像这样的数据
数据类型在哪里:
现在,我只是想将这个 pandas 数据框写入 Amazon AWS 上的 SQL 数据。
我的桌子的结构是这样的
现在我想将我的数据框写入 SQL 数据库:
但我得到这个错误。
上面看到的数据类型应该是兼容的,对吧?我错过了什么?谢谢你
mysql - 具有某些特定值的 MySQL 慢查询(股票数据)
我有一些这样的股票数据
具有三个索引,日期和代码的多列索引,日期索引和代码索引。
表很大,有3000+个不同的股票,每只股票都有近十年的分钟数据。
我想获取特定股票的最后日期,所以我运行以下 sql:
但是,此查询对大多数股票(<1 秒)效果很好,但对某些特定股票(>1 小时)的性能很差。例如,只需将查询更改为
它似乎永远冻结了。
我知道的一件事是,股票“000029”在2016年之后没有更多数据,而“好”的股票直到昨天都有数据,但我不确定是否所有的“坏”股票都有这个特征。
input - “ ts.get_intraday ”内的用户输入
我对 python 还很陌生,我保证在我来这里之前我环顾了一段时间,但我正在尝试制作一个股票阅读器,有人可以在其中输入他们想要的任何股票,并显示它的数据。到目前为止一切顺利,但我在用户输入方面遇到了问题,这是我的代码:
我得到的错误是:
time-series - 基于概率的股票价格分类
我正在尝试建立一个分类器来预测股票价格。我使用一些众所周知的技术指标生成了额外的特征,并将这些值以及过去点的值提供给机器学习算法。我有大约 45k 个样本,每个样本代表一小时的 ohlcv 数据。
该问题实际上是一个 3 类分类问题:带有买入、卖出和持有信号。我根据每个时间点的 (%) 变化构建了这 3 个类作为我的目标。也就是说:我只将最大的积极 (%) 变化归类为买入信号,相反的归类为卖出信号,其余的归类为持有信号。
然而,将这个 3 类目标呈现给算法会导致买卖分类器的准确性较差。为了改善这一点,我选择根据每个样本的概率手动分配类。也就是说,我根据价格上涨或下跌将目标设置为1或0。然后,该算法返回一个介于 0 和 1 之间(通常介于 0.45 和 0.55 之间)的概率,用于确定每个样本属于哪个类别的置信度。然后我为这些概率中的每个类选择一些概率界限。例如:我选择 p > 0.53 被归类为买入信号,p < 0.48 被归类为卖出信号,介于两者之间的任何值都被归类为持有信号。
这种方法极大地提高了分类精度,在某些点上达到了 65% 以上。但是,在没有大量验证集的情况下,我无法想出一种方法来选择这些概率界限。我尝试在 3000 个验证集中找到最佳概率值,这提高了分类准确度,但验证集越大,测试集中的预测准确度显然在下降。
所以,我正在寻找的是任何方法,通过它我可以辨别每个训练集的特定决策概率应该是什么,而无需大型验证集。我也欢迎任何其他关于如何改进这个过程的想法。谢谢您的帮助!
python - 从不是 csv 的网页(雅虎财经)下载数据
我想同时下载雅虎财经上多只股票的浮动数据,但我不知道如何编码。
我对 python 有点熟悉,因为 Stackoverflow 我已经能够下载 .csv 历史价格,但现在我也想下载股票的浮动。
谁能帮我解决这个问题?
网址链接是
python - 从 Yahoo! 提取数据 用美汤理财
我目前正在尝试创建一个股票信息脚本。但是,我只能从股票的初始页面检索数据,而不是关键统计页面。这是我试图从中获取数据的页面: https ://au.finance.yahoo.com/quote/TICKER/key-statistics?p=TICKER
这是我正在使用的代码:(主要来自我观看的视频)
股票代码 AAPL 的结果如下:
不太清楚为什么第二页没有被正确刮掉……我对漂亮的汤不是很有经验。任何帮助将非常感激。
python - 如何使用股票数据对 multiIndex 数据框进行切片?
我已经用 yfinance 下载了股票数据,我试图将 DataFrame 分割成每只股票的一个 df,但我真的不知道该怎么做。数据是带有 multiIndex 的 df,但列是用信息和代码的元组设置的(下面的示例),但不是我想要的代码本身用于我的数据分析。即使我调用“df.info”函数,它也只会带来信息列而不是股票行情。如何切片此 df 以使信息由代码分隔?正确知道的代码如下:
acoes的细化结果是:
我的主要目标是开发用于搜索单个或多个股票信息的代码以运行一些分析。我没有任何编码或编程经验,我这样做只是为了让我在金融市场上的生活更轻松,哈哈。提前致谢!