0

嗨 Stackoverflowianers,

以下堆栈溢出属于我的大脑,而不是我的程序:

我正在开发一个大型项目,现在必须在其数据库中推送数百万个数据请求。为此,我必须启动一个脚本,该脚本从 .csv 文件中逐行取出搜索文本并启动该过程......这个搜索词被发送到 6 个官方 api 并在 0.2 秒和最大限度。10 秒。随着一一返回,脚本将响应写入数据库。

我希望你明白我的意思。所以我的问题是:

在我每分钟都使用 cron 工作的那一刻......是否可以在 api 请求之间没有任何延迟的情况下做到这一点,并且仍然有可靠和持续的结果?

还是会像在准备好之前停止一个过程,因为下一个要发生等等......?

预先感谢您对此的看法。

最好的问候, AceLine

PS:我没有经验来理解在这种线程速度下会发生什么......

4

1 回答 1

0

I'm not sure I understood you, but if I did, it seems what you are missing is indexing your data.
You index the data when you get it inputed to the system. After that, searches are much faster.
The best way I know to index that is to use SOLR (Lucene).

于 2013-07-07T12:18:36.000 回答