我正在使用Jupyter notebooks
创建一个ML Model with TuriCreate
.
我正在遵循的步骤是上面的。
我从https://www.kaggle.com/zynicide/wine-reviews下载了一个 .csv 和 .json (相同的文件)
该文件的大小为 51 MB。
我已经创建了一个环境turienv
FromAnaconda Navigation
并且以下步骤非常适合较小的 CSV / JSON 文件。
源激活 turienv
pip install turicreate=5.0
木星笔记本
----笔记本内部----
import turicreate as tc
wine_data = tc.SFrame.read_json('winemag-data-130k-v2.json', orient='records')
wine_data.head() <-- I see that everything is loaded properly
wine_model = tc.text_classifier.create(wine_data,'title',features=['description'])
PROGRESS: Creating a validation set from 5 percent of training data. This may take a while.
You can set ``validation_set=None`` to disable validation tracking.
Logistic regression:
--------------------------------------------------------
Number of examples : 123481
Number of classes : 113404
Number of feature columns : 1
Number of unpacked features : 21030
Number of coefficients : 2384978493
Starting L-BFGS
--------------------------------------------------------
+-----------+----------+-----------+--------------+-------------------+---------------------+
| Iteration | Passes | Step size | Elapsed Time | Training Accuracy | Validation Accuracy |
+-----------+----------+-----------+--------------+-------------------+---------------------+
然后在大约 3-4 分钟后,我收到错误消息 = 内核似乎已经死了。
有人可以帮忙吗??我是 Python 新手,而 Jupyter 只是我使用过的环境。如果有其他环境,我可以通过一些指导运行相同的事情以获得更可靠的错误消息,我可以调试,请告诉我。
编辑:我在 2018 MacBook Pro 16GB 512GB 上运行上述内容。我在 Activity Monitor 上看到 python 的内存达到 130GB 和 CPU 83%
提前致谢