0

我使用 Watson Studio 完成了一些基本的课程作业;是否可以将二进制形式 (.bin) 的 Google Word Vectors 加载到 Watson Studio 中?

4

1 回答 1

0

您当然可以在 watson studio Notebook 中读取二进制格式的文件和技术上的任何类型的文件。

首先,您需要将 GoogleNews-vectors-negative300.bin.gz 的二进制 zip 文件上传到 watson studio 数据资产,您可以拖放到文件部分。完成后,您可以使用project-lib将该文件读入二进制对象。

  1. 插入项目令牌,请参阅下面的文档以了解如何插入。

  2. 获取文件

    my_file = project.get_file("GoogleNews-vectors-negative300.bin.gz")

  3. 因为是gzip,所以需要使用gzip

    import gzip

    gzip_f = gzip.GzipFile(fileobj=my_file)

  4. 安装gensim!pip install gensim

  5. 导入 genism 并加载模型

进口gensim

    # Load Google's pre-trained Word2Vec model.
    model = gensim.models.KeyedVectors.load_word2vec_format(gzip_f,binary=True)  

参考:- https://dataplatform.cloud.ibm.com/docs/content/wsj/analyze-data/project-lib-python.html?audience=wdp

完整笔记本:- https://dataplatform.cloud.ibm.com/analytics/notebooks/v2/3ea58eda-cd56-4f7a-8b73-707d4b84edb2/view?access_token=cdfedfc282a7fc98691a1e7c5c183eeac607a7d1e09656dff448c6989e52eb5a

于 2019-03-05T06:38:15.930 回答