我正在使用https://github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/examples/tutorials/word2vec/word2vec_basic.py中的 word2vec_basic ,我有一些(一般)问题。
我应该如何确定num_steps
?在示例中,它设置为 100001。
askip_window
是 5 还是应该更大(10、25)?
此外,是否应该从训练数据集中删除停用词和标点符号,是否应该将所有单词转换为小写?
谢谢。