8000 GitHub - CodenameCYS/word2vec_exp: 这里用来测试一下word2vec实验
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

CodenameCYS/word2vec_exp

Repository files navigation

word2vec_exp

这里用来测试一下word2vec实验

1. 数据文件

这里的数据我们使用网上下载的四大名著的文本作为我们的训练数据。

数据位于data/corpus目录下。

2. 数据处理脚本

数据处理脚本为:

输出结果除了gensim实验对应的数据文件为.txt文件外,其余实验对应的数据文件均为对应目录下的.pkl文件,为pickle数据包。

3. gensim测试实验

gensim实验脚本如下:

4. tensorflow测试实验

tensorflow的实验脚本如下:

  1. cbow实验:cbow_tf_exp.py
  2. skip gram实验:skip_gram_tf_exp.py
  3. 直接生成实验:trival_tf_exp.py

5. pytorch测试实验

pytorch的实验脚本如下:

  1. cbow实验:cbow_torch_exp.py
  2. skip gram实验:
    1. 使用内置cross entropy函数:skip_gram_torch_exp_v2.py
    2. 使用自定义cross entropy函数:skip_gram_torch_exp.py

6. 结果评测 & 测试

评测结果可以参考两个notebook文件:

  1. word2vec测试:模型效果评测.ipynb
  2. cross entropy测试:CrossEntropy测试.ipynb

更为详细的结论整理可以参考我的博客内容:

  1. NLP笔记:word2vec简单考察
  2. NLP笔记:浅谈交叉熵(cross entropy)

About

这里用来测试一下word2vec实验

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published
0