WordSimilarityAnalogyData 用于验证词向量效果好坏的数据集。
常用的英文数据集:WordSim-353 、MEN、SCWS
WordSim-353: http://alfonseca.org/eng/research/wordsim353.html、 http://www.cs.technion.ac.il/~gabr/resources/data/wordsim353/
常用的中文数据集:wordsim-240、wordsim-297
在该仓库能找到(wordsim-240、wordsim-297)
常用的中文数据集:Chen 2015年构造的评测文件
在本仓库能找到。(Chen 2015年构造的评测文件)