FastText - FlyML

之前在看Keras Example的时候，发现对于NLP相关的任务使用的NN都非常浅。没有很严谨的去数，但是基本上都是一两层网路就结束了。具体可以参考Keras Example 之中IMDB相关的代码。当然，效果也不差。一直对这一块很奇怪。偶然从知乎上面的一篇文章获得解答。参考：如何评价Word2Vec作者提出的fastText算法？深度学习是否在文本分类等简单任务上没有优势？简要观点：项亮：文本分类基本还是个偏线性的问题。多层的网络相对单层的没有太多优势。但这不是说多层的没用，而是单层的…

[DeepNLP] 为什么Keras之中NLP使用的都是浅层神经网络？