之前在看Keras Example的时候, 发现对于NLP相关的任务使用的NN都非常浅。 没有很严谨的去数, 但是基本上都是一两层网路就结束了。 具体可以参考Keras Example 之中IMDB相关的代码。 当然, 效果也不差。 一直对这一块很奇怪。 偶然从知乎上面的一篇文章获得解答。 参考: 如何评价Word2Vec作者提出的fastText算法?深度学习是否在文本分类等简单任务上没有优势? 简要观点: 项亮: 文本分类基本还是个偏线性的问题。多层的网络相对单层的没有太多优势。但这不是说多层的没用,而是单层的…

2017年11月28日 0条评论 9859点热度 1人点赞 阅读全文

现在网上有一些预先训练好的Word2Vec模型, 比如Glove, Google-News以及我最喜欢的FastText,都有各自使用大数据训练出来的Word2Vec模型。 根据不同的业务, 也可以自己搜集语料库训练Word2Vec. 关于如何使用Keras加上预训练好的W2V模型, 具体可以参考官网教程:Using pre-trained word embeddings in a Keras model   篇幅比较长, 写得“太详细”了。 不过核心就在下面一行代码: (Example Code on …

2017年11月26日 0条评论 21855点热度 22人点赞 阅读全文

前言 从这一篇开始, 将开始记录、介绍Keras + TensorFlow组合进行图像以及文本分类。 在实战之前, 首先就是搭建我们的运行环境。 笔者在这里最推荐的还是使用docker进行部署。 在宿主机里面只需要安装cuDNN、NVIDIA-Driver安装好之后,需要TensorFlow就pull一个TensorFlow的镜像。 想要一个Caffe就去pull一个Caffe的镜像。 python2、python3 随便切换。 如果你还没有使用过docker, Google搜索“docker 入门”第一条就是最好…

2017年11月24日 0条评论 9920点热度 2人点赞 阅读全文

ES 的作用 之前存储了大约11W条数据, 作为Mac相关的知识库 不过现在应该很少用了。 index: mac-master 主要作用是作为TSDB的存在。 存储用户的反馈、点击事件等等。 index: mac-master-tsdb 原文链接:http://www.flyml.net/2017/11/23/record-an-elasticsearch-transporting/ 老版本的安装方法: https://www.digitalocean.com/community/tutorials/how-to-…

2017年11月23日 0条评论 9359点热度 0人点赞 阅读全文

Q4 其实已经过去了11天了。 感觉我的2017年过的并不是太好。想做的事情太多, 实际完成的事情太少。 在去年年初制定的目标,出发点是好的 ,但是计划没有变化快。 也一直没有停下来静下心的好好反思、回顾一下。 制定一个新的小计划、小目标, 希望今年的以一个合格的分数结束2017年吧。 一、家庭 目标: 2017年11月底体检, 没有三高。 做法:早睡早起, 坚持运动, 多关心老婆小孩。 二、自我提升 目标: 在面试的时候, 理论上面不要吃亏。 同时希望增强的技能能对工作或者自己的事情有所帮助。做法: 学习Andr…

2017年10月11日 0条评论 11586点热度 1人点赞 阅读全文

25 岁毕业,拿一万块钱月薪 30 岁,涨到一万五,期间无女盆友,吃 10 块钱盖饭,跟同学合租,挤 2 块钱地铁上下班,存钱 25 万 31 岁,啃老找父母要了 35 万块钱,买了 50 平米老房子一处,贷款 90 万,20 年,月供 6500。 35 岁 0 个月,认识一 4 分木耳,接盘玩腻的木耳结婚。 35 岁 6 个月,生了小孩,小孩眉宇间有高富帅的痕迹 36 岁,工资涨到 2 万,木耳要买驴牌,便宜儿子要喝进口奶粉,压力很大 37 岁,木耳说,人家的儿子都读花家地,读史家胡同,你也要给咱高富帅的儿子搞个…

2017年07月28日 0条评论 12006点热度 1人点赞 阅读全文

35 岁 你因为身体越来越差 加班越来越少 晋升的速度也越来越缓慢 那天下班,媳妇告诉你 孩子要上幼儿园了 双语的一个月 3000 你皱了皱眉头,那边就已经不耐烦了 “四单元的老王家孩子,一个月 6000 ” “你已经这样了,你想让孩子也输?” 你没说话,回屋给媳妇转了 6000 块钱 这笔钱,你原本打算给自己过个生日,买个新电脑 38 岁,孩子上了一年级 老师说一年级最关键,打好基础很重要 你笑着说,是是是,老师您多照顾 新生接待的老师看着你不明事理的脸 给你指了一条明路 “课外辅导班,一个月 2200 ” 40…

2017年07月28日 0条评论 10347点热度 0人点赞 阅读全文

本文原创, 原文地址: http://www.flyml.net/2017/05/08/git-lfs-tutorial/ ‎ Why LFS: Large File Storage, 即大文件存储。 当我们的项目之中存在比较大的文件的时候, 使用LFS对整个Git的维护是非常有帮助的。 具体网上很多描述,在此不罗嗦了。 比如我司的GitHub Enterprice版本就限制文件超过100MB就不能直接commit,强制使用LFS 由于我们这些搞机器学习的, 时不时要离线训练几个预测模型, 这些模型一不小心就爆表了…

2017年05月08日 0条评论 19931点热度 2人点赞 阅读全文

想来最近也很无奈, 这几年百度的一再变化,简单想想已经是对我的一个Tripple Kill了~ 再次记录一下, 说不定哪天再来一发。。。   出师未捷身先死的影音网站 当年同事一句话:“要是在豆瓣上面可以直接看电影就好啦”,让我顿时有了灵感,在工作之余,吭哧吭哧上线了一个Chrome 插件: 豆瓣看电影 主要功能就是当用户在浏览豆瓣页面的时候, 自动在互联网上面查找相关的视频资源。 如果是连续剧,还能直接选择第几集直接看。而且还做了自定义规则功能,用户可以自己写规则,搜索自己喜欢的那些小网站。 PS:因为…

2017年03月25日 2条评论 17887点热度 12人点赞 阅读全文

Item 45: 将局部变量的作用域最小化 书说: 推荐在第一次使用这个局部变量的时候才初始化。如果初始化的条件还不足,说明还没到时候初始化。例外: try-catch Item 46: for-each 优于for循环与while循环 主要是for-each 的代码看起来更加简洁, 效率稍微提高。 Item 49: 基本类型优于装箱类型 我觉得看stackoverflow的这一篇帖子说得更清楚一些: http://stackoverflow.com/questions/5199359/why-do-people-…

2017年03月16日 0条评论 14119点热度 0人点赞 阅读全文
15678915