虽然称之为“坑”,但是主要还是我自己对立面的道道不太了解所致。 背景介绍: 首先有一个python脚本,这个python首先会执行一些linux的命令,比如解压文件、复制文件等等,完成之后会通过java -jar的方式调用某一个jar包做一些操作。 原文来源:http://www.flyml.net/2016/11/30/crontab-java-not-found/ 问题表现: 每次手动执行这个python脚本运行,程序工作的很好,但是如果是通过crontab的方式来运行,就会发现程序只执行了,但是java应该做…

2016年11月30日 0条评论 14515点热度 2人点赞 阅读全文

花钱的年华 http://calvin1978.blogcn.com/   PS: 可能要翻墙,因为这个域名直接访问看起来已经被劫持了~   PS2 : 有人说打开没样式,我加个截图:

2016年11月30日 0条评论 12542点热度 1人点赞 阅读全文

0. TL;DR 本文前半段主要参考:http://www.ce.yildiz.edu.tr/personal/banud/file/1201/latent-semantic-indexing-fast-track-tutorial.pdf 这里只介绍过程,不介绍原理,只做简单分析。 后半段将过一下gensim的simserver是如何调用LSI找到相似文档的。 本文为原创,转载需要注明出处: http://www.flyml.net/2016/11/11/lsi-doc-sim-gensim-source-cod…

2016年11月11日 1条评论 19232点热度 2人点赞 阅读全文

参考原文:https://plusbryan.com/my-first-5-minutes-on-a-server-or-essential-security-for-linux-servers?utm_source=wanqu.co&utm_campaign=Wanqu+Daily&utm_medium=social   当我们在linode或者vultr之类的VPS商购买新的VPS的时候,或者我们在阿里云、腾讯云等购买了VPS之后,如果你对服务器安全比较注重,下面简单的几招可以里面将安…

2016年11月10日 0条评论 8699点热度 1人点赞 阅读全文

1. phrase公式基本介绍 在将语料库喂给word2vec进行训练之前,我们首先需要将其中一些常见的词组组合起来变成一个单词,这样对训练的精度会非常有帮助。 word2vec的作者采用的是下面的公式: wi,wj : 第i跟第j个单词  (实际上我认为j=i+1, 不需要用两个下标) δ 是一个调节参数。 (由于字体问题,公式截图跟文字里面的delta看起来不完全一样)   在gensim之中,这个公式稍有不同: score = ( cnt(a, b) -  min_count ) * N / (cn…

2016年11月09日 0条评论 14908点热度 1人点赞 阅读全文

在阅读Google的免费深度学习课程的练习代码的时候,看到下面一段代码: [crayon-66236ad6d108f928702695/] 注意第17行,第一个变量居然是一个下划线! 在查阅了一些资料之后,有人是这么描述单个下划线的使用场景: 在交互式的时候,保持上一次执行的结果 没看懂。原文如下: To hold the result of the last executed statement in an interactive interpreter session. This precedent was s…

2016年11月09日 0条评论 11077点热度 1人点赞 阅读全文

0. 引言 上周五在公司使用gensim的word2vec实验了一次“文档相似性”计算。匹配出来的结果惨不忍睹,可以用“天马行空”来形容。这就是对word2vec不了解的情况下做调包侠的下场。。。 下面是笔者对word2vec的一些初步了解与效果反思。 本文为原创。 转载需要注明出处:http://www.flyml.net/2016/11/07/word2vec-basic-understanding/ 1. 为什么学习w2v? 简单的说,我们在声音与图像领域,深度学习都取得了令人瞩目的成就,其中一个重要的原因,…

2016年11月07日 0条评论 14278点热度 1人点赞 阅读全文

对Cassandra的架构做了一些了解,没有深入代码级别,有一些细枝末节也没有完全摸清楚。不过在大致流程上,基本上理解。在此做个阶段性的小结。 具体请看PDF   本文为原创文章,转载请注明出处 原文链接:http://www.flyml.net/2016/11/07/cassandra-tutorial-architecture/

2016年11月07日 0条评论 11418点热度 0人点赞 阅读全文

在NoSQL之中,一种很重要的数据库,叫做列式数据库。 下面是百度百科的解释: 列式数据库是以列相关存储架构进行数据存储的数据库,主要适合于批量数据处理和即时查询。相对应的是行式数据库,数据以行相关的存储体系架构进行空间分配,主要适合于小批量的数据处理,常用于联机事务型数据处理。   本文主要想补充说明的是,列式数据库的存储其实也不完全一样的! 一个典型的例子就是HBase 与 Cassandra 但是他们的最小存储单元都是Column(列),并且上层都是列簇,这个是一样的。不一样的地方在于,他们是如何管…

2016年10月30日 2条评论 17234点热度 8人点赞 阅读全文

摘要: 在传统数据库之中,视图是个非常有用的功能,NoSQL一般不具有这种能力。 另外,对于NoSQL来说,如何设计数据模型,通常来说需要一开始就非常明确自己的数据是如何存储的,以此来设计自己的存储方式。 甚至会通过存储多份数据的方式来达到目的。而对于Cassandra来说,Materialized View(物化视图)是非常实用、好用的功能,可以同时比较完美的解决NoSQL的视图缺失与对降低对数据模型扩充能力的设计要求。 原文来源:http://www.flyml.net/2016/10/30/cassandra…

2016年10月30日 0条评论 16258点热度 3人点赞 阅读全文
18910111214