Spark的RDD一直不是非常好理解,但是不理解RDD就没法深入理解Spark 下面是官网的官方解释: Spark revolves around the concept of a resilient distributed dataset (RDD), which is a fault-tolerant collection of elements that can be operated on in parallel. There are two ways to create RDDs: parallelizi…

2016年08月15日 0条评论 6771点热度 1人点赞 阅读全文

引言: 已奔三,创建自己的品牌、提升个人影响力的变得更重要了。 但是一直没有很好的思路。创建这个博客也算是方法之一。下面转载的这一篇文章,个人觉得还是有一些参考价值的。 原文地址:http://www.jianshu.com/p/abef6f00db90 推荐到原文阅读,体验更佳!

2016年08月14日 0条评论 6123点热度 0人点赞 阅读全文

最近在做ChatBot,看了一些很惊艳的论文,比如: A Neural Conversational Model (v3) 根据论文描述,Chatbot甚至能给人debug为什么不能上网之类的技术问题。 OMG! 摘录一些对话: Machine: hi Human: hi Machine: could you please let me know what is the operating system you are using? Human: linux Machine: ok this is the issu…

2016年08月14日 0条评论 11866点热度 0人点赞 阅读全文

开坑啦! 主要是技术方向的内容。 比如Spark / 机器学习 / Cassandra DB / 搜索技术 想挖一些坑在这里,以后慢慢来填  :D Spark Summit 2016 Cassandra Summit 2016 (还没有开始, 先做Spark Summit) ElasticSearch 相关的一些搜索技术 机器学习(博客名字就是FlyML )   其他的可能暂时不涉及先吧,精力也有限   加油

2016年08月13日 0条评论 5581点热度 0人点赞 阅读全文

Spark 在大数据的发展应该是最活跃的一个开源框架了。 博主整理了一些Spark Summit 2016的资源,希望对大家有用: 主页: https://spark-summit.org/2016/ 主办方还提供了可在线观看但需要穿墙的录像视频。 具体可以到这里查看全部的资源 博主会将学习这些视频的笔记放出,以供大家学习、参考

2016年08月13日 0条评论 5136点热度 0人点赞 阅读全文