今天,也就是2016年9月12日,博客的域名刚刚满月,博客的创建再过2-3天也满月了。 在这短短的一个月之中,已经原创了不少(大约31篇)文章。 有一些是很水的文章,有一些应该说还是有一些干货在里面。总结了自己之前的一些工具、类库等的使用经验与踩坑经历。主要想写一些前沿技术相关的文章,比如机器学习、数据挖掘以及大数据处理。 一开始写的Spark,后来也是根据公司需要以及自己的知识掌握,主要写的是Cassandra相关的文章。 博客主要也是在geek.csdb.net与toutiao.io 上面做宣传。 Spark的…

2016年09月12日 2条评论 19197点热度 8人点赞 阅读全文

0. 引言 在传统的RDBMS 之中, 我们为了提高查询或者SQL效率,都会用到各种Statement. 比如JDBC之中常用的PreparedStatement. Statement的使用在Cassandra会更加广泛。 并且除了PreparedStatement,还有好几种其他的Statement.如下: SimpleStatement BoundStatement / PreparedStatement BuiltStatement BatchStatement 原文链接:http://www.flyml.n…

2016年09月11日 0条评论 14255点热度 5人点赞 阅读全文

原文:《It’s Tough Being Over 40 in Silicon Valley》 (可能需要翻墙) 这是一篇在微博上面看得到的文章,原文太长,可以看看湾区日报BayArea的 概括: 老了后如何在年龄歧视的就业环境下生存:法律武器、穿得年轻、泡论坛恶补新新人类的语言、编程学校学做app、整容。在大公司工作十年后被裁,突然发现自己掌握的技术已落后市场上流行的技术6个世代 与简评: 实际上,不管是哪个地方,如果不终身学习、与时俱进,都会被淘汰掉。永远都能举出年龄大依然混得很好的一线工程师的案例,也能举出年…

2016年09月09日 2条评论 19278点热度 0人点赞 阅读全文

0.引言 在MySQL之中,我们经常使用的一个查询语句就是 where in。 在Cassandra之中也有这个查询语句。但是如果我们在where in 之中的需要查询的条件比较多的时候,我们就需要使用Cassandra 提供的异步 IO API (async io)接口。 在本文之中,我们将回答下面3个问题: 1.什么是异步IO 2. 为什么需要使用异步IO替换where in 3. 异步IO 性能如何 原文链接:http://www.flyml.net/2016/09/09/cassandra-tutorial…

2016年09月09日 2条评论 15746点热度 0人点赞 阅读全文

上一篇文章《Java API 简单例子》之中,我们介绍了使用Java API 对Cassandra的简单操作。 本节将开始稍微深入的介绍一些进阶操作。本节将介绍数据库必须要知道的一个概念:数据库连接池(Connection Pool) 文章来源:http://www.flyml.net/2016/09/09/cassandra-tutorial-java-api-connection-pool/ 数据库连接池的原理: 连接复用。通过建立一个数据库连接池以及一套连接使用、分配、管理策略,使得该连接池中的连接可以得到高…

2016年09月09日 0条评论 16475点热度 4人点赞 阅读全文

本文将简单介绍一些在Cassandra之中如何使用Java对数据进行操作的简单例子。包括了简单的CRUD。更深入一些的内容,将在后面逐个进行讲解。 本文代码源自:https://github.com/datastax/java-driver/blob/3.0/driver-examples/src/main/java/com/datastax/driver/examples/basic/CreateAndPopulateKeyspace.java 后来根据官方的例子做了一些说明,同时对其进行了一些补完。主要内容还请…

2016年09月08日 3条评论 21465点热度 1人点赞 阅读全文

1. Murmur哈希算法是干什么的? 在之前的文章 [Cassandra教程](十四)浅谈Cassandra的架构 以前之前的文章我们提到了数据模型以及Partition Key, 同时Cassandra维护了一个令牌环,这样当我们写入一条数据或者需要读取数据的时候,就知道首先去哪一台机器执行相应的操作。 在底层支撑令牌的算法,就是默默无闻但是几乎一统江湖的MurmurHash算法。 所谓Murmur,并不是我们常听到的陌陌,而是(multiply and rotate) and (multiply and ro…

2016年09月05日 4条评论 41185点热度 3人点赞 阅读全文

NoSQL DB的表与数据模型设计跟传统的RDBMS很不一样。最大的一个不同就是反范式。比如提倡数据冗余,使得不至于写出非常复杂的SQL语句。 就Cassandra而言,最关键的地方在于Key的设计。Cassandra之中一共包含下面5种Key: Primary Key Partition Key Composite Key Compound Key Clustering Key   OMG~~  是不是太多了? 让我们一个个的来解释 首先,Primary key 是用来获取某一行的数据, 可以是一列或者…

2016年09月05日 7条评论 43083点热度 12人点赞 阅读全文

原创声明: 本文为原创文章 为了更好的阅读体验,请回源站查看文章。有任何修改、订正只会在源站体现 最后更新时间:2016年09月03日

2016年09月04日 4条评论 35754点热度 3人点赞 阅读全文

原创声明: 本文为原创文章,转载需要注明来自http://www.flyml.net 为了更好的阅读体验,请回源站查看文章。有任何修改、订正只会在源站体现 最后更新时间:2016年09月03日

2016年09月03日 1条评论 18376点热度 2人点赞 阅读全文