标豆冒皮皮

人亦有言,日月于征。安得促席,说彼平生。

如何远程使用在AWS EC2上RHEL7的图形桌面

安装Redhat桌面包并启动VNC连接

安装Redhat的桌面包,再启动一个VNC远程连接就行了。 具体操作主要分三个阶段:安装GUI组件、启动VNC服务端和建立连接。具体操作如下: 安装GUI组件 [1]. 更新系统(可选) sudo yum update -y [2]. 安装gnome GUI组件 sudo yum groupinstall -y "Desktop" "Desktop Platform" "X Wi...

Cloudera Manager API开发

cm api

如何查看API版本 通过页面http://[cm-server-host]:[cm-server-port]/api/version查看; 通过Cloudera Manager的API帮助页面http://[cm-server-host]:[cm-server-port]/cmf/static/apidocs可查看; 通过在线文档 API帮助 通过https://c...

In Stream Big Data Processing

【原文】 http://dirtysalt.info/in-stream-big-data-processing.html https://highlyscalable.wordpress.com/2013/08/20/in-stream-big-data-processing/ 缺点和面向批处理的数据处理的弊端由大数据被社会广泛认可的相当长一段时间以前。很显然,实时查询处理和流处理在许...

Hello The World

"It begins"

“Yeah It’s on. ” Test. 今天开张了。 还不会弄,不过好兴奋哦,这个东东似乎有趣多了。

Hadoop十年解读与发展预测

Hadoop 10

文章刊登于InfoQ(链接),此为原稿,以备后改。 “昔我十年前,与君始相识。” ——白居易,《酬元九对新栽竹有怀见寄》 一瞬间Hadoop也到了要初中择校的年龄了。 十年前还没有Hadoop,几年前国内IT圈里还不知道什么是Hadoop,而现在几乎所有大型企业的IT系统中有已经有了Hadoop的集群在运行了各式各样的任务。 2006年项目成立的一开始,“Hadoo...

初见Kudu

Hello Kudu

Cloudera刚公布了一个新的工具叫Kudu(http://getkudu.io),基于Apache协议开源,按照官网blog中所说,其主要动机在于: 同时提供高性能的顺序扫描和随机查询,避免使用HBase+HDFS混合架构的复杂性: 开发:必须编写复杂的代码来管理两个系统之间的数据传输及同步 运维:必须管理跨多个不同系统的一致性备份、安全策略以及...

[译]NoSQL数据建模技术

NoSQL Data Modeling Techniques

【原文】 翻译:标豆(微博@biaobean,biaobean_at_gmail_dot_com) (译者序) 为了适应大数据应用场景的要求,Hadoop以及NoSQL等与传统企业平台完全不同的新兴架构迅速地崛起。而下层技术基础的革命必将影响上层建筑:数据模型和算法。简单地将传统基于第四范式结构化关系型数据库的模型拷贝到新的引擎上,无异于削足适履,不仅增加了大数据应用开发的...