Ansible是一个配置管理工具,可以用脚本批量操作多台机器。它的特点是非常简洁,基于SSH,不需要安装代理。但它的缺点也很明显:效率较低,容易挂起,不那么适合大规模环境(如500台以上)。本文介绍了使用ansible管理大规模集群的几种方法。

Read More

这次聊聊mesos+k8s的集中化日志方案。日志通常是由许多文件组成,被分散地储存到不同的地方,所以需要集中化地进行日志的统计和检索。

这次聊聊mesos+k8s的监控告警方案。所谓监控主要就是收集和储存主机和容器的实时数据,根据运维人员的需求展示出来的过程。

这是发生在某大型企业中的某个部门的事儿。他们有六七十名成员,运用瀑布开发模式,三个月发布一次内部产品。部署的过程长达一周,质量堪忧,交付日难以保证。于是请来一位很有经验的敏捷教练Ken,来帮助这个部门做敏捷转型,解决问题。本文的主要内容是在培训完敏捷的基本思想后,PI Planning(启动会议)上发生的事。本系列目前有两篇:

这次聊聊mesos+k8s的持久化问题。如果我用容器跑一个数据库,比如mysql,我关心的是数据保存在哪里。这样万一这个容器发生意外,起码我的数据还在,还可以东山再起。

这次聊聊k8s的高可用性是怎么做的。所谓高可用性,就是在一些服务或机器挂掉了之后集群仍然能正常工作的能力。

这一系列文章主要是关于kubernetes和mesos集群管理的内容,里面不会说用啥命令,怎么操作,而是了解一些基本概念,理清思路。如果你需要的是实操,请参考《轻松搭建Kubernetes 1.2版运行环境》

本系列目前有九篇: