调整使用CoreOS的数字海洋云滴会破坏CoreOs群集

我是新来的CoreOs,我一直在DigitalOcean上进行实验。 首先让我说,我不确定这是DigitalOcean问题还是CoreOS问题。

如何复制:

  • 将2个CoreOS分离出来,并通过Cloud-Config将它们连接在一起形成一个集群。
  • 在数字海洋仪表板中,closures两个水滴并resize。
  • 打开两个液滴。
  • ssh进入其中一个水滴
  • 运行fleetctl列表机器

你应该得到的

 2015/04/22 21:05:50信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝
 2015/04/22 21:05:50错误client.go:213:无法获得{Get /coreos.com/fleet/machines}的结果,在100ms内重试
 2015/04/22 21:05:50信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝
 2015/04/22 21:05:50错误client.go:213:无法获得{Get /coreos.com/fleet/machines}的结果,在200ms内重试
 2015/04/22 21:05:50信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝
 2015/04/22 21:05:50错误client.go:213:无法获得{Get /coreos.com/fleet/machines}的结果,重试400ms
 2015/04/22 21:05:51信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝
 2015/04/22 21:05:51错误client.go:213:无法获得{Get /coreos.com/fleet/machines}的结果,在800ms内重试
 2015/04/22 21:05:51信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝
 2015/04/22 21:05:51错误client.go:213:无法获得{Get /_coreos.com/fleet/machines}的结果,在1秒内重试

执行journalctl -u etcd
将会呈现

 Apr 22 14:38:02 test etcd [578]:[etcd] Apr 22 14:38:02.471 INFO |  f507c71154cc47b1804558c7298d0313:状态从“领导”变为“追随者”。
 Apr 22 14:38:02 test etcd [578]:[etcd] Apr 22 14:38:02.471 INFO |  f507c71154cc47b1804558c7298d0313:第7项开始。
 Apr 22 14:38:02 test etcd [578]:[etcd] Apr 22 14:38:02.471 INFO |  f507c71154cc47b1804558c7298d0313:领导从'f507c71154cc47b1804558c7298d0313'更改为''。
 Apr 22 14:38:11 test etcd [578]:[etcd] Apr 22 14:38:11.257 INFO |  f507c71154cc47b1804558c7298d0313:状态从“关注者”改为“候选者”。
 Apr 22 14:38:11 test etcd [578]:[etcd] Apr 22 14:38:11.258 INFO |  f507c71154cc47b1804558c7298d0313:领导从“fa61f58c81fd4e7abe9ac0b6585fafef”更改为“”。
 Apr 22 14:38:11 test etcd [578]:[etcd] Apr 22 14:38:11.546 INFO |  f507c71154cc47b1804558c7298d0313:状态从“候选人”变为“追随者”。
 Apr 22 14:38:11 test etcd [578]:[etcd] Apr 22 14:38:11.547 INFO |  f507c71154cc47b1804558c7298d0313:第9期开始。
 Apr 22 14:41:14 test etcd [578]:[etcd] Apr 22 14:41:14.847 INFO |  f507c71154cc47b1804558c7298d0313:索引10004处的10004个事件的快照已完成
 Apr 22 14:53:45 test etcd [578]:[etcd] Apr 22 14:53:45.297 INFO |  f507c71154cc47b1804558c7298d0313:警告:选举超时的心跳:359.350151ms
 Apr 22 14:55:22 test etcd [578]:[etcd] Apr 22 14:55:22.381 INFO |  f507c71154cc47b1804558c7298d0313:警告:选举超时时心跳:1.574255587s
 Apr 22 15:31:17 test etcd [578]:[etcd] Apr 22 15:31:17.551 INFO |  f507c71154cc47b1804558c7298d0313:索引20005处的10001个事件的快照已完成
 Apr 22 16:19:53 test etcd [578]:[etcd] Apr 22 16:19:53.870 INFO |  f507c71154cc47b1804558c7298d0313:索引为30012的10007个事件的快照已完成
 Apr 22 17:08:00 test etcd [578]:[etcd] Apr 22 17:08:00.254 INFO |  f507c71154cc47b1804558c7298d0313:索引为40019的10007个事件的快照已完成
 Apr 22 17:57:30 test etcd [578]:[etcd] Apr 22 17:57:30.622 INFO |  f507c71154cc47b1804558c7298d0313:索引50027处的10008个事件的快照已完成
 Apr 22 18:48:04 test etcd [578]:[etcd] Apr 22 18:48:04.084 INFO |  f507c71154cc47b1804558c7298d0313:索引60035处的10008个事件的快照已完成
 Apr 22 19:38:37 test etcd [578]:[etcd] Apr 22 19:38:37.641信息|  f507c71154cc47b1804558c7298d0313:索引70042处的10007个事件的快照已完成
 Apr 22 20:07:41 test etcd [578]:[etcd] Apr 22 20:07:39.493 INFO |  f507c71154cc47b1804558c7298d0313:状态从“关注者”改为“候选者”。
 Apr 22 20:07:44 test etcd [578]:[etcd] Apr 22 20:07:44.282 INFO |  f507c71154cc47b1804558c7298d0313:领导从“fa61f58c81fd4e7abe9ac0b6585fafef”更改为“”。
 Apr 22 20:07:44 test etcd [578]:[etcd] Apr 22 20:07:44.895 INFO |  f507c71154cc47b1804558c7298d0313:状态从“候选人”变为“追随者”。
 Apr 22 20:07:44 test etcd [578]:[etcd] Apr 22 20:07:44.899 INFO |  f507c71154cc47b1804558c7298d0313:第13期开始。
 Apr 22 20:09:39 test etcd [578]:[etcd] Apr 22 20:09:39.269 INFO |  f507c71154cc47b1804558c7298d0313:状态从“关注者”改为“候选者”。
 Apr 22 20:09:39 test etcd [578]:[etcd] Apr 22 20:09:39.302 INFO |  f507c71154cc47b1804558c7298d0313:领导从“fa61f58c81fd4e7abe9ac0b6585fafef”更改为“”。
 Apr 22 20:09:39 test etcd [578]:[etcd] Apr 22 20:09:39.631 INFO |  f507c71154cc47b1804558c7298d0313:状态从“候选人”变为“追随者”。
 Apr 22 20:09:39 test etcd [578]:[etcd] Apr 22 20:09:39.632 INFO |  f507c71154cc47b1804558c7298d0313:第15期开始。
 4月22日20:11:18testingsystemd [1]:停止etcd ...
 4月22日20:11:18testingsystemd [1]:etcd.service:主进程退出,代码=退出,状态= 2 / INVALIDARGUMENT
 4月22日20:11:18testingsystemd [1]:停止etcd。
 4月22日20:11:18testingsystemd [1]:单元etcd.service进入失败状态。
 4月22日20:11:18testingsystemd [1]:etcd.service失败。

以下将显示systemctl cat etcd.service


 /usr/lib64/systemd/system/etcd.service
 [单元]
描述= ETCD

 [服务]
用户= ETCD
 PermissionsStartOnly =真
环境= ETCDDATADIR =的/ var / lib中/ ETCD
环境= ETCD_NAME =%米
 ExecStart =的/ usr /斌/ ETCD
重启=始终
 RestartSec = 10S
 LimitNOFILE = 40000

这是一个CoreOS的问题? 几乎整个CoreOS集群都坏了。 机器不再联系起来,我似乎无法find一种方法将它们联系起来,或者如何防止这种情况发生。 我在网上找不到任何东西。

好的,经过数小时和数小时的debugging,我得出的结论是,当您closures液滴时,Digital Ocean不尊重cloud-config,调整液滴尺寸并打开液滴。 我设法通过在每个服务器实例内创build另一个cloud-config并执行以下命令来将实例链接到一个集群中。
sudo coreos-cloudinit –from-file cloud-config.yml