我是新来的CoreOs,我一直在DigitalOcean上进行实验。 首先让我说,我不确定这是DigitalOcean问题还是CoreOS问题。
如何复制:
你应该得到的
2015/04/22 21:05:50信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝 2015/04/22 21:05:50错误client.go:213:无法获得{Get /coreos.com/fleet/machines}的结果,在100ms内重试 2015/04/22 21:05:50信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝 2015/04/22 21:05:50错误client.go:213:无法获得{Get /coreos.com/fleet/machines}的结果,在200ms内重试 2015/04/22 21:05:50信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝 2015/04/22 21:05:50错误client.go:213:无法获得{Get /coreos.com/fleet/machines}的结果,重试400ms 2015/04/22 21:05:51信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝 2015/04/22 21:05:51错误client.go:213:无法获得{Get /coreos.com/fleet/machines}的结果,在800ms内重试 2015/04/22 21:05:51信息client.go:291:从http://127.0.0.1:4001/获取响应失败:dial tcp 127.0.0.1:4001:连接被拒绝 2015/04/22 21:05:51错误client.go:213:无法获得{Get /_coreos.com/fleet/machines}的结果,在1秒内重试
执行journalctl -u etcd
将会呈现
Apr 22 14:38:02 test etcd [578]:[etcd] Apr 22 14:38:02.471 INFO | f507c71154cc47b1804558c7298d0313:状态从“领导”变为“追随者”。 Apr 22 14:38:02 test etcd [578]:[etcd] Apr 22 14:38:02.471 INFO | f507c71154cc47b1804558c7298d0313:第7项开始。 Apr 22 14:38:02 test etcd [578]:[etcd] Apr 22 14:38:02.471 INFO | f507c71154cc47b1804558c7298d0313:领导从'f507c71154cc47b1804558c7298d0313'更改为''。 Apr 22 14:38:11 test etcd [578]:[etcd] Apr 22 14:38:11.257 INFO | f507c71154cc47b1804558c7298d0313:状态从“关注者”改为“候选者”。 Apr 22 14:38:11 test etcd [578]:[etcd] Apr 22 14:38:11.258 INFO | f507c71154cc47b1804558c7298d0313:领导从“fa61f58c81fd4e7abe9ac0b6585fafef”更改为“”。 Apr 22 14:38:11 test etcd [578]:[etcd] Apr 22 14:38:11.546 INFO | f507c71154cc47b1804558c7298d0313:状态从“候选人”变为“追随者”。 Apr 22 14:38:11 test etcd [578]:[etcd] Apr 22 14:38:11.547 INFO | f507c71154cc47b1804558c7298d0313:第9期开始。 Apr 22 14:41:14 test etcd [578]:[etcd] Apr 22 14:41:14.847 INFO | f507c71154cc47b1804558c7298d0313:索引10004处的10004个事件的快照已完成 Apr 22 14:53:45 test etcd [578]:[etcd] Apr 22 14:53:45.297 INFO | f507c71154cc47b1804558c7298d0313:警告:选举超时的心跳:359.350151ms Apr 22 14:55:22 test etcd [578]:[etcd] Apr 22 14:55:22.381 INFO | f507c71154cc47b1804558c7298d0313:警告:选举超时时心跳:1.574255587s Apr 22 15:31:17 test etcd [578]:[etcd] Apr 22 15:31:17.551 INFO | f507c71154cc47b1804558c7298d0313:索引20005处的10001个事件的快照已完成 Apr 22 16:19:53 test etcd [578]:[etcd] Apr 22 16:19:53.870 INFO | f507c71154cc47b1804558c7298d0313:索引为30012的10007个事件的快照已完成 Apr 22 17:08:00 test etcd [578]:[etcd] Apr 22 17:08:00.254 INFO | f507c71154cc47b1804558c7298d0313:索引为40019的10007个事件的快照已完成 Apr 22 17:57:30 test etcd [578]:[etcd] Apr 22 17:57:30.622 INFO | f507c71154cc47b1804558c7298d0313:索引50027处的10008个事件的快照已完成 Apr 22 18:48:04 test etcd [578]:[etcd] Apr 22 18:48:04.084 INFO | f507c71154cc47b1804558c7298d0313:索引60035处的10008个事件的快照已完成 Apr 22 19:38:37 test etcd [578]:[etcd] Apr 22 19:38:37.641信息| f507c71154cc47b1804558c7298d0313:索引70042处的10007个事件的快照已完成 Apr 22 20:07:41 test etcd [578]:[etcd] Apr 22 20:07:39.493 INFO | f507c71154cc47b1804558c7298d0313:状态从“关注者”改为“候选者”。 Apr 22 20:07:44 test etcd [578]:[etcd] Apr 22 20:07:44.282 INFO | f507c71154cc47b1804558c7298d0313:领导从“fa61f58c81fd4e7abe9ac0b6585fafef”更改为“”。 Apr 22 20:07:44 test etcd [578]:[etcd] Apr 22 20:07:44.895 INFO | f507c71154cc47b1804558c7298d0313:状态从“候选人”变为“追随者”。 Apr 22 20:07:44 test etcd [578]:[etcd] Apr 22 20:07:44.899 INFO | f507c71154cc47b1804558c7298d0313:第13期开始。 Apr 22 20:09:39 test etcd [578]:[etcd] Apr 22 20:09:39.269 INFO | f507c71154cc47b1804558c7298d0313:状态从“关注者”改为“候选者”。 Apr 22 20:09:39 test etcd [578]:[etcd] Apr 22 20:09:39.302 INFO | f507c71154cc47b1804558c7298d0313:领导从“fa61f58c81fd4e7abe9ac0b6585fafef”更改为“”。 Apr 22 20:09:39 test etcd [578]:[etcd] Apr 22 20:09:39.631 INFO | f507c71154cc47b1804558c7298d0313:状态从“候选人”变为“追随者”。 Apr 22 20:09:39 test etcd [578]:[etcd] Apr 22 20:09:39.632 INFO | f507c71154cc47b1804558c7298d0313:第15期开始。 4月22日20:11:18testingsystemd [1]:停止etcd ... 4月22日20:11:18testingsystemd [1]:etcd.service:主进程退出,代码=退出,状态= 2 / INVALIDARGUMENT 4月22日20:11:18testingsystemd [1]:停止etcd。 4月22日20:11:18testingsystemd [1]:单元etcd.service进入失败状态。 4月22日20:11:18testingsystemd [1]:etcd.service失败。
以下将显示systemctl cat etcd.service
/usr/lib64/systemd/system/etcd.service [单元] 描述= ETCD [服务] 用户= ETCD PermissionsStartOnly =真 环境= ETCDDATADIR =的/ var / lib中/ ETCD 环境= ETCD_NAME =%米 ExecStart =的/ usr /斌/ ETCD 重启=始终 RestartSec = 10S LimitNOFILE = 40000
这是一个CoreOS的问题? 几乎整个CoreOS集群都坏了。 机器不再联系起来,我似乎无法find一种方法将它们联系起来,或者如何防止这种情况发生。 我在网上找不到任何东西。
好的,经过数小时和数小时的debugging,我得出的结论是,当您closures液滴时,Digital Ocean不尊重cloud-config,调整液滴尺寸并打开液滴。 我设法通过在每个服务器实例内创build另一个cloud-config并执行以下命令来将实例链接到一个集群中。
sudo coreos-cloudinit –from-file cloud-config.yml