希望这个问题不是脱离主题。 我在AskUbuntu上问这个问题,但没有得到回应:
我遵循Michael Noll的优秀指南,将Hadoop设置在单个群集上: http : //www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/
我现在想要设置第二个节点来做一些处理。 在本指南以及所有其他人看来,这些其他集群都在同一个局域网中。 但是,我正在使用我的大学给出的虚拟机来执行我的项目,我通过连接到它的IP地址使用PuTTY访问。 我可以通过Hadoop将本机连接到完全不同的IP地址上的其他机器吗? 这甚至有可能吗? 我试着编辑两台电脑的/ etc / hosts,并存储这样的IP地址:
117.118.45.205:127.0.0.1 localhost
首先使用真实的IP地址,然后是“本地”IP地址,但是没有工作。 有没有人有任何build议,或者这是不可能的?
其一,你对/etc/hosts编辑是错误的。 在第二行添加公共IP,不要使用冒号来分隔IP。 该语法将不被理解。
二,(我相信)如果第二台计算机可以ping第一台,反之亦然,它可以设置为Hadoop集群中的一个节点。 如果不是,那么不是。 可能会遇到与路由边界相关的问题(如果这样做的话),但是我没有足够的经验来确定这一点。