安装说明

安装环境

虚拟机:VirtualBox-6.1.18
操作系统:Ubuntu16.04LTS
集群情况:

主机名称 hadoop版本 IP地址
hadoop-master 2.7.3 192.168.56.1
hadoop-slave1 2.7.3 192.168.56.2
hadoop-slave2 2.7.3 192.168.56.3

本次安装的Mahout

Mahout版本:2.3.6
下载地址:apache-mahout-distribution-14.1.tar.gz
其他:Mahout官网查看不同版本.

都准备就绪后,我们就接着往下开始安装吧!
不知道怎么准备的,我之前的文章 也许可以给你带来一些参考哦 - - - ☞ 传送门
大型数据库(2)— HBase安装与配置.


开始安装

  1. 我的两个基础软件Hadoop、Java 分别是在/usr/hadoop 和 /usr/java下
  2. 其他的都安装在 ~/Hadoop 的文件夹下
  3. Mahout仅需安装在hadoop-master下哦

安装并配置Mahout

解压

1
2
3
4
5
6
7
$ cd ~/下载
$ cp apache-mahout-distribution-14.1.tar.gz ~/Hadoop
$ cd ~/Hadoop
$ mkdir mahout-14.1
$ tar -zxvf hbase-2.3.6-bin.tar.gz -C ./mahout-14.1
$ cd mahout-14.1/bin


配置

mahout

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

// 根据它的说明,我们在开头的注释下面添加以下内容:

// 你的java所在路径
MAHOUT_JAVA_HOME=/usr/java
// 你的hadoop配置文件所在路径
HADOOP_CONF_DIR=/usr/hadoop/etc/hadoop
// 你的mahout配置文件所在路径
MAHOUT_CONF_DIR=/home/xld/Hadoop/mahout-14.1/conf

# MAHOUT_LOCAL set to anything other than an empty string to force
# mahout to run locally even if
# HADOOP_CONF_DIR and HADOOP_HOME are set
// 设置为空,不为空则为本地模式
MAHOUT_LOCAL=""

准备example

14.1的版本好像没有自带的example,所以将待会所需的例子拖到mahout的根目录下就好了
本地下载:
mahout-examples-0.9.jar.
mahout-examples-0.9-job.jar.

网上还有其他例子,可以通过mvn构建
但在 $MAHOUT_HOME/example 下缺少 pom.xml 文件
官方的 pom.xml :apache-mahout-distribution-14.1.pom
需要的自己CV就好了

环境变量

1
2
3
4
5
6
7
8
9
10
11
12
// 这里直接是 .bash_profile,当然你也可以加到 /etc/profile 下也行
$ sudo gedit .bash_profile

// 然后在里面加入下面两句

export MAHOUT_HOME=/home/xld/Hadoop/mahout-14.1
export PATH=$MAHOUT_HOME/bin:$PATH
export CLASSPATH=$MAHOUT_HOME/lib

// 保存并退出,然后使其生效
$ source .bash_profile


启动mahout

1
2
3
$ cd ~/Hadoop/mahout-14.1/bin
$ ./mahout

成功启动,能看见下面一堆相关信息
在这里插入图片描述



其他

如果想要运行其他 jar包 的话,可以使用$ hadoop jar xxx 来运行哦