sqoop把hive数据导入mysql出现中文乱码

使用 sqoop 将 hive 数据导入 mysql 后出现乱码：

进入数据库，输入 show variables like 'character%'; 回车

我这里有两种解决办法，如下

方法1：修改数据库配置文件

（1）在下面这个位置添加几行配置

vim /etc/my.cnf

init_connect='SET collation_connection = utf8_unicode_ci'
init_connect='SET NAMES utf8'
character-set-server=utf8
collation-server=utf8_unicode_ci
skip-character-set-client-handshake

（2）重启 mysql 服务

systemctl restart mysqld.service（我这里centos7）
或
service mysqld restart（centos6）

再次查看编码：

之后再执行命令的时候在mysql数据库名后面加上?useUnicode=true&characterEncoding=utf-8就可以了。示例：sqoop export --connect "jdbc:mysql://数据库ip:3306/数据库名称?useUnicode=true&characterEncoding=utf-8" ...

sqoop-export 
--connect "jdbc:mysql://localhost:3306/lft?useUnicode=true&characterEncoding=utf-8" 
--username root 
--password 123456 
--table test3 
--export-dir /user/hive/warehouse/hadoop.db/test3 
--input-fields-terminated-by '01';

方法2：两行命令快速搞定

用下面两行命令代替修改配置文件的步骤，然后执行命令的时候也加上?useUnicode=true&characterEncoding=utf-8就OK了。

set character_set_database=utf8;
set character_set_server=utf8;