sqoop把hive数据导入mysql出现中文乱码

时间:2022-07-25
本文章向大家介绍sqoop把hive数据导入mysql出现中文乱码,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

使用 sqoop 将 hive 数据导入 mysql 后出现乱码:

进入数据库,输入 show variables like 'character%'; 回车

我这里有两种解决办法,如下

方法1:修改数据库配置文件

(1)在下面这个位置添加几行配置

vim /etc/my.cnf
init_connect='SET collation_connection = utf8_unicode_ci'
init_connect='SET NAMES utf8'
character-set-server=utf8
collation-server=utf8_unicode_ci
skip-character-set-client-handshake

(2)重启 mysql 服务

systemctl restart mysqld.service(我这里centos7)
或
service mysqld restart(centos6)

再次查看编码:

之后再执行命令的时候在mysql数据库名后面加上?useUnicode=true&characterEncoding=utf-8就可以了。 示例:sqoop export --connect "jdbc:mysql://数据库ip:3306/数据库名称?useUnicode=true&characterEncoding=utf-8" ...

sqoop-export 
--connect "jdbc:mysql://localhost:3306/lft?useUnicode=true&characterEncoding=utf-8" 
--username root 
--password 123456 
--table test3 
--export-dir /user/hive/warehouse/hadoop.db/test3 
--input-fields-terminated-by '01';

方法2:两行命令快速搞定

用下面两行命令代替修改配置文件的步骤,然后执行命令的时候也加上?useUnicode=true&characterEncoding=utf-8就OK了。

set character_set_database=utf8;
set character_set_server=utf8;