博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
13_sqoop数据迁移概述
阅读量:6118 次
发布时间:2019-06-21

本文共 822 字,大约阅读时间需要 2 分钟。

3. sqoop数据迁移

3.1 概述

  sqoop是apache旗下一款“Hadoop体系和关系数据库服务器之间传送数据”的工具。

  导入数据:MySQL,Oracle导入数据到Hadoop的HDFS、HIVE、HBASE等数据存储系统;

  导出数据:从Hadoop的文件系统中导出数据到关系数据库;

  

3.2 工作机制

  将导入或导出命令翻译成mapreduce程序来实现,在翻译出的mapreduce中主要是对inputformat和

outputformat进行定制

   Sqoop的原理其实就是将导入导出命令转化为mapreduce程序来执行,sqoop在接收到命令后,都要

生成mapreduce程序

3.3 sqoop安装

  1.安装sqoop的前提是已经具备java和hadoop的环境

  2.下载并解压:最新版下载地址:

  3.修改配置文件: 

$ cd $SQOOP_HOME/conf$ mv sqoop-env-template.sh sqoop-env.sh打开sqoop-env.sh并编辑下面几行:export HADOOP_COMMON_HOME=/usr/local/src/hadoop-2.6.4/export HADOOP_MAPRED_HOME=/usr/local/src/hadoop-2.6.4/export HIVE_HOME=/usr/local/src/hive-1.2.1/

 

  4.加入mysql的jdbc驱动包

   cp /usr/local/src/hive-1.2.1/lib/mysql-connector-java-5.1.28.jar /usr/local/src/sqoop/lib/

  5.验证启动:cd $SQOOP_HOME/bin

  

 

 

 

 

 

 

 

 

 

 

 

 

 

 

  

 

转载于:https://www.cnblogs.com/yaboya/p/9323457.html

你可能感兴趣的文章
面试总结
查看>>
Chrome浏览器播放HTML5音频没声音的解决方案
查看>>
easyui datagrid 行编辑功能
查看>>
类,对象与实例变量
查看>>
HDU 2818 (矢量并查集)
查看>>
【转】php字符串加密解密
查看>>
22. linux 常用命令
查看>>
ASP.Net 使用GridView模板删除一行的用法
查看>>
(十六)字段表集合
查看>>
JPGraph
查看>>
实验二 Java面向对象程序设计
查看>>
------__________________________9余数定理-__________ 1163______________
查看>>
webapp返回上一页 处理
查看>>
新安装的WAMP中phpmyadmin的密码问题
查看>>
20172303 2017-2018-2 《程序设计与数据结构》第5周学习总结
查看>>
eclipse中将一个项目作为library导入另一个项目中
查看>>
Go语言学习(五)----- 数组
查看>>
Android源码学习之观察者模式应用
查看>>
Content Provider的权限
查看>>
416. Partition Equal Subset Sum
查看>>