close
登录/ 注册
2019全新大数据实战VIP班
- 20周挑战大数据高薪岗位,抢占大数据千亿市场的未来 -
全程直播,全栈班型!
立即报名
马上试听
培养企业型大数据人才
您了解大数据工程师吗?
广阔的就业前景,成为抢手的高薪人才
了解更多
你将有机会入职知名企业
马上申请优惠
来菜鸟窝学大数据,胜任更多高薪职位
一线企业技术大咖师资,合力打造大数据精英
毫无保留用心亲授,所学即所用
Jesson
北大博士
11年以上研发经验
了解更多
曾就职于华为、 百度、平安等知名互联网公司。近几年埋首大数据领域相关技术,对神经网络、机器学习有深入了解。热爱新技术,乐于学习与分享。
了解更多
Brave
高级软件架构师
12年以上研发经验
了解更多
曾任金蝶(中国)软件公司技术顾问,卫华集团高级需求分析师,曾主导开发多个大数据项目,精通Kafka、Spark等大数据相关技术。
了解更多
Dennis
大数据架构师
13年软件研发经验
了解更多
先后从事通信协议栈(C语言)、J2EE、Android等开发,曾在Nokia主导大型网关集群研发、近几年主要从事大数据及相关系统架构设计、擅长Hadoop大数据生态,尤其擅长图数据库及相关处理技术。
了解更多
Dico
芒果TV大数据服务架构师
9年软件研发经验
了解更多
就职芒果TV,近几年从事大数据相关处理工作,主导了某在线视频媒体平台数据仓库建设、画像平台建设和推荐平台建设。具有丰富的PB级海量数据仓库架构、核心团队带队、海量数据处理经验,擅长Hadoop,Spark,Hive,Sqoop,Storm等等大数据技术。
了解更多
Sam
算法工程师
就职于BAT
了解更多
曾就职德企做无人驾驶相关工作,在推荐系统和内容理解方面有丰富经验,熟练掌握MapReduce, Spark ,Hive等大数据处理框架,Pytorch,Tensorflow等深度学习框架,熟悉各类机器学习算法。
了解更多
Kolin
大数据架构师
11年软件研发经验
了解更多
曾任职联想集团架构师,获联想创投总裁奖,现为某著名通讯公司的大数据平台支撑部技术负责人,产品达85PB 数据量。能将实战积累的经验精粹生动传递给学员,以独特的风格和教学精神影响着学员们。
了解更多
菜鸟窝大数据课程的8大优势
精品课程安排
Our Class Content
5个商业项目
Our Project
1 企业电商用户Session日志检测系统
项目来源: 一线电商线上系统
项目方向: 电商大数据
项目介绍
在电商项目中,为了收集更多的数据需要通过客户端、PC网页进行相关埋点统计,为了支撑运营团队进一步的进行产品运营策略,需要对公司产品销售数据、网站uv/pv进行数据分析。本项目从电商企业实战出发,进行总结和提升。包含3块子项目,销售数据分析统计,Storm架构代码实战、Cloudera Manager实战
第1天
Cloudera Manager环境部署、Storm部署、项目概述
第2天
Hadoop、HBase、Zookeeper环境搭建
第3天
Kafka实战、API编写,Storm和Kafka集成测试
4~5天
HBase实战和ECharts使用
第6天
电商销售数据展示、HBase数据存储,job restart等
7~8天
Stome介绍、项目总结
技术要点:
Cloudera Manager实战
Storm实战讲解
多服务器管理
HBase项目使用
前端技术学习 ECharts等
Zookeeper使用
2 城市交通车辆分析系统
项目来源: 公安大数据项目
方向: 交通大数据
项目介绍
基于大数据的城市交通车辆分析项目,采用Spark+Hive+HDFS+Mysql大数据架构,对城市卡口数据进行分析,主要分析模型包括:套牌车分析、同行车辆分析、首次入城车辆分析等。本项目中涉及到的大数据应用业务场景:离线数据分析、实时数据分析(流处理)、大数据可视化展示
第1天
业务场景介绍,车辆分析项(Spark+Hive+HDFS+Mysql)搭建,数据流向
第2天
套牌车分析模型的业务规则介绍,套牌车分析---编程实战
第3天
同行车辆分析模型的业务规则介绍,同行车辆分析—编程
第4天
首次入城车辆分析的业务规则介绍及编程实战,实现实时监控功能
第5天
项目分析结果的可视化展示
第6天
项目总结及项目优化
技术要点:
大数据相关技术及组件
SparkSQL
Spark Streaming
Hive
HDFS
Zookeeper使用
3 推荐系统
项目来源:互联网行业
项目方向:电商大数据
项目介绍
推荐系统是利用[1]电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程.个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品
项目收获
收获1
工业界推荐系统的常用架构
收获2
基于spark mllib的小型推荐系统搭建
工业界推荐系统前沿的技巧,结合机器学习和深度学习
4 电商推广系统之用户画像
项目来源:互联网行业
项目方向:电商大数据
项目介绍
某电商平台为实现精准营销及广告推送,需要对所有用户基于近半年的购物数据、商品浏览记录进行画像。通过对用户购物数据进行分析,购物金额大于指定金额的用户,标记为金牌用户,购物进行小于指定金额的用户,推送优惠券,对于有浏览记录,但是未购买的用户,推送折扣广告
项目收获
收获1
用户画像业务知识
收获2
大数据离线分析场景下,项目开发过程
收获3
项目实战中,各个大数据组件的用法,各个大数据组件之间是如何相互配合的
5
企业级数据仓库中心实战
项目介绍
本节课程旨在围绕核心数据架构展开讨论,并讲解核心的数据架构问题,展现出中大型企业中最核心的数据用途和视角,同时以最通用的技术展现出一些核心的数据架构实战场景
项目目录
目录1
数据仓库基本概念和分层
目录2
数据采集ODS、源数据层DW和模型层DM设计
ODS/DW/DM协作层次说明、基础架构设计概述与设计规范
目录3
数据采集和协同数据处理(离线数据)
实战项目:离线数据采集、传输与存储
目录4
Hadoop、Hive、Spark业务场景分析
实战项目: 技术选型、项目构架说明,离线数据清洗业务实战
目录5
实战项目: 用户与产品相关的数据指标计算
项目选择了一些可以覆盖多数一线大公司的指标计算模型,深入讲解
目录6
数据仓库路总结和回顾设计思想
5个应用实战
Application
14个重点模块
Function
01. Linux 操作系统
02. Hadoop生态圈(离线计算)
03. Hive(数据仓库)
04. Sqoop(数据迁移工具)
05. HBase(分布式数据库)
06. Flume(分布式日志收集系统)
07. Scala课程
08. Kafka(流处理平台)
09. Spark Core
10. Spark SQL
11. Spark Streaming(流处理平台)
12. Spark ML(机器学习算法)
13. Storm (分布式实时数据计算系统)
14. Java性能优化和分布式中间件探析
01. Linux 操作系统
在企业中无一例外的是使用 Linux 来搭建或部署项目,在平常我们也经常在Linux环境下进行开发。进入大数据领域就要打好 Linux 基础,以便更好地学习Hadoop,Kafka,Spark,Storm,Redis 等众多课程。
  • 1.Linux来源与发展状况
  • 2.Linux常见发行版
  • 3.Linux安装
  • 4.Linux版本信息
  • 5.Linux基础操作命令
  • 6.Linux目录结构介绍
  • 7.Linux系统用户账号管理
  • 8.Linux系统用户组管理
  • 9.Linux系统用户相关文件讲解
  • 10.Linux sudo权限说明
  • 11.Linux常用文件命令
  • 12.Linux常用目录命令
  • 13.Linux文件信息查看
  • 14.Linux文件与目录统计技巧
  • 15.Linux文件属性
  • 16.Linux文件类型
  • 17.Linux文件与目录查找技巧
  • 18.Linux文本文件操作
  • 19.Linux文件权限,压缩与解压缩
  • 20.Linux系统运行与进程运行信息
  • 21.Linux查看磁盘空间
  • 22.Linux环境变量
  • 23.Linux Shell编程
  • 24.Linux进程的查看与终结
  • 25.Linux输入输出与重定向
  • 26.Linux远程登录与重定向
02. Hadoop生态圈(离线计算)
Hadoop是一种分析和处理大数据的软件平台,是Appach的一个用Java语言所实现的开源软件的加框,在大量计算机组成的集群当中实现了对于海量的数据进行的分布式计算。在本章节中不仅将用到前面的 Linux 知识,而且会对 hadoop 的架构有深入的理解,并未你以后架构大数据项目打下坚实基础
Hadoop
  • 1.hadoop 介绍,发展简史,诞生来由
  • 2.hadoop 生态圈体系结构,组件说明
  • 3.hadoop 伪分布式环境搭建及完全分布式环境说明
  • 4.Hadoop安全认证方面的讲解
  • 5.Hadoop集群如何扩容
HDFS
  • 1.HDFS分布式文件系统说明
  • 2.HDFS block概念
  • 3.HDFS namenode ,datanode 详解
  • 4.HDFS HA 详解
  • 5.HDFS命令行接口,读取数据
  • 6.HDFS命令行接口,写⼊数据
  • 7.HDFS命令行接口,删除数据
  • 8.HDFS命令行接口,distcp跨集群分布式拷⻉数据
  • 9.HDFS压缩和分片
  • 10.HDFS文件格式:textfile,sequencefile,rcfile,orcfile,parquet
  • 11.HDFS各类文件格式比较
YARN
  • 1.经典的Mapreduce 1结构弊端
  • 2.Mapreduce 2 中YARN的引入
  • 3.YARN的核心结构说明
  • 4.YARN的⼯作机制
  • 5.YARN的架构剖析
  • 6.YARN 内置调度器:公平调度和容量调度
  • 7.YARN上任务的执行环境
  • 8.YARN上任务的推测执行机制
  • 9.YARN上任务的JVM重用
Mapreduce
  • 1.MapReduce整体流程说明
  • 2.MapReduce目录输入,多目录输入,inputformat子类介绍
  • 3.Mapreduce map 过程
  • 4.Mapreduce combine过程
  • 5.Mapreduce reduce 过程
  • 6.Mapreduce结果输出,outputformat子类介绍
  • 7.MapReduce世界的helloword之wordcount操作演练
  • 8.MapReduce Wordcount 项⽬打包,运⾏
  • 9.MapReduce 内置计数器含义讲解
  • 10.Mapreduce 实例讲解之全排序
  • 11.Mapreduce 实例讲解之部分排序
  • 12.Mapreduce 实例讲解之 join map端连接
  • 13.Mapreduce 实例讲解之 join reduce端连接
  • 14.Mapreduce 实例讲解之矩阵相乘
  • 15.Mapreduce自定义的format
  • 16.Mapreduce MRUnit单元测试使用
Hadoop Streaming
  • 1.hadoop streaming引入的目的
  • 2.Hadoop streaming机制讲解
  • 3.使用Python编写 hadoop streaming
  • 4.使用Shell 编写 hadoop streaming
03. Hive(数据仓库)
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析 。Hive是工作中最常用到的部分,也是面试的重点。
  • 1.Hive 简介
  • 2.Hive Hbase Pig三者的不同点
  • 3.Hive 系统架构
  • 4.Hive 安装搭建与常用参数配置
  • 5.Hive shell命令使用
  • 6.Hive 数据库数据表操作
  • 7.Hive 数据导出
  • 8.Hive 数据加载
  • 9.Hive 外部表与分区表讲解
  • 10.HiveQL 常⽤语句
  • 11.HiveServer2讲解
  • 12.Hive 函数介绍
  • 13.Hive 分析函数与窗口函数
  • 14.Hive ⾃定义UDF / UDAF函数
  • 15.Hive 优化和安全
04. Sqoop(数据迁移工具)
sqoop 主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql...)间进行数据的传递,可以将一个关系型数据库中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。
  • 1.Sqoop框架介绍
  • 2.Sqoop框架原理分析
  • 3.Sqoop框架安装步骤演示
  • 4.Sqoop1和Sqoop2分析对比
  • 5.Sqoop深入了解数据库导入原理
  • 6.Sqoop导出数据原理分析
  • 7.Sqoop 设置存储格式与使⽤压缩
  • 8.Sqoop导入数据到hdfs分析实战
  • 9.Sqoop 增量导⼊功能代码实现
  • 10.Sqoop RDBMS与Hive的操作演示
05. HBase(分布式数据库)
HBase是一个开源的非关系型分布式数据库(NoSQL),它参考了谷歌的BigTable建模,实现的编程语言为 Java。HBase在列上实现了BigTable论文提到的压缩算法、内存操作和布隆过滤器。HBase的表能够作为MapReduce任务的输入和输出,可以通过Java API来访问数据。也可以通过REST、Avro或者Thrift的API来访问。
虽然最近性能有了显著的提升,HBase 还不能直接取代SQL数据库。如今,它已经应用于多个数据驱动型网站,包括 Facebook的消息平台
  • 1.HBase 综合概述
  • 2.HBase 数据库特点
  • 3.HBase 搭建
  • 4.HBase Shell 操作讲解
  • 5.HBase Java API 讲解
  • 6.HBase 协处理器使用
  • 7.HBase 与Mapreduce集成使用讲解
  • 8.HBase backup master讲解
  • 9.HBase 数据模型讲解
  • 10.HBase 数据库数据存储与读取思想讲解
  • 11.HBase 数据在线备份思路讲解
  • 12.HBase 数据迁移与导入方案讲解
  • 13.Region 寻址⽅式
  • 14.HBase 二级索引构建方案
  • 15.HBase RowKey设计原则
  • 16.HBase 性能调优
06. Flume(分布式日志收集系统)
Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于收集数据;同时,Flume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。
  • 1.Flume框架原理和应用场景分析
  • 2.Flume框架使用场景分析
  • 3.Flume概述以及原理解析
  • 4.Flume中Event的概念和Socket的关联
  • 5.Flume运行机制分析
  • 6.NetCat Source源码分析
  • 7.Flume agent原理说明和shell配置
07. Scala课程
Scala是一门多范式的编程语言,一种类似java的编程语言 ,设计初衷是实现可伸缩的语言 、并集成面向对象编程和函数式编程的各种特性。
  • 1.scala 环境配置
  • 2.scala 体系结构
  • 3.scala 解释器、变量、常用数据类型等
  • 4.scala 的条件表达式、输入输出、循环等控制结构
  • 5.scala 的函数、默认参数、变长参数等
  • 6.scala 的数组、变长数组、多维数组等
  • 7.scala 的映射、元组等操作
  • 8.scala 的类,包括 bean 属性、辅助构造器、主构造器等
  • 9.scala 的对象、单例对象、伴生对象、扩展类、apply 方法等
  • 10.scala 的包、引入、继承等概念
  • 11.scala 的特质
  • 12.scala 的操作符
  • 13.scala异常处理
08. Kafka(流处理平台)
Kafka 是在大数据流处理场景中经常使用的分布式消息系统,配合 Spark 内存计算框架, 是流处理场景中的黄金组合。本课程以实战的方式学习 Kafka 分布式消息系统,包括 Kafka 的安装配置、Producer API 的使用、Consumer API 的使用以及与第三方框架(Flume、 Spark Streaming)的集成开发。每个知识点的学习,都有编程实战和操作实战,用眼见为 实的方式学习抽象的理论概念。
  • 1.Kafka 入门
  • 2.Kafka 集群搭建理论与实践
  • 3.Kafka Topic 实战
  • 4.Kafka 开发 Producer 理论与实践
  • 5.Kafka 开发 consumer 理论与实践
  • 6.Kafka 发送和接收结构化数据
  • 7.Kafka 发送和接收非结构化数据
  • 8.Kafka 整合 Flume 框架
  • 9.spark 读取 kafka 数据
09. Spark Core
Spark 内存计算框架,是当前最流行的大数据计算框架,Spark 已经成为大数据开发人员以 及数据科学家的必备工具。
本课程主要学习 Spark Core 的内容。包括 Spark 集群安装、Spark 开发环境搭建,Spark Core 编程模型、Spark 程序运行原理、Spark 性能调优等。
  • 1.Spark 的起源及其哲学思想
  • 2.Spark 集群的安装、启动、测试
  • 3.Spark 基本架构及 API 介绍
  • 4.Spark 开发环境搭建并开发运行 wordCount 程序(Scala、 Java)
  • 5.wordCount 程序的集群部署及 Spark UI 简介
  • 6.Spark 计算框架的核心抽象--RDD(理论及入门)
  • 7.Spark RDD创建实战(Scala、 Java)
  • 8.Spark RDD 操作--transformation 算子实战(Scala、 Java)
  • 9.Spark RDD 操作--action 算子实战(Scala、 Java)
  • 10.Spark RDD计算结果保存实战(Scala、 Java)
  • 11.Spark RDD 缓存及持久化实战(Scala、 Java)
  • 12.Spark 分布式共享变量实战--累加器和广播变量(Scala、 Java)
  • 13.Spark 程序集群部署方式实战
  • 14.Spark 程序运行流程分析
  • 15.Spark 程序的监控和调试
  • 16.Spark 内核解读
  • 17.Spark 性能调优(shuffle)
  • 18.Spark Core 数据分析实战
  • 19. Spark内存管理模型
  • 20. Spark性能调优(shuffle)
  • 21. Spark源码阅读入门
10. Spark SQL
本课程将深入浅出学习 Spark 的结构化 API(DataFrame、Dataset 和 SQL)。SparkSQL 是在大数据项目中,Spark 开发工程师经常使用的 Spark 模块,除了深入讲解 SparkSQL 本身的每个知识点、SparkSQL 性能调优,还会涉及到 HDFS、Hive、HBase、MongoDB、 Oracle、MySQL 等第三方数据存储框架。每个知识点都以代码实战的方式讲解,知其然,更知其所以然。
  • 1.Spark SQL 背景介绍
  • 2.SparkSQL、 DataFrame、 Dataset 之间的关系
  • 3.SparkSQL 概述
  • 4.SparkSQL 数据类型
  • 5.SparkSQL join 操作实战
  • 6.SparkSQL 读写数据实战
  • 7.SparkSQL 操作 Hive 中的数据
  • 8.SparkSQL 调优
  • 9.SparkSQL 数据分析案例实战
  • 10. Spark SQL join操作实战及调优
  • 11. SparkSQL UDAF开发实战
  • 12. SparkSQL窗口函数实战
  • 13. SparkSQL数据分析案例1(购物网站数据分析)
  • 14. SparkSQL数据分析案例2(交通车辆—套牌车分析)
11. Spark Streaming(流处理平台)
Spark streaming是Spark核心API的一个扩展,它对实时流式数据的处理具有可扩展性、高吞吐量、可容错性等特点。我们可以从kafka、flume、Twitter、 ZeroMQ、Kinesis等源获取数据,也可以通过由高阶函数map、reduce、join、window等组成的复杂算法计算出数据。最后,处理后的数据可以推送到文件系统、数据库、实时仪表盘中。事实上,你可以将处理后的数据应用到Spark的机器学习算法、 图处理算法中去。
  • 1.Spark Streaming 框架机制
  • 2.Spark Streaming 时间和窗口的概念
  • 3.Spark Streaming DStream和RDD的关系
  • 4.Spark Streaming 性能调优
  • 5. Spark Streaming整合Kafka的两种方式
  • 6. SparkStreaming整合kafka:如何实现exactly once消费语义
  • 7. Spark Streaming数据分析案例:黑名单过滤
12. Spark ML(机器学习算法)
理论基础:Spark MLlib 概述、数据结构、应用场景Spark实现回归算法、分类算法、算法原理概述等。
  • 1.推荐系统介绍和系统原理
  • 2.推荐系统中的个性化推荐 - 召回算法
  • 3.推荐系统中的个性化推荐 - 排序算法
  • 4.基于Spark mllib回归算法、分类算法 ,协同过滤算法
  • 5.大规模机器学习平台(Angle)
13. Storm (分布式实时数据计算系统)
Storm是一个开源的分布式实时计算系统,可以简单、可靠的处理大量的数据流。而且支持水平扩展,具有高容错性,保证每个消息都会得到处理。Storm处理速度很快(在一个小集群中,每个结点每秒可以处理数以百万计的消息)
Storm的部署和运维都很便捷,更为重要的是可以使用任意编程语言来开发应用
  • 1.Storm 简介
  • 2.Storm 原理和概念
  • 3.Storm 与 Hadoop 的对比
  • 4.Storm 环境搭建
  • 5.Storm API 入门
  • 6.Storm Spout
  • 7.Storm Grouping策略及并发度
  • 8.Storm 优化引入zoolkeeper锁控制线程
  • 9.Storm 去重模式
  • 10.Storm shell脚本开发
  • 11.Storm 批处理事务
  • 12.Storm 普通事务分区事务
  • 13.Storm 按天计算
  • 14.Storm 不透明分区事务
  • 15.Storm 事务
  • 16.Storm Trident
14. Java性能优化和分布式中间件探析
  • 1.再谈JVM 内存模型
  • 2.JVM算法和垃圾回收机制
  • 3.JVM生产环境监控命令和指标
  • 4.JVM面试常考点分析
  • 5.Java多线程实战
  • 6.Java锁机制分析和优化
  • 7.Kafka 和 ZooKeeper 的分布式消息队列原理
  • 8.5.ZK在kafka的作用,分布式环境中Leader机制和算法研读
赠送课程
Additional Class
缓存数据库系统
项目介绍
Redis是的一款内存高速缓存数据库。Redis全称为:Remote Dictionary Server(远程数据服务),该软件使用C语言编写,支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API
课程内容
1.Redis 简介
2.Redis 特性
3.Redis 应用场景
4.Redis 字符串类型 / 散列类型 / 列表类型 / 集合类型
5.Redis 的事务
6.Redis 的访问
7.Redis 的管道(pipeline)
8.Redis 的持久化(AOF+RDB)
9.Redis 的主从复制
10.Redis 的调优
11.Redis 的sentinel
分布式文件存储的数据库系统
项目介绍
MongoDB 介于关系与非关系数据库之间,是非关系数据库中功能最丰富,类似关系数据库的产品。支持数据结构松散,类似json的bson格式。可存储较复杂的数据类型。其最大特点是支持的查询语言非常强大,语法与面向对象的查询语言相似,几乎可以实现类似关系数据库单表查询的绝大部分功能,且支持对数据建立索引
课程内容
1.mongoDB 简介
2.mongoDB 与Mysql 对比
3.mongoDB 的相关名词
4.mongoDB Shell 
5.mongoDB 自定义Shell脚本6.mongoDB 安全机制
7.mongoDB 设计应用
8.mongoDB 与MapReduce 集成
9.mongoDB 高级操作
实实在在的学员评价,真真实实的课程效果
叫我小白
对于大数据零基础的我,这套体系课程真的超合适,内容很详细完整,实战项目实用性很强,老师也都是有非常丰富的大数据项目实战经验的,关键是老师很负责很nice,有什么问题都是很耐心的解答,面试方面老师也给了不少非常实用的建议,五星推荐。。
bravo123
老师很贴心,因为平常工作比较忙要加班,只能比较晚的时候学,有时候比较晚学到不懂问老师老师也很耐心的解答,给老师点个赞赞赞赞赞赞!
Cicon
督促统一学习进度和阶段测验设置简直不要太好了,当初报名也是冲着这个来的,对于零基础的没有实战经验的人个人觉得实在太有必要了,不然纯理论学完都不检测都不知道神马跟神马。
lovejava
课程很注重让大家都学习思考知识实际应用的业务场景,这点很棒,毕竟学完都是要去用的,不然面试的就傻了。老师讲课逻辑很清晰,群里的学员也很活跃。
大雪纷飞
课程非常棒,讲的很仔细的,只要认真听的,绝对收获满,讲的实战项目超级接地气,去面试讲这些项目的时候都感觉特别有底气。
badboy
课程听的很爽,完全没有新手听的一脸懵逼的感觉,老师很nice,对找工作面试给了很多很好的建议。
丰富的就业指导,创造无限就业
96%的回访学员非常认可课程和讲师。用过硬的课程质量打造用户好口碑
常见问题
1
java大数据工程师和python数据分析师有什么区别呢?
大数据工程师(Java)需要精通大数据的多个组件原理,熟练运用其进行业务开发,技能要求:Java、Scala,Hadoop,Hive,Spark,Zookeep等。数据分析师(python)需要有一定的脚本语言基础,对数据敏感面,对常规唯独指标的概念和计算逻辑非常熟悉,对日志系统和统计系统有一定了解更好。技能要求:统计学常识,Hive sql,python。
2
课程有效期多久呢?教学视频可以下载离线看吗?
课程永久有效哦!为了保护课程版及保证课程质量,教学视频暂时不提供下载,可以随时在线学习,相关课件和资料可以下载。
3
学完这个体系课程,能做大数据实战项目吗?
可以的,本次体系课程的授课老师都有丰富的真实企业大数据项目实战经验,课程内容以理论结合实战,紧扣实际业务场景,以培训学员的实际项目应用能力为核心。我们还会有阶段测验以及最后的项目作业检测,以保证学员的学习效果。
4
之前没有接触过大数据,完全没有大数据基础的人可以报名学习吗?
完全可以的哦,这个体系课程就是专门为零基础学员设计的,为零基础学员从入门到进阶规划学习路线
我有些疑问
咨询客服小姐姐