-
-
2
-
32JAVA,大数据,运维、产品、linux、python、C++、安卓逆向,网络安全、算法、云原生、k8s等等 都是2021年,还有2021年底开课的就业班网课,百度名字即是微信号。
-
3
-
1大数据在现实生活中的具体应用 数据处理的最典型应用:公司的产品运营情况分析 电商推荐系统:基于海量的浏览行为、购物行为数据,进行大量的算法模型的运算,得出各类推荐结论,以供电商网站页面来为用户进行商品推荐 精准广告推送系统:基于海量的互联网用户的各类数据,统计分析,进行用户画像(得到用户的各种属性标签),然后可以为广告主进行有针对性的精准的广告投放 1、什么是hadoop hadoop中有3个核心组件: 分布式文件系统:HDFS
-
0好久没有做基础编程题了,现在做起来真的是有一点畅快的感觉,想当初被各种问题虐的死去活来的,现在真的有种满级大号回新手村追杀NPC的感觉。不能乱立flag,要是翻车了就毁了(T▽T),开始我们今天的基础练习~ 第六题 打印出所有的 "水仙花数 ",所谓 "水仙花数 "是指一个三位数,其各位数字立方和等于该数本身。例如:153是一个 "水仙花数 ",因为 153=1*1*1+5*5*5+3*3*3。为了显示我的专业水准,还查了一下“水仙花数”
-
0===ITSTAR高端IT技术云计算大数据专场 === 主题:大数据生态组件开发百度开放云大数据智能存储系统【大数据云计算核心技术】 授课时间: 今晚20:10 在线直播 想要学习资料,学习工具,上课素材就加1101236046 特邀授课老师: 大数据首席架构师 亲自授课 【学完本节课你将掌握以下几个关键点】: 1. BAT大数据开发流程深度解析与应用; 2. WEB系统界面整合优化; 3. 大数据生态组件的实战应用; 4. 云智能存储机制,实战过程; 5. 一线大数据项目开发的标
-
0===ITSTAR高端IT技术云计算大数据专场 === 主题:大数据生态组件开发百度开放云大数据智能存储系统【大数据云计算核心技术 特邀授课老师: 大数据首席架构师 亲自授课 【学完本节课你将掌握以下几个关键点】: 1. BAT大数据开发流程深度解析与应用; 2. WEB系统界面整合优化; 3. 大数据生态组件的实战应用; 4. 云智能存储机制,实战过程; 5. 一线大数据项目开发的标准和要求
-
2
-
01. mr编程案例一1.1.mr编程案例2——求TOPN 1、读取附件中的文件request.dat, 需求1:求出每一个url被访问的总次数,并将结果输出到一个结果文件中 思路:就是一个wordcount map阶段: 解析数据,将url作为key,1作为value发出 reduce阶段:将一组数据的value累加 需求2:求出每个网站被访问次数最多的top3个url《分组TOPN》 思路: map阶段——切字段,抽取域名作为key,url作为value,返回即可 reduce阶段——用迭代器,将一个域名的一组url迭代出来,挨个放入一个hashm
-
0=== ITSTAR高端IT大数据大型技术专场=== 主题:大数据实时数据检索+搜索引擎快照静态化智能存储系统【首次公开】 【学完本节课你将掌握以下几个关键点】: 1. 海量数据检索与存储; 2. 使用Python语言、Java语言开发海量数据抓取(蜘蛛爬虫); 3. 大数据生态组件实时存储; 4. 大企业内部实战与应用; 欢迎加入大数据交流群:645891271,每晚更新教程哟
-
0【学完本节课你将掌握以下几个关键点】: 1. 数据迁移概念? 2. 传统数据库(mysql/oracle)数据导入分布式存储核心解决方案 3. 分布式存储数据导出传统数据库(mysql/oracle)核心解决方案 4. sqoop的搭建与企业级应用 5. 企业级实战 6.【阿里云ACA大数据助理工程师发布】
-
01.yarn快速理解 欢迎加入大数据交流群:645891271,每晚更新教程哟 1.1. yarn的基本概念 yarn是一个分布式程序的运行调度平台 yarn中有两大核心角色: 1、Resource Manager 接受用户提交的分布式计算程序,并为其划分资源 管理、监控各个Node Manager上的资源情况,以便于均衡负载 2、Node Manager 管理它所在机器的运算资源(cpu + 内存) 负责接受Resource Manager分配的任务,创建容器、回收资源 1.2. YARN的安装 node manager在物理上应该跟data node部署在一起 resource manager在
-
01.1.wordcount程序整体运行流程示意图 map阶段: 将每一行文本数据变成<单词,1>这样的kv数据 欢迎加入大数据交流群:645891271,每晚更新教程哟, reduce阶段:将相同单词的一组kv数据进行聚合:累加所有的v 注意点:mapreduce程序中, map阶段的进、出数据, reduce阶段的进、出数据, 类型都应该是实现了HADOOP序列化框架的类型,如: String对应Text Integer对应IntWritable Long对应LongWritable 1.2.编码实现 WordcountMapper类开发 WordcountReducer类开发 JobSubmitter客户端类开
-
0hdfs的客户端操作客户端的理解 交流群:645891271,每晚更新教程哟 hdfs的客户端有多种形式: 1、网页形式 2、命令行形式 3、客户端在哪里运行,没有约束,只要运行客户端的机器能够跟hdfs集群联网 文件的切块大小和存储的副本数量,都是由客户端决定! 所谓的由客户端决定,是通过配置参数来定的 hdfs的客户端会读以下两个参数,来决定切块大小、副本数量: 切块大小的参数: dfs.blocksize 副本数量的参数: dfs.replication 上面两个参数应该配置在客户
-
0DT时代数据为王:Google Bigtable企业级海量数据存储技术 授课时间: 今晚8:10 在线直播 特邀授课老师:阿里巴巴云栖大会嘉宾 潭州教育大数据学院CTO 亲自授课 【学完本节课你将掌握以下几个关键点】: 1. Hbase集群服务器的使用 2. Hbase列式存储分布式系统 3. Google数据处理核心技术 4. Hbase命令操作 5. Hbase企业级API操作
-
0基本概念 《数据处理》 在互联网技术发展到现今阶段,大量日常、工作等事务产生的数据都已经信息化,人类产生的数据量相比以前有了爆炸式的增长,以前的传统的数据处理技术已经无法胜任,需求催生技术,一套用来处理海量数据的软件工具应运而生,这就是大数据! 欢迎加入大数据交流群:645891271 处理海量数据的核心技术: 海量数据存储:分布式 海量数据运算:分布式 这些核心技术的实现是不需要用户从零开始造轮子的 存储和运算,都已
-
0亲爱的各位吧友:欢迎来到大数据交流