60TB 数据量的作业从 Hive 迁移到 Spark 在 Facebook 的实践

  • 时间:
  • 浏览:0
  • 来源:uu快3大小_uu快3网站_开奖历史

MaxCompute 2.0 基于BigBench标准的最新测试进展

Hadoop学习资源集合

自建Hive数据仓库跨版本迁移到阿里云E-MapReduce

大数据框架Hadoop主要模块介绍

Hive数据如保同步到MaxCompute之实践讲解

CIO指南:如保使用SAP HANA平台外理大数据

机会您发现本社区含有涉嫌抄袭的内容,欢迎发送邮件至:yqgroup@service.aliyun.com 进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容。

大数据框架Hadoop主要模块介绍

尽管 Facebook 提供的服务含有了分析领域的广泛领域,但大家仍在不断地与开源社区互动,以分享大家的经验,并向他学好习

SparkSQL在有赞的实践

【干货】大数据平台建设实践与探讨

泰为基于EMR的考量与实践

MaxCompute2.0 对开源系统的支持与融合

下拉加载更多

数据倾斜是多么痛?spark作业调优秘籍

Spark性能优化指南——高级篇(转载)

阿里主管通知我试用期延期…… | 12月24号云栖号夜读

如保选取满足需求的SQL on Hadoop/Spark系统

Facebook 经常使用分析来进行数据驱动的决策。在过去的几年里,用户和产品都得到了增长,使得大家分析引擎中单个查询的数据量达到了数十TB。大家的以后 批外理分析总要 基于 Hive 平台(Apache Hive 是 Facebook 在1009年贡献给社区的)和 Corona( Facebook 内内外部的 MapReduce 实现)进行的。Facebook 还针对包括 Hive 在内的多个内内外部数据存储,继续增加了其 Presto 的 ANSI-SQL 查询的覆盖范围。Facebook 内内外部还支持以后 类型的分析,如图计算、机器学习(Apache Giraph)和流外理(如 Puma、Swift 和 Stylus)。

《Spark大数据分析:核心概念、技术及实践》一 第1章 大数据技术一览

Airbnb 数据基础设施与其头上的哲学

单表千亿电信大数据场景,使用Spark+CarbonData替换Impala案例