博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
开源大数据周刊-第8期
阅读量:7022 次
发布时间:2019-06-28

本文共 844 字,大约阅读时间需要 2 分钟。

摘要:
阿里云李津谈布局专有云的深层用意,2016年杭州第四次spark meetup见闻

阿里云E-Mapreduce动态

1.3.2版本(已经发布):

  • Master HA功能

1.4版本(正在研发):

  • 用户执行计划及集群运行状态自定义报警
  • 集群整体运行情况的仪表盘
  • 集群的一些专家建议,例如:扩容提醒
  • 集群一键重启

资讯

  • 李津对Apsara Stack的优势做如下总结:一方面,具备IaaS、数据库、大数据、安全、中间件等全套优势,适用于客户集群规模在50台-1万台。而OpenStack侧重在500台以下的小规模场景下的IaaS层面,也缺乏一揽子的云产品。
  • 当你用手机订餐、购物、打车,享受着移动互联网带来的各种便利时,您的这些生活数据,正为“人工智能”贡献着力量
  • 近日,首届中国(杭州)工业大数据产业发展高峰论坛在杭州举办。论坛上,工业大数据相关研究者、实践者济济一堂,“晒”出了工业大数据的众多生动案例,让你提前感知未来的工业大数据
  • 数据是智慧的原矿石,工程是采矿机,业务是指北针,只有三个方面融合起来,才能最有效的发现数据的价值
  • 此次会议有spark2.0、mllib、streaming及CarbonData,内容还是很丰富的。
  • TableScan、PrunedScan、PrunedFilteredScan三种方式实现拉取少量服务端的数据。
  • 基于纠删码的技术可以极大节约存储空间,带来的劣势就是会消耗一些CPU及内存。但是由于在云上虚拟机相对比较稳定,也是一个比较的方案。
  • 在现在的大数据时代,越来越多的企业开始使用Hadoop管理数据,但是现有的业务分析工具(如Tableau,Microstrategy等)往往存在很大的局限,如难以水平扩展、无法处理超大规模数据、缺少对Hadoop的支持;而利用Hadoop做数据分析依然存在诸多障碍,例如大多数分析师只习惯使用SQL,Hadoop难以实现快速交互式查询等等。神兽Apache Kylin就是为了解决这些问题而设计的。

转载地址:http://ascxl.baihongyu.com/

你可能感兴趣的文章