【阿里云】2.1.大数据计算服务-基础知识

基础知识

maxcomputer简介

由阿里云自主研发,提供针对PB/TB级数据,实时性要求不高的分布式处理能力,应用于数据分析、挖掘、商业智能等领域。java

特色

  • 分布式:分布式集群架构,跨集群技术突破,理货扩展
  • 安全:自动存储容错机制,全部计算过沙箱中进行
  • 易用:全面支持SQL,标准API接口,高并发高吞吐量的数据上传下载
  • 管理受权:支持多用户系统管理,多种用户受权

优点

  • 大规模计算存储
  • 多种计算模型
  • 强数据安全
  • 低成本

主要功能

  • 数据通道
  • 计算分析
  • 开发SDK
  • 安全服务

应用场景

  • 数据仓库/商业智能
  • 分布式大数据应用
  • 大数据数据分析
  • 机器学习/人工智能

maxcomputer架构

架构图

在这里插入图片描述

客户端

在这里插入图片描述

接入层

在这里插入图片描述

逻辑层

在这里插入图片描述

  • 请求处理器
    处理全部RESTful请求
    本地处理一些做业
    提交分布式做业给处理器web

  • 调度器
    负责instance调度
    查询计算集群的资源状况安全

  • 做业执行器
    向taskpool请求task
    生成任务描述文件提交给计算层
    监控并返回状态给调度器架构

在这里插入图片描述

计算层

在这里插入图片描述

maxcompute基本概念

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

maxcomputer使用

常见操做

在这里插入图片描述

客户端安装

在这里插入图片描述
环境配置:
在这里插入图片描述
运行:
在这里插入图片描述
简单操做:
在这里插入图片描述
java+eclipse:
在这里插入图片描述
IEDA:
在这里插入图片描述并发

总结

在这里插入图片描述在这里插入图片描述