√采用社区开源软件 场景覆盖程度高,能延续现有技术栈和组织架构,迁移风险和成本低 √成熟稳定 组件采用社区最新的稳定版本,通过组件稳定性和兼容性验证测试,更加稳定可靠 √与阿里云生态集成 可以灵活根据业务需求和技术路线,实现和阿里云生态集成,如数据开发DataWorks+EMR、机器学习PAI+EMR、湖仓一体MaxCompute+Data Lake Formation+EMR √多种迁移方案 根据数据规模和预算的不同,可以通过闪电立方、专线和公网方式按计划高效率的迁移上云
√计算存储分离 数据存储在OSS对象存储,通过EMR JindoFS或Alluxio实现数据湖的加速,实现计算和存储解耦的同时,提升和保障计算效率,避免了资源闲置问题 √数据分层存储 Jindo Table结合OSS的分层存储能力,将大数据业务和底层基础能力相结合,根据数据冷、热、温分层,与不同OSS存储类型匹配,最大限度实现成本节省 √元数据多引擎统一管控 通过EMR+Data Lake Formation,实现对元数据的统一管理,DLF可以对EMR不同计算引擎统一进行权限控制
优势
案例