LeapHD联想大数据平台
LeapHD帮助企业快速建立统一数据湖或数据中台,支持企业内外部数据的融合、实现海量数据的集中存储、大规模计算的并行处理、计算资源的统一管理以及高效的数据分析挖掘。在大数据的平台之上,用户可以构建相应的分析挖掘应用。
产品优势
主要功能
数据计算存储
联想大数据平台基于Hadoop开源生态系统,引入了多种核心功能和组件,对复杂开源技术进行高度集成和性能优化。在分布式存储系统的基础上,建立了统一资源调度管理系统,高效地支持大规模批处理、交互式查询计算、流式计算等多种计算引擎。
数据集成
数据集成( Data Hub)是大数据平台的数据传输工具,利用DataHub可以将不同渠道,不同平台,不同格式的数据汇总到Hive.Hbase或者Hdfs中,Datahub包含的功能有图形化ETL构建、迁移任务管理、迁移运行实例等模块。
系统管理
系统管理( System Admin )采用多租户的思路,将数据能力按需、可控的进行开放,提供多租户下的库表资源管理,权限分配,基于项目,提供存储、计算资源的分配、使用监控与计费等服务。
数据开发及任务调度
数据开发及任务调度( TaskScheduler )是一套高效的图形化大数据工作流配置与执行管理平台,支持可视化的大数据计算任务构建能力。通过封装底层技术复杂性,提供对SQL脚本、MR、 Spark、Scala、Shell脚本、MySQL、Oracle、数据导入导出等多种计算模块的可视化操作,使得开发人员更专注于计算本身而不在关注底层技术细节。
SQL查询分析器
SQL查询分析器( SQL Editor )是基于大数据平台构建的在线查询系统,借助SQL Editor系统,用户无需掌握复杂的大数据开发技术,只要熟悉SQL语法,就可以快速对海量数据进行类似关系型数据库的查询操作,并以可视化的方式获得直观的查询结果。
数据目录
数据目录( Data Catalog )是大数据平台的数据管理工具,对企业拥有的元数据进行管理,支持业务视图和物理视图方式管理数据,可查看元数据基本信息、数据所在位置,数据的血缘关系,数据的影响分析,管理数据的生命周期等。
集群管理
集群管理( Manager )是联想大数据平台的自动化运维工具,满足不同场景下大数据平台向导式自动安装,实现对主机资源、主机服务有效的监控与可视化的管理,支持的组件包括HDFS、Yam.MapReduce、Hbase、Hive、Spark、Storm、Zookeeper等 ,支撑整个大数据平台智能化运维。
数据质量
数据质量( Data Quality )是大数据平台的数据质量管理工具,实现企业内部的业务应用程序中快速识别、修复及监控数据质量问题。支持企业数据标准与质量规则库统一维护,支持简单易操作的数据稽核配置,支持完善的图形化质量分析, 支持问题数据预览、下载,支持灵活告警机制。
应用场景