宝马集团利用基于亚马逊云科技的数据湖充分释放数据的力量
2020
宝马集团总部位于德国慕尼黑,是一家全球高端汽车和摩托车制造商,旗下品牌包括 BMW、BMW Motorrad、MINI、劳斯莱斯。该集团还提供优质的金融和移动服务。
在过去几年里,宝马集团一直致力于使用数据和预测分析来保持其在汽车行业数字化转型领域的前沿地位。宝马集团负责数据转换、人工智能、数据和开发运维平台的副总裁 Kai Demtröder 表示,“为了保持创新,我们专注于打造新的数字化和互联体验,并通过实现数据驱动型决策来推动价值链变革,以提高效率和改善效果。”为了实现这些创新,2015 年,宝马集团创建了一个集中式本地数据湖,用于收集和整合来自车辆传感器、运营系统和数据仓库的匿名数据,以获取借鉴性、实时和预测性见解。
然而,该公司需要更容易地扩展其数据湖,以支持内部和外部利益相关者日益增长的需求。由于数据分散在无数个孤立的环境中,不易获取,再加上自身 IT 基础设施陈旧,并且支持新的计划需要较长准备时间,宝马集团的创新步伐放缓。宝马集团需要开发一种足够敏捷的解决方案,这种解决方案既能支持所有内部业务部门的数据需求,又能让公司快速采取行动,以应对客户要求的一系列新兴使用案例。
宝马集团还努力让数据使用者能够实时访问车辆遥测之类的数据,如速度、位置、温度、电池和制动水平以及发动机状态等信息。此外,该公司还希望将分析和机器学习整合到数据湖中,以加速开发新的创新服务。而且,该解决方案必须提供所需的治理,以确保遵守隐私和安全法规,这是基本的先决条件。
"与亚马逊云科技的合作才刚刚开始,我们期待亚马逊云科技帮助我们的企业实现推动创新走向未来的战略。”
宝马集团
数据转换、人工智能、数据和开发运维平台副总裁
Kai Demtröder
助力数据驱动的方法
为了应对这些挑战,宝马集团决定重新构建其本地数据湖,并将其迁移至 Amazon Web Services (亚马逊云科技) 云。该公司的云数据中心(CDH) 可处理并整合来自车辆传感器和整个企业其他来源的匿名数据,使创建面向客户的应用程序和内部应用程序的内部团队能够轻松获取这些数据。最终,该公司发现 亚马逊云科技提供了所需的敏捷性和灵活性,而且其覆盖范围广,能够支持全球各地的用户。
在迁移之前,宝马集团僵化的本地数据湖无法满足数据工程师和分析师日益增长的需求。由于运行相互依赖的工作流,旧数据湖不能很好地处理多个租户。因此,宝马集团的平台、接收和使用案例团队需要进行复杂的协调来处理项目,于是会遇到组织瓶颈,从而拖慢了前进的步伐。
宝马集团转而使用亚马逊云科技托管服务组合(包括Amazon Athena、Amazon Simple Storage Service(Amazon S3)、Amazon KinesisData Firehose和亚马逊云科技Glue),通过区分组件来降低设置的复杂性,并创建一个能够扩展的环境来满足数据工程师的需求。此外,各团队现在可以拥有自己的端到端开发运维流程,从而具备继续创新所需的自主性和敏捷性。而且,宝马集团实施了一个现代化的 Web 门户,可帮助 CDH 用户使用先进的搜索算法发现可信赖的数据集,并轻松查询数据以生成新的见解。
数据使用实现大规模大众化
使用亚马逊云科技服务,宝马集团每天接收大量数据。目前,数百万辆宝马和 MINI 汽车通过宝马集团高度安全的后端连接到 CDH,系统每天处理数 TB 的匿名遥测数据。该公司使用这些数据来监控车辆运行状况指标,例如检查控制错误以识别整个车系的潜在问题。这样一来,宝马集团能够利用从 CDH 接收、收集和完善的车队数据来更好地解决问题,以免这些问题影响到客户。
为了更好地管理这些数据,宝马集团引入了“数据提供者”和“数据使用者”概念,以提高其软件工程团队的自主性和敏捷性。数据提供者利用亚马逊云科技服务(如Amazon Kinesis Data Firehose、亚马逊云科技Lambda、亚马逊云科技Glue 和Amazon EMR)来接收和转换数据。然后,数据使用者可以利用诸如 Amazon Athena、Amazon SageMaker、亚马逊云科技Glue 和 Amazon EMR 之类的服务,在其使用案例中运用这些数据。提供者和使用者均是在自己的账户中使用这些服务,只共享可由中央 API 控制的明确定义的接口,这有助于防止出现瓶颈。各数据层均存储在 Amazon S3 存储桶中,其架构已在亚马逊云科技Glue 数据目录中注册。
除了在亚马逊云科技Glue 数据目录中收集技术元数据外,宝马集团还发现,构建一个人类可读的数据目录对于在整个组织范围内实现数据大众化至关重要。这项工作将可确保流程高度透明,让大家清楚地了解在 CDH 中收集哪些数据资产以及如何收集这些数据资产。前端应用程序Data Portal用作数据资源管理器,能够清晰地显示数据资源,并为整个组织的 500 多位用户提供基于数据使用模式的“人气指数”,从而提高数据分析师、数据科学家和工程师的工作效率。
此外,CDH 利用 GraphQL 通过亚马逊云科技AppSync为数据提供者和使用者构建可扩展的通用 API,从而提高开发的灵活性。与传统 REST API 不同,在 GraphQL 上构建的接口非常适合支持演变的要求,比如表示数据目录的元数据或提供从互联车辆收集的异构数据。开发人员可以灵活地定义负载结构和查询参数,以获取给定使用案例所需的数据。这有助于显著加快构建应用程序的速度,因为他们不再需要为每个具有不同数据要求的项目创建一组新的 API。
加速创新
基于亚马逊云科技的集中式数据湖为宝马集团开发数据驱动型 IT 解决方案奠定了基础,并使该公司能够在无服务器架构上自动且独立地进行扩展。因此,与以前的本地解决方案(需要为每项新计划进行基础设施管理和容量规划)相比,它的创新速度更快。
宝马集团将开放围绕 CDH 关键组件的源代码,包括其 API、架构和 Data Portal。此外,宝马集团是Gaia-X(欧洲关于建立主权数据空间的计划)的首日成员,这一事实也为其提供了助力。
展望未来,宝马集团将继续扩展 CDH 平台的能力,以进一步加快其数字化转型步伐,并推动整个业务的附加价值,增强创新的客户体验、新的移动服务和内部业务见解。Demtröder 总结道,“与亚马逊云科技的合作才刚刚开始,我们期待亚马逊云科技帮助我们的企业实现推动创新走向未来的战略。”
要了解详情,请访问aws.amazon.com/automotive。
宝马集团简介
宝马集团拥有 BMW、MINI、劳斯莱斯和 BMW Motorrad 等四个品牌,是一家领先的高档汽车和摩托车制造商。该公司也提供优质的金融和移动服务。
亚马逊云科技的优势
数据使用实现大规模大众化每天处理数 TB 来自数百万车辆的遥测数据在问题影响到客户之前就解决问题加速创新
使用的亚马逊云科技服务
Amazon Kinesis Data Firehose
Amazon Kinesis Data Firehose 是将流数据可靠地加载到数据湖、数据存储和分析服务中的最简单方式。它可以捕获、转换流数据并将其传输到 Amazon S3、Amazon Redshift、Amazon Elasticsearch Service、通用 HTTP 终端节点,以及 Datadog、New Relic、MongoDB 和 Splunk 等服务提供商。
Amazon SageMaker
Amazon SageMaker 是一项完全托管的服务,可以帮助开发人员和数据科学家快速构建、训练和部署机器学习 (ML) 模型。SageMaker 完全消除了机器学习过程中每个步骤的繁重工作,让开发高质量模型变得更加轻松。
亚马逊云科技AppSync
亚马逊云科技AppSync 是一项完全托管的服务,通过处理与亚马逊云科技DynamoDB、Lambda 等数据源之间繁重的安全连接任务来简化 GraphQL API 的开发。部署之后,亚马逊云科技AppSync 会自动扩展和调小 GraphQL API 执行引擎以满足 API 请求量。
亚马逊云科技Glue
亚马逊云科技Glue 是一项完全托管的提取、转换和加载 (ETL) 服务,让客户能够轻松准备和加载数据进行分析。
开始使用
无论行业无论规模,每天都有的公司在使用亚马逊云科技实现业务运维转型。联系我们的专家,立即踏上您的亚马逊云科技云之旅。