现代汽车作为移动数据中心,每日持续产生巨量、高速且多样化的数据流,形成大数据领域 3V 特性的进阶形态:百亿级数据规模、毫秒级响应需求与多模态数据类型的融合。车辆数据主要包括三类:
车机埋点数据:来自于车辆上类似 pad 的车机,其中会有一些行为埋点数据,采集分析后用于驱动智能座舱的迭代;
车辆信号数据:即车辆元器件产生的信号,比如刹车、速度、里程等各种 IoT 数据,后续会应用于车辆制造和车辆状态的监测等场景;
视频图像:来自于智能驾驶传感器,比如摄像头采集的数据,后续将应用于智能驾驶模型的迭代;
海量车联网数据分析的挑战.PNG
该体系形成 “数据采集 - 分析 - 应用” 的强反馈回路,要求数据管道必须保持零延迟与高保真传输。每日百亿级数据的实时处理能力,已成为构建车辆数字化、智能化生态的关键基础设施,任何数据链路的中断或失真都将直接导致业务效能衰减。
随着岚图汽车销量攀升,每日百亿级数据规模持续膨胀,如何从海量数据中快速提炼有价值信息支撑研发、生产、销售等环节,成为迫切需求。当前数据平台需突破三大核心挑战:
大规模实时数据写入:车辆搭载的数百个传感器持续产生多模态信号(车门、座椅、刹车等),经汇聚处理后形成每秒数十万级 TPS 的吞吐量,单日新增数据量达 10TB 且保持高速增长;
准确的实时数据分析:车联网场景要求近实时数据处理能力,如智能诊断需快速定位故障原因、预警潜在问题。通过实时分析传感器数据与行驶记录,可实现预防性维护,显著提升车辆可靠性与安全性;
存储与计算成本优化:快速增长的全量写入需求与复杂计算任务,导致存储与计算成本攀升。平台需构建低成本存储架构与高效计算引擎,平衡性能与经济性;