大数据通用架构
Lambda架构

- Lambda架构有三层,批处理层、速度层和服务层。
- 批处理层:批处理层是基于Hadoop生态,随着数据的更新会对所有数据进行重计算并将计算结果保存到NoSQL数据库中(如:electicalsearch、HBase、Redis、Hive等),提供批处理视图,批处理视图会整体批量更新;
- 速度层:由于批处理的机制导致延迟较大(天级/小时级),如果需要尽快的处理实时数据则需要提供单独的机制产生实时视图,通常只需要保存少量近期数据;
- 服务层:只会调用批处理视图和实时视图(汇总实时图和批处理视图),为应用系统提供查询服务;
- Lambda架构特点:
- 有批处理层、速度层和服务层三层;
- 所有数据最终都需要放在统一分布式存储上;
- 批处理层重新计算以后速度层的视图就可以丢弃;
- Lambda平台实现逻辑复杂(实时数据和批处理数据是两套处理)