时间语义
1. Flink中的时间语义
1.1 哪种时间语义更重要
- 从《星球大战》说起
为了更加清晰地说明两种语义的区别,我们来举一个非常经典的例子:电影《星球大战》。如上图所示,我们会发现,看电影其实就是处理影片中数据的过程,所以影片的上映时间就相当于"处理时间";而影片的数据就是所描述的故事,它所发生的背景时间就相当于"事件时间"。两种时间语义都有各自的用途,适用于不同的场景。
1.2 数据处理系统中的时间语义
在实际应用中,事件时间语义会更为常见。一般情况下,业务日志数据中都会记录数据生成的时间戳(timestamp),它就可以作为事件时间的判断基础。
在Flink中,由于处理时间比较简单,早期版本默认的时间语义是处理时间;而考虑到事件时间在实际应用中更为广泛,从Flink1.12版本开始,Flink已经将事件时间作为默认的时间语义了。