在对两表进行关联及聚合运算时,经常出现结果不一致的情况,对原因进行了分析,发现问题出在了先关联再聚合,还是先聚合再关联上,基于sqlite进行了测试。

结论为当涉及两表关联聚合计算时,应填充空值、分别聚合计算至没有结果表外的维度后,再进行结果表的关联和计算。

原因分析:dimension1维度用不到,先关联再聚合时,t2表中并不是每个dimension2维度都有对应的dimension1维度,导致关联获取的数据不全,影响最终结果,先聚合再关联避免了这个问题。

版本记录

2024-01-19,初稿。