仓储是资料工程喔,经典著作 The Data Warehouse Toolkit有时间可以慢慢翻一下。会说是高级 Excel 工具应该是指看到MapReduce 的部分,但这种操作并不是只能用在分析上……至于待遇跟薪水问题,去看 DrTech 写过的某篇文吧,国家跟产业的权重会比职称和使用的技术要高,你说资料工程跟后端来比谁高,不提产业也无从比较起…框架的大方向未必是处理效率问题,有的是处理扩展性问题Hadoop 生态系没有偏向资料分析呀~ 至于 Flink 是是为了处理一些需要实时计算的资料的,当大量资料实时产生的同时需要分析计算会用到,要看一下你现在的业务到底接触的是哪一越接近用户端使用的部分,相较是比较简单的,上面 D 大提到的,是偏向于提供资料使用人员(DS/DA)去做的 infra多数 DE 会在串接跟维护 Data Pipeline,你说的套用某个规则去整理出某人或是某个部门的资料,可能只是这条 pipeline上,某一个资料出水口需要做的事~ 要挖的东西是满多的,有兴趣可以从这个方向开始切进来~的确在有些公司 DE 除了基础服务设施和资料处理之外,还要