全网第一份 | Flink学习面试灵魂40问,看看你能答上来几个?

640?wx_fmt=jpeg

大数据技术与架构
点击右侧关注,大数据开发领域最强公众号!

640?wx_fmt=png

暴走大数据
点击右侧关注,暴走大数据!
来源:王知无
做者:王知无


By  暴走大数据

场景描述:这是一份Flink学习面试指北。看看你能经过这?

关键词:Flink 学习 面试

《大数据技术与架构》和《暴走大数据》读者拥有本文的优先阅读权。

转载请联系做者本人。面试

答案将在下期给出。
 

概念和基础篇编程

  • 简单介绍一下Flink缓存

  • Flink相比传统的Spark Streaming有什么区别?和Spark中的structured streaming 相比呢?Flink相比ss和storm有什么优点?架构

  • Flink的组件栈是怎么样的?框架

  • Flink的基础编程模型了解吗?分布式

  • 说说Flink架构中的角色和做用?学习

  • 说说Flink中经常使用的算子?用过哪些?大数据

  • Flink中的分区策略有哪几种?优化

  • Flink的并行度有了解吗?Flink中设置并行度须要注意什么?spa

  • Flink支持哪几种重启策略?分别如何配置?

  • Flink的分布式缓存有什么做用?如何使用?

  • Flink中的广播变量,使用广播变量须要注意什么事项?

  • Flink中对窗口的支持包括哪几种?说说他们的使用场景

  • Flink 中的 State Backends是什么?有什么做用?分红哪几类?说说他们各自的优缺点?

  • Flink中的时间种类有哪些?各自介绍一下?

  • WaterMark是什么?是用来解决什么问题?如何生成水印?水印的原理是什么?

  • Flink的table和SQL熟悉吗?Table API和SQL中TableEnvironment这个类有什么做用?

  • Flink如何实现SQL解析的呢?

 

进阶篇

  • Flink是如何作到批处理与流处理统一的?

  • Flink中的数据传输模式是怎么样的?

  • Flink的容错机制知道吗?

  • Flink中的分布式快照机制是怎么样的?

  • Flink是如何实现Exactly-once的?

  • Flink的Kafka-connector是如何作到向下兼容的呢?

  • Flink中的内存管理是如何作的?

  • Flink中的序列化是如何作的?

  • Flink中的RPC框架选型是怎么样的?

  • Flink在使用Window时出现数据倾斜,你有什么解决办法?

  • Flink SQL在使用Groupby时出现热点数据,如何处理?

  • 如今我有Flink任务,delay极高,请问你有什么调优策略?

  • Flink是如何处理反压的?和Spark有什么区别?Storm呢?

  • Operator Chains(算子链)这个概念你了解吗?Flink是如何优化的?什么状况下Operator才会chain在一块儿?

 

源码篇



  • 讲讲一个Flink job提交的整个流程吗?

  • 讲讲一个Flink job调度和执行的流程吗?

  • Flink所谓"三层图"结构是哪几个"图"?它们之间是什么关系?他们之间是如何转化的?

  • JobManger和TaskManager分别在集群中扮演了什么角色,说说它们都作了些什么?

  • 简单说说Flink数据的抽象和数据的交换过程

  • Flink的分布式快照机制是如何实现的? 

  • Flink的反压是如何实现的?

  • 说说FlinkSQL是如何转化的?了解逻辑计划和和物理计划吗?FlinkSQL的维表JOIN是如何作的?了解Async IO吗?解决了什么问题?

答案将在下期逐步揭晓。

欢迎点赞+收藏
欢迎转发至朋友圈
640?wx_fmt=jpeg