Apache Beam katasやってみる #2(課題編)
katasでは、下のような内容を行います。
- Hello World
- ParDo
- MapElements
- FlatMapElements
- GroupByKey
- CoGroupByKey
- Combine
- Flatten
- Partition
- Side input
- Side Output
- Branch
- Compositte Transform
- DoFnへの追加のパラメータ(Timestampなど)
- Filter
- Aggregation系(Count, Sum, Mean, Min, Max)
- WithKeys
- TextIO
- Window
- Trigger(Event time, early triggering, accumulation)
- WordCount
Beamの学習といえば、Programming Guide
が人気ですが、Katasはその多くをカバーしていることがわかります。
なお、
- Coders
- Schema
- Metrics
- Timer
- State
あたりは、Katasに無いので、Programming Guideを読む必要があります。
(Coder以外は新しい機能なので、知らなくてもBeamのコード書けると思いますが)