カーキ色はヒンディー語らしい

技術記事は https://zenn.dev/notrogue

The Cloud Data Lake読んだ

The Cloud Data Lakeという本を読みました。

learning.oreilly.com

どんな本か

思ったこと

  • 想定読者が難しそう。データエンジニア系の人はFundamentals of Data Engineeringの方が、より具体的でわかりやすいと思います
    • アーキテクト的な人を想定しているのかしら
  • 新しい概念(「Cloud Data Lake」)を提唱してそうな書名ですが、言ってる事はクラウドにData Lake・Data Warehouse作りましょうって話です
    • 副題(「A Guide to Building Robust Cloud Data Architecture」)の方が、本の中身にあっている気がします

この本で紹介されていること

  • データ基盤の(鳥瞰図的な)説明
  • アーキテクチャの選び方
  • コストとかデータガバナンスとか、非機能要件的な話
  • Delta Lake・Iceberg・Hudiなどの、Table Formatの話
    • この本は抽象的な話が多いですが、この話の章(Chapter 6)だけ、謎に具体的です

この本で(あまり)紹介されていないこと

  • 個々のクラウドサービス・プロダクトの話
  • 組織とかビジネスの話
  • チームや個人の話(スキルセットとかキャリア)
  • データを入れた先の話(e.g. BI・機械学習アーキテクチャ