Athenaとは
一言メモ
S3上のオブジェクトに対して、直接クエリを投入できるサービス。
利点
- 即時性
- サーバレスのためすぐにデータのクエリを実行できる。サーバーやDWHの設定や管理が不要。
- GlueのデータカタログにS3上のデータをテーブルとして登録していたら、すぐにクエリを実行できる。
- 高速性
- 並列分散処理による高速なクエリ実行が可能。
- オープン
- 内部でOSSのPrestoというエンジンを使用しているため、CSV、JSON、ORC、Parquet などのさまざまな標準データフォーマットに対応可能。
- シンプルな課金体系
- クエリごとにスキャンされたデータ量に応じた金額が掛かる。クエリを投入しなければ課金は発生しない。
- 2022年現在、課金は 1 テラバイトごとに 5 USD。
- データの圧縮、分割、列形式への変換を行うことにより、クエリに対するコストを 30%~90% 削減することが可能。
- サーバレスのためすぐにデータのクエリを実行できる。サーバーやDWHの設定や管理が不要。
- GlueのデータカタログにS3上のデータをテーブルとして登録していたら、すぐにクエリを実行できる。
- 並列分散処理による高速なクエリ実行が可能。
- 内部でOSSのPrestoというエンジンを使用しているため、CSV、JSON、ORC、Parquet などのさまざまな標準データフォーマットに対応可能。
- クエリごとにスキャンされたデータ量に応じた金額が掛かる。クエリを投入しなければ課金は発生しない。
- 2022年現在、課金は 1 テラバイトごとに 5 USD。
- データの圧縮、分割、列形式への変換を行うことにより、クエリに対するコストを 30%~90% 削減することが可能。
用途
- アドホック/ディスカバリー的な分析のように、ワークロードに波があるような(非定常的な)業務。
コメント
コメントを投稿