AWSの薄い本Ⅴ データ分析基盤を作ってみよう 〜性能測定編〜
- ダウンロード商品【ダウンロード版】¥ 1,000
- 物販商品(倉庫から発送)ネコポス可能【物理本+ダウンロード版】¥ 1,000
データが新たな原油と例えられる現代において、そのデータを総合的に分析し、価値ある情報へと昇華させる基盤の構築は、企業にとって不可欠な戦略の一つです。本書「データ分析基盤を作ってみよう 性能測定編」は、AWSを用いたデータ分析基盤の設計に続き、その性能を徹底的に測定し、最適化する方法に焦点を当てています。性能測定は、データ分析基盤が直面する様々な制約の中で最良のアーキテクチャを決定するための重要なプロセスです。 ■ 本書の目的 「AWSの薄い本Ⅲ データ分析基盤を作ってみよう 〜性能測定編〜」を手にとっていただき、ありがとうございます。本書は「AWSの薄い本」のシリーズではあります。前々作のAWSの薄い本Ⅲ データ分析基盤を作ってみよう 〜設計編〜の続きとなります。もともとの予定では、実装編としてGlueやLake Formationを取り上げようとしていましたが、その前に設計と実装をつなぐ本を書く事にしました。 AWSに関する情報は、あふれかえっています。アーキテクチャ設計に関するノウハウも、惜しげもなく共有されています。これらを参照することにより、短期間でそれなりの設計をすることができるでしょう。一方で、その設計の根拠を尋ねられると、はっきりと答えられるひとは少ないでしょう。それぞれのサービスの性能特性を把握することで、この設計で大丈夫と太鼓判を押せるようになります。本書では、そのプロセスの手がかりとなるようにしています。 想定の読者のレベルとしては、インフラエンジニアを中心に業務システムを構築する側の人を想定しています。読んでお終いではなく、自身で実際に試してもらうことを目的としています。評価の観点や実施方法についての解説をするので、ぜひご自身でお試しください。 ■ 対象読者 * ITエンジニア全般など、システム構築に携わる人 * 事業会社でデータ分析基盤構築プロジェクトにアサインされた人 * インフラについて、今よりもう少し深掘りした技術を獲得したい人 ■ 本書で得られること * データ分析関係のAWSサービスがなんとなくわかる * 性能測定をしようとした時の段取り * 自分で性能測定をしようとする心構え ■ 本書で得られないこと * あなたのシステムにおける性能の期待値(自分で調べて) * データ分析基盤の具体的な構築手法(これは次巻で) ■ お問い合わせ先 本書に関するお問い合わせ:twitter: @dkfj ■ 免責事項 本書に記載された内容は、情報の提供のみを目的としています。したがって、本書を用いた開発、製作、運用は、必ずご自身の責任と判断によって行ってください。 これらの情報による開発、製作、運用の結果について、著者はいかなる責任も負いません。
目次
第1章 制約とアーキテクチャの決定 1.1 機能要件と非機能要件 IPの非機能要件グレード 1.2 アーキテクチャ検討へのアプローチ IP非機能要件グレードの性能・拡張性要件 性能測定をして裏付けをとる 第2章 AWサービスとその特性 2.1 Amazon Athena Athenaの性能特性 Athenaの料金体系 Athenaのそのほかの考慮点 2.2 Amazon Simpl Storage Service (Amazon S3) S3の性能特性 S3の料金体系 S3のそのほかの考慮点 2.3 AWS Glue Glueの性能特性 Glueの料金体系 Glueのそのほかの考慮点 第3章 性能測定の方法 3.1 性能測定の目的設定 3.2 性能測定をするうえで、重要なこと 測定の目的 測定環境の平準化 実際の環境に近づける 複数回の測定 メトリクスの取得 外部影響を最小限に 変更との比較 分析する 3.3 測定ツールをどうするか ディスク/ファイルシステムの性能測定 ネットワーク測定 カスタムツールの開発 テストツールのまとめ 第4章 サービスごとの性能測定 4.1 Athenaの性能測定 Athenaの検証の目的 Athenaの検証環境 Athenaの測定結果 4.2 S3のデータ転送の測定 S3の検証の目的 S3の検証環境 S3の測定結果 4.3 Glueの性能測定 Glueの検証の目的 Glueの検証環境 Glueの測定結果 第5章 測定結果に対する考察 5.1 性能測定で判明したこと Amazon Athena Amazon S3 AWS Glue 5.2 結果に対する考察 今回の検証で確認できたこと 検証できていないこと 5.3 データ分析基盤の設計への指針 第6章 まとめ あとがき 著者紹介 既刊一覧