【AWS】AWS認定「機械学習」 - サーバレス練習帳

なんと、日本語訳を見つけたよ！
qiita.com

Q1
S3にCSVがあって、Amazon SageMaker Linear Learner algorithmを使いたい場合、何をすれば良い？
⇒　Amazon SageMaker Pipeモードを使用
データの流し込み方を勉強する問題ですね。

Q2
TF-IDを使った場合のディメンジョンは？

Q3
S3上のデータセットに関するメタデータのカタログを管理
⇒ Glueクローラー

Q4
バッチサイズと学習率

Q5
混同行列

Q6
ロジスティック回帰？？
fraud detection model って、詐欺検知モデルという意味か？

Q7
この問題もfraud detection modelという言葉が出てきた。

Q8
Amazon SageMaker Linear Learner algorithm

Q9
前処理の方法について。
読めばできそう。

Q10
Amazon SageMaker Object2Vec

・・・ということで、方針は、Amazon Sage Makerだけは勉強する。
特に、
Q1 ： Amazon Sage Maker Pipe モード
Q8 ： Amazon Sage Maker Linear Learner algorithm
Q10 ： Amazon Sage Maker Object2Vec

それ以外は、DeepLearning G検定の知識で突撃しよう！

@@@

出題範囲
https://d1.awsstatic.com/training-and-certification/docs-ml/AWS%20Certified%20Machine%20Learning%20-%20Specialty%20Exam%20Guide%20001%20v1.1%20JPN.pdf

f:id:urbanplanner:20190810114753p:plain — 出題範囲

分野 1: データエンジニアリング
　1.1 機械学習のデータリポジトリの作成。
　1.2 データ収集ソリューションの特定と実装。
　1.3 データ変換ソリューションの特定と実装。
分野 2: 探索的データ解析
　2.1 モデリングのためのデータのサニタイズと準備。
　2.2 特徴エンジニアリングの実施。
　2.3 機械学習用データの分析と視覚化。
分野 3: モデリング
　3.1 ビジネス上の課題を機械学習の課題として捉え直す。
　3.2 特定の機械学習の課題に対する適切なモデルの選択。
　3.3 機械学習モデルのトレーニング。
　3.4 ハイパーパラメータの最適化の実施。
　3.5 機械学習モデルの評価。
分野 4: 機械学習の実装と運用
　4.1 パフォーマンス、可用性、拡張性、回復性、フォールトトレランスを備えた機械学習ソリューションの構築。
　4.2 特定の課題に対応する適切な機械学習サービスおよび機能の推奨と実装。
　4.3 機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。
　4.4 機械学習ソリューションの展開と運用の実現。