サーバレス練習帳

着眼大局着手小局

【AWS】AWS認定「機械学習」

なんと、日本語訳を見つけたよ!
qiita.com


Q1
S3にCSVがあって、Amazon SageMaker Linear Learner algorithmを使いたい場合、何をすれば良い?
⇒ Amazon SageMaker Pipeモードを使用
データの流し込み方を勉強する問題ですね。

Q2
TF-IDを使った場合のディメンジョンは?

Q3
S3上のデータセットに関するメタデータのカタログを管理
Glueクローラー

Q4
バッチサイズ学習率

Q5
混同行列
https://camo.qiitausercontent.com/3bcd5c4c035bf0f86d95af0d6c484d1467a5e491/68747470733a2f2f71696974612d696d6167652d73746f72652e73332e61702d6e6f727468656173742d312e616d617a6f6e6177732e636f6d2f302f37303135322f32396363333765372d666632652d643738312d643461342d6533323866643735323661312e706e67

Q6
ロジスティック回帰??
fraud detection model って、詐欺検知モデルという意味か?

Q7
この問題もfraud detection modelという言葉が出てきた。

Q8
Amazon SageMaker Linear Learner algorithm

Q9
前処理の方法について。
読めばできそう。

Q10
Amazon SageMaker Object2Vec


・・・ということで、方針は、Amazon Sage Makerだけは勉強する。
特に、
Q1 : Amazon Sage Maker Pipe モード
Q8 : Amazon Sage Maker Linear Learner algorithm
Q10Amazon Sage Maker Object2Vec

それ以外は、DeepLearning G検定の知識で突撃しよう!

@@@

出題範囲
https://d1.awsstatic.com/training-and-certification/docs-ml/AWS%20Certified%20Machine%20Learning%20-%20Specialty%20Exam%20Guide%20001%20v1.1%20JPN.pdf

f:id:urbanplanner:20190810114753p:plain
出題範囲

分野 1: データエンジニアリング
 1.1 機械学習のデータリポジトリの作成。
 1.2 データ収集ソリューションの特定と実装。
 1.3 データ変換ソリューションの特定と実装。
分野 2: 探索的データ解析
 2.1 モデリングのためのデータのサニタイズと準備。
 2.2 特徴エンジニアリングの実施。
 2.3 機械学習用データの分析と視覚化。
分野 3: モデリング
 3.1 ビジネス上の課題を機械学習の課題として捉え直す。
 3.2 特定の機械学習の課題に対する適切なモデルの選択。
 3.3 機械学習モデルのトレーニング。
 3.4 ハイパーパラメータの最適化の実施。
 3.5 機械学習モデルの評価。
分野 4: 機械学習の実装と運用
 4.1 パフォーマンス、可用性、拡張性、回復性、フォールトトレランスを備えた機械学習ソリューションの構築。
 4.2 特定の課題に対応する適切な機械学習サービスおよび機能の推奨と実装。
 4.3 機械学習ソリューションへの基本的な AWS のセキュリティプラクティスの適用。
 4.4 機械学習ソリューションの展開と運用の実現。