SageMakerの機能と料金体系を整理してみた

こんにちは。エンジニアの落合です。

突然ですが皆さん、SageMakerは使っていますか? おそらく、AWSでBedrockやKiroなどのAIサービスをよく使う方でも、SageMakerを使う方はMLエンジニア以外だとあまり多くないのではと思います。

今回はSageMakerを実際に使う前に知っておきたい概要とクリーンアップの注意点を備忘録として纏めてみました。

はじめに

SageMakerに触ってみよう!と思い立ち、コンソールで検索をしてみたところ、「SageMaker」の名前が付くサービスが2つ出てきました。

「Amazon SageMaker」と「Amazon SageMaker AI」の違いって何だ……?といきなり迷子になったので、今回は一旦SageMakerの概要とそれぞれのサービスでできることを整理してみようと思います。

 

SageMakerとSageMaker AIの違い

調べてみると2024年12月にSageMaker全体が刷新され、主に3つのサービスに分離したようです。

 

  • SageMaker AI:従来のSageMaker。ML および基盤モデルを構築、トレーニング、デプロイできる。
  • SageMaker Unified Studio:機械学習モデルのトレーニングからAIを用いたアプリケーション開発まで行える統合開発環境(IDE)。これまでバラバラだった「データの準備(ETL)」「開発(ML)」「分析(BI)」を1つの画面で行えるようになった。
  • SageMaker Lakehouse:AI学習用に最適化されたデータ管理機能。

この内SageMaker AIがコンソール上の「Amazon SageMaker AI」、下2つが「Amazon SageMaker」で利用できます。

 

ざっくり表にしてみるとこんな感じです。

項目 Amazon SageMaker Amazon SageMaker AI
(旧Amazon SageMaker)
内容 Unified StudioやLakehouse等を含む、次世代機械学習サービスの総称 従来のSageMakerが改称されたもの

モデルの学習や推論(API化)を行う、裏側の計算機能を提供

得意なこと 機械学習プロセス全体をワンストップで実行する Pythonのコードを少し試す

ノーコードで機械学習を実行する(Canvas)

機械学習フロー全体を扱うのであればSageMaker (Unified Studio)を使うのが標準のようです。ノーコードで機械学習をしたいならSageMaker AI内のCanvasが便利そうでした。
ただ、Pythonのコードを少し書いて機械学習を試したいだけであればSageMaker AI内のStudioやNotebooksで充分かも。Unified Studioは簡単な実験やコードの実行にはオーバースペックかもしれません。

参考:Amazon SageMaker と Amazon SageMaker AI

 

課金のしくみについて

SageMakerを利用するにあたって、気になるのが料金体系です。

詳しくはAmazon SageMakerの料金をご確認ください。

 

EC2等を利用したことがある方には馴染みがあるかと思いますが、SageMakerは基本的に起動時間に対して課金されるようです。(オンデマンドの場合)

インスタンス自体を使っていなくても、「Running(起動中)」になっている限り課金されてしまうので、使用する場合は注意が必要です。

 

推論の場合、SageMaker Serverless Inferenceを利用する場合は従量課金制になるため、使い分けるとコスト削減になるかと思います。

極端な例ですが、ml.p3.16xlarge(超高性能なインスタンス)を1ヶ月間起動し続けた場合、約314万円の料金がかかってしまいます……。SageMakerを使用する場合は必ずインスタンスの状態は気にかけるようにしましょう。

 

また、機械学習に使用するデータを保存しているストレージにも使用料金がかかります。ストレージ料金については使用しているサービスの料金を別途確認する必要があります。

 

まとめ

SageMakerを利用する際には用途別にサービスを選択する。

 

  • 機械学習をとりあえずやってみたい場合:SageMaker Unified Studio(SageMaker)
  • Notebookや特定の計算リソースだけ触りたい:SageMaker AI
  • ノーコードで機械学習をしたい:Canvas(SageMaker AI)

 

SageMakerの利用料金はインスタンスの起動時間単位でかかる。
インスタンスを使用していないときは必ずインスタンスを停止か削除する。

※インスタンス内のストレージを使用している場合、停止してもストレージの保存容量に対して料金が発生してしまうので注意する。

 

この記事が気に入ったら
いいね ! しよう

Twitter で

【採用情報】一緒に働く仲間を募集しています

採用情報
ページトップへ