CRISP-DMとCRISP-MLの違いは何ですか？

CRISP-DMは、データマイニング／データ分析プロジェクトに広く使われている標準的なプロセスモデルで、ビジネス理解→データ理解→データ準備→モデリング→評価→展開を反復的に進めるフレームワークです。これに対してCRISP-ML（やCRISP-ML(Q)）は、機械学習ソフトウェアの開発から運用・品質保証までをカバーするように拡張されたプロセスモデルで、リスクと品質に重点を置き、MLOps的な観点を含めている点が特徴です。

AIプロジェクトではアジャイルとウォーターフォールのどちらを選ぶべきですか？

不確実性が高く、要件や技術が固まり切っていない探索・PoCフェーズでは、短いサイクルで仮説検証を回せるアジャイル開発が向いています。一方、安全性・品質・コンプライアンスを厳格に求められる本番システムや基盤部分では、工程を段階的に管理するウォーターフォール型の進め方が有効です。実務では「探索はアジャイル寄り、実装はウォーターフォール寄り」といったハイブリッドが一般的です。

PoCで終わらせず社会実装につなげるポイントは何ですか？

PoCのゴールを「モデルが動いた」ではなく、「価値が出る筋が見えた」に置くことが重要です。そのために、PoCの段階から1) 誰がどの業務の中でどう使うのか、2) どう運用・監視するのか、3) どのKPIでGo/No-Goを判断するのか、という3点を設計しておきます。ビジネス側・運用側を巻き込んだPoC設計にしておくことで、社会実装への橋がかかります。

MLOpsでは何を監視・管理する必要がありますか？

MLOpsでは、モデル性能指標、データドリフト／コンセプトドリフト、バイアス、リソース使用状況などのモニタリングに加え、モデル・データ・コード・設定のバージョン管理、再学習と再デプロイ、ロールバック手順など、機械学習モデルのライフサイクル全体を継続的に監視・管理します。

AIプロジェクトでBPRが重要な理由は何ですか？

BPR（Business Process Re-engineering）は、業務プロセスそのものを抜本的に見直す取り組みです。AIだけを導入しても、意思決定の流れや役割・責任が従来のままだと、現場が使いこなせず価値が出ないことが多くあります。BPRによって、どこで誰が何を根拠に判断しているかを整理し、AIを組み込んだときにKPIが改善するよう「仕事の形」を再設計することで、AI導入の効果を最大化できます。

G検定対策究極カンペをつくろう#13｜AIプロジェクトの進め方（CRISP-DM / CRISP-ML / PoC / BPR / MLOps ほか）

バックナンバーはこちら

はじめに（今回の狙い）
動画シリーズ
全体構成：AIプロジェクトを1本の因果で見る
1. 因果関係図（全体）
上流：目的/価値 ― ステークホルダーのニーズから始める
1. ステークホルダーのニーズとビジネス価値
2. 拡大図（上流ブロック）
計画：方法論 / 開発プロセス ― CRISP-DM / CRISP-ML / アジャイル / ウォーターフォール
実行：業務/データ→PoC→社会実装
運用：継続改善（MLOps）
1. MLOpsで押さえておきたい観点
2. 拡大図（MLOpsブロック）
実装/基盤：ツール/環境 ― Python / Jupyter / Docker / Web API / クラウド
1. ツールごとの役割
2. 拡大図（ツール/環境ブロック）
人/連携：チームと外部連携
まとめ：究極カンペ（1枚）に圧縮する
1. 試験直前に見るべき3行
FAQ
参考文献（個人ブログ・企業ブログ・書籍を除外）

はじめに（今回の狙い）

AIプロジェクトは「モデルを作ったら終わり」ではなく、価値 → プロセス → データ → PoC → 社会実装 → 運用 → 価値というループで回る。その全体像を、1枚の因果関係図として頭の中に作るのが本記事のゴールである。

学習目標は次のとおりである。

AIプロジェクトをどのように進めるか、その全体像と各フェーズで注意すべき点を理解する
AIプロジェクトを進める際に考えるべき論点や基本概念、国内外の議論、事例への入り口を押さえる
サービスやプロダクトとしてAIシステムを世に出す局面で、どこに注意が必要かを理解する
モデルのヘルスモニタリングやライフサイクル管理など、AI運用の基本的な考え方を理解する
「PoCで終わらせない」ために、価値回収までの道筋を意識できるようになる

キーワードは次のとおりである。

AIのビジネス活用、AIプロジェクトの進め方
BPR、CRISP-DM、CRISP-ML
アジャイル／ウォーターフォール
PoC、MLOps、クラウド、Web API、Docker、Jupyter Notebook、Python
データサイエンティスト、ステークホルダーのニーズ、他企業／他業種連携、産学連携、オープン・イノベーション

本記事のポイントは、用語をバラバラに暗記するのではなく、因果関係図のどこに刺さる概念なのかを意識して読むことである。

動画シリーズ

本記事は、YouTubeで公開している「G検定対策究極カンペをつくろう」シリーズの第13回「AIプロジェクトの進め方」を文字・図解で整理したものである。

動画では対話形式で解説しているが、この記事では試験直前に見返せるよう、講義ノート＋因果関係図の形に圧縮している。

G検定対策究極カンペの作り方

G検定究極カンペの作り方というか、カンペに頼らない自分自身の作り方

全体構成：AIプロジェクトを1本の因果で見る

AIプロジェクトの流れを1枚にまとめた因果関係図は、概ね次のような構造になっている。

左下から ステークホルダーのニーズ が立ち上がる
それが AIのビジネス活用（価値・KPI） に変換される
価値を実現するための AIプロジェクトの進め方（方法論） を選ぶ
業務の見直し（BPR）→ データ整備 → PoC → 社会実装と進む
社会実装されたAIは MLOpsによって運用・改善 される
運用の結果としてビジネス価値が生まれ、再び「ニーズ」としてループする

この「ニーズ→価値→プロセス→業務/データ→PoC→社会実装→MLOps→価値」が、G検定的にも実務的にも押さえておきたい“究極カンペ”である。

因果関係図（全体）

AIプロジェクトの進め方を「ステークホルダーのニーズ→ビジネス価値→進め方（方法論）→業務/データ→PoC→社会実装→MLOps運用→ビジネス価値」というループで整理した全体因果関係図。 — 因果関係図全体：AIプロジェクトの進め方

以下では、この図を左から右へ辿る形で各ブロックを解説していく。

上流：目的/価値 ― ステークホルダーのニーズから始める

ステークホルダーのニーズとビジネス価値

AIプロジェクトの起点は「AIを使うこと」ではなく、ステークホルダーのニーズである。

誰の（顧客、現場、経営、法務、運用…）
どんな困りごとを
どのように良くしたいのか

ここが曖昧なまま「とりあえずAIで何か」を始めると、PoCやモデル開発はできても、価値回収に失敗しやすい。

G検定の文脈では、「AIのビジネス活用」＝価値やKPIに落とし込むこととして整理しておくとよい。

例：
- 「画像分類精度99%」 → 試験には出るが、ビジネス価値ではない
- 「検査時間が50%短縮」「不良流出が30%減少」 → ビジネス価値としてのKPI

AI導入の目的は、「AIを使うこと」ではなく価値指標（KPI）の改善である。
ここから逆算して、「どのプロセスで何を自動化／高度化するか」が決まる。

拡大図（上流ブロック）

ステークホルダーのニーズから出発し、「AIのビジネス活用（価値・KPI）」を定義し、それに基づいて「AIプロジェクトの進め方（方法論）」を選ぶ上流部の因果関係図。 — 上流ブロック（ステークホルダーのニーズ→AIのビジネス活用→AIプロジェクトの進め方）

このブロックで押さえるべきこと：

ニーズがブレると、プロジェクト全体が迷子になる
「どのKPIを、どのくらい、いつまでに動かしたいか」を言語化する
そのうえで、次章の「方法論/開発プロセス」を選択する

計画：方法論 / 開発プロセス ― CRISP-DM / CRISP-ML / アジャイル / ウォーターフォール

上流で「何を良くしたいか」が決まったら、次にどう進めるかを決める。
因果関係図では「AIプロジェクトの進め方」から、以下の4つに接続されている。

CRISP-DM
CRISP-ML
アジャイル
ウォーターフォール

CRISP-DM：分析プロジェクトの“定番フレーム”

CRISP-DM（Cross Industry Standard Process for Data Mining）は、データ分析プロジェクトの定番プロセスである。

ビジネス理解
データ理解
データ準備
モデリング
評価
展開（Deployment）

の6フェーズを、反復しながら進めることが特徴である。

G検定では、

「分析プロジェクトの標準的なプロセスモデル」
「ビジネス理解から始まり、展開までを反復的に回す」

この2点を押さえておくとよい。

CRISP-ML：運用まで含めた拡張版

CRISP-ML（やCRISP-ML(Q)など）は、機械学習システムの開発から運用までを意識した拡張フレームとして押さえると理解しやすい。

目的設定・ビジネス目標
データ／モデル開発
デプロイ
運用・監視・改善

といったMLOps的な観点が、最初から組み込まれている点がポイントである。
因果関係図でも、CRISP-MLは社会実装（サービス/プロダクト化）側に刺さる形で描かれている。

アジャイルとウォーターフォール：対立ではなくハイブリッド

アジャイル
- 短いサイクルで仮説検証を回す
- 不確実性が高い領域（要件や技術がまだ固まっていない）に強い
- PoCや探索フェーズと相性が良い
ウォーターフォール
- 要件定義→設計→実装→テスト→リリースを段階的に進める
- 安全性・品質・コンプライアンスが重い領域で有効
- 社会実装や本番運用フェーズで求められることが多い

重要なのは、アジャイル vs ウォーターフォールという二択ではないという点である。

PoCや要件探索：アジャイル寄り
本番システムの安全性・品質管理：ウォーターフォール寄り
実務では、この2つを組み合わせたハイブリッドになりやすい

拡大図（計画ブロック）

流で定義した「AIプロジェクトの進め方」から、CRISP-DM・CRISP-ML・アジャイル・ウォーターフォールへ分岐し、分析・開発・運用の進め方を整理した因果関係図。 — 計画ブロック（CRISP-DM / CRISP-ML / アジャイル / ウォーターフォール）

G検定対策としては、

CRISP-DM：分析プロジェクトの標準プロセス
CRISP-ML：運用・品質まで含めた拡張
アジャイル：短サイクルの仮説検証
ウォーターフォール：工程を段階的に管理

という“芯”を押さえておくとよい。

実行：業務/データ→PoC→社会実装

ここからがAIプロジェクトの「体幹」である。
因果関係図では、

ステークホルダーのニーズ → BPR → データ整備/収集→PoC→社会実装（サービス/プロダクト化）→AIのビジネス活用

という太い矢印でつながっている。

BPR：AIの前に「仕事」を作り直す

BPR（Business Process Re-engineering）は、業務そのものを見直すプロセスである。

どこで意思決定が行われているか
誰がその判断をしているか
何を根拠に判断しているか

を棚卸しし、AIを入れたときに本当に価値が出るように、仕事の流れを組み替える。

AIプロジェクトでありがちな失敗は、

業務はそのまま → 既存の流れの横に「よくわからないAI」が追加される → 誰も使わない

というパターンである。
「AIを作る前に、仕事を作り直す」という視点がBPRの核心である。

データ整備/収集・品質：地雷原を踏まないために

BPRを通じて「どこにAIを組み込むか」が見えたら、次はデータである。

欠損・ノイズ
ラベル品質（誰がどう付けたか）
データの偏り（バイアス）
個人情報・機微情報の扱い
利用許諾や二次利用の範囲

このあたりは、実務では地雷原になりやすい。
CRISP-DMの「データ理解」「データ準備」のフェーズが、ここに刺さっていると考えるとよい。

PoC：ゴールは「動いた」ではなく「価値が出る筋」

PoC（Proof of Concept）は、「できるかどうか」を検証するフェーズである。

ただし、本来のゴールは「モデルが動いた」ではなく「価値が出る筋が見えた」ことである。

成果指標（精度、再現率など）がビジネスKPIにどう接続するか
本番運用時の負荷・コスト・レイテンシの見通し
必要なデータ量・更新頻度
法務・セキュリティ・説明責任の論点

これらが「イケそうかどうか」を判断するのがPoCの役割であり、「一発ネタのデモ」で終わらせてはいけない。

社会実装（サービス/プロダクト化）

PoCを越えた先が、社会実装＝サービス/プロダクト化である。

この段階で一気に論点が増える。

UX（どの画面・フローでAIを使うのか）
エラー時の挙動、フェイルセーフ
ログと監査対応
セキュリティ、アクセス制御
契約・責任分界（誰がどこまで責任を持つか）
説明責任（顧客・監督官庁・社内ステークホルダー）

因果関係図では、ここから再び「AIのビジネス活用」に矢印が戻っている。
AIが「使われる」状態になって初めて、上流で定義した価値が回収される。

拡大図（実行ブロック）

ステークホルダーのニーズからBPR→データ整備/収集→PoC→社会実装（サービス/プロダクト化）へつながり、最終的にAIのビジネス活用（価値）へ戻る実行フェーズの因果関係図。 — 実行ブロック（BPR→データ整備/収集→PoC→社会実装→ビジネス活用）

運用：継続改善（MLOps）

社会実装したAIは、そのまま放置すると現実の変化についていけなくなる。

データ分布の変化（コンセプトドリフト）
新しい製品・顧客層の追加
法規制や社内ルールの変更
モデルの劣化・バイアスの顕在化

これらに対応するための考え方が、MLOpsである。

MLOpsで押さえておきたい観点

G検定レベルでは、次のキーワードをひとつの文脈としてつなげて覚えておくとよい。

モニタリング
- モデル性能（精度、再現率など）
- データドリフト／コンセプトドリフト
- バイアス・公平性
再学習と再デプロイ
- 新データでの再学習
- A/Bテストや段階的リリース
バージョン管理・再現性
- モデル・データ・コード・設定の一貫した管理
障害対応
- ロールバック
- フォールバックルール（ルールベースなど）

因果関係図では、社会実装（DEP）→MLOps→社会実装（DEP）というループとして描かれている。
つまり、AIプロジェクトは「リリースして終わり」ではなく、運用で価値を維持・向上させるフェーズが本番なのである。

拡大図（MLOpsブロック）

社会実装されたAIシステムに対して、MLOpsによる監視・再学習・再デプロイを行い、継続的に改善しながら運用していくループを示した因果関係図。 — 運用ブロック（社会実装からMLOpsを経て再び社会実装へ戻るループ）

実装/基盤：ツール/環境 ― Python / Jupyter / Docker / Web API / クラウド

因果関係図の下部には、実装や基盤を支えるツール群がまとめて配置されている。

Python
Jupyter Notebook
Docker
Web API
クラウド

これらは単なる道具リストではなく、「PoC→社会実装→MLOps」を支える土台として押さえると理解しやすい。

ツールごとの役割

Python
- 機械学習・データ分析の事実上の標準言語
- ライブラリ（NumPy、pandas、scikit-learn、PyTorch、TensorFlowなど）が豊富
Jupyter Notebook
- 探索的データ分析やPoCに向いたインタラクティブ環境
- 可視化・メモ・コードを一体として扱える
Docker
- 環境ごとの差異（ライブラリバージョンなど）による事故を減らす
- 同じコンテナを開発・検証・本番で動かすことで再現性を確保
Web API
- モデルをサービスとして公開する入口
- バックエンドのMLモデルを、他システムやフロントエンドから利用可能にする
クラウド
- 計算リソースのスケールアウト
- ストレージ、ジョブ管理、監視、ログ基盤などを含む現実的な運用環境

典型的な流れとしては、

JupyterでPoC → Pythonコードを整理 → Dockerでコンテナ化 → クラウド上でWeb APIとして提供 → MLOps基盤と連携

という形が、因果関係図の「T→PoC／T→DEP／T→MLOps」に対応している。

拡大図（ツール/環境ブロック）

Python・Jupyter・Docker・Web API・クラウドといったツール/環境が、PoC・社会実装・MLOpsの各フェーズを土台として支える構造を示した因果関係図。 — 実装/基盤ブロック（Python / Jupyter Notebook / Docker / Web API / クラウド）

人/連携：チームと外部連携

最後に、因果関係図の右下には人と連携のブロックが配置されている。

データサイエンティスト
オープン・イノベーション
他企業や他業種との連携
産学連携

職種横断のチームで進める

AIプロジェクトは、データサイエンティストが1人で完結する仕事ではない。

企画・ビジネスサイド
現場担当
データサイエンティスト
ソフトウェア/インフラエンジニア
セキュリティ・法務・コンプライアンス
運用チーム

これらが一体となって初めて、BPR→データ整備→PoC→社会実装→MLOpsの矢印が前に進む。

外部連携（オープン・イノベーション / 産学連携など）

外部連携が必要になる典型的な理由は次のとおりである。

自社だけでは十分なデータが集まらない
特定ドメインの知見が不足している
自前開発よりもスピードが重要
標準規格や業界全体の取り組みとして進める必要がある

G検定では、「AIの社会実装には技術だけでなく、プライバシー・説明責任・リスク分類・ガバナンスなどの社会的論点が絡む」ことが問われやすい。
人と連携のブロックは、これらの議論への入り口としても意識しておくとよい。

拡大図（人/連携ブロック）

データサイエンティストを含む職種横断のチームと、オープン・イノベーションや産学連携などの外部連携が、データ整備・PoC・社会実装を横から支援する構造を示した因果関係図。 — 人/連携ブロック（データサイエンティスト / オープン・イノベーション / 他企業・他業種連携 / 産学連携）

まとめ：究極カンペ（1枚）に圧縮する

最後に、因果関係図を左から右へ一本の線として思い出せるように整理する。

上流：
- ステークホルダーのニーズから出発する
- 「AIのビジネス活用」＝価値やKPIに落とし込む
- ここがブレると、すべてが迷子になる
計画：
- CRISP-DM：分析プロジェクトの標準プロセス
- CRISP-ML：実装・運用まで意識した拡張
- アジャイル／ウォーターフォールは対立ではなく、状況に応じたハイブリッド
実行：
- BPR→データ整備→PoC→社会実装が幹
- PoCで満足せず、「使われるAI」になるまで進めて初めて価値が出る
運用：
- MLOpsでモニタリングとライフサイクル管理を行う
- モデル・データ・コードのバージョン管理と再現性が重要
実装/基盤：
- Python・Jupyter・Docker・Web API・クラウドは、PoC・実装・運用を支える土台
人/連携：
- 職種横断チーム＋外部連携が、データとPoCを前に進める推進力になる