ローコードAI

―プロジェクト駆動による機械学習入門

[cover photo]
TOPICS
AI/LLM
発行年月日
PRINT LENGTH
308
ISBN
978-4-8144-0148-2
原書
Low-Code AI
FORMAT
Print
Print
3,960円

プログラミングの知識がなくても、機械学習モデルを構築し、データに基づいた分析や意思決定が可能になることを目的としています。基本的にGoogle Colabで使える無料のAI/MLツール(AutoML、BigQuery ML、Vertex AI、scikit-learn、Kerasなど)を活用します。コードを最小限に抑えた「ローコード」だけでなく、コードを全く書かない「ノーコード」、従来のようにコードを書く「カスタムコード」の手法も紹介します。それぞれの特徴、短所と長所もわかりやすく紹介されているので、初心者はもちろん、中上級者にとっても、自身の業務の効率化などの参考とすることができます。

目次

訳者まえがき
まえがき

1章 データはいかにして機械学習による意思決定を促すのか
    1.1 ゴールとユースケース
    1.2 企業におけるMLワークフロー
        1.2.1 ビジネスゴールまたはプロブレムステートメントの定義
        1.2.2 データ収集
        1.2.3 データ前処理
        1.2.4 データ分析
        1.2.5 データ変換と特徴量選択
        1.2.6 モデル選択の検討またはAutoMLの使用
        1.2.7 モデルの学習、評価、チューニング
        1.2.8 モデルのテスト
        1.2.9 モデルのデプロイ(サービスの開始)
        1.2.10 モデルの保守
    1.3 まとめ

2章 データは初めの一歩
    2.1 本書で使用するユースケースとデータセットの概要
        1. 小売:製品の値付け
        2. ヘルスケア:心臓疾患予防キャンペーン
        3. エネルギー:電力キャンペーン
        4. 保険:広告メディアチャネル販売
        5. 金融:不正検知
        6. エネルギー:発電量需要予測
        7. 通信:顧客解約予測
        8. 自動車:カスタムモデルの性能改善
    2.2 データの種類とファイルの種類
        2.2.1 量的データと質的データ
        2.2.2 構造化データ、非構造化データ、半構造化データ
        2.2.3 データファイルの種類
        2.2.4 データの処理方法
    2.3 GitHubとGoogle Colab入門
        2.3.1 GitHubを使用したプロジェクトのデータリポジトリ
        2.3.2 Low-Code AIプロジェクトをGoogleのColaboratoryで行う
    2.4 まとめ

3章 機械学習ライブラリと機械学習フレームワーク
    3.1 ノーコードAutoML
    3.2 AutoMLの仕組み
    3.3 MLaaS
    3.4 ローコードMLフレームワーク
        3.4.1 SQL MLフレームワーク
        3.4.2 オープンソースMLライブラリ
    3.5 まとめ

4章 AutoMLによるメディアチャネルの売上予測
    4.1 ビジネスユースケース:メディアチャネルの売上予測
        4.1.1 プロジェクトのワークフロー
        4.1.2 プロジェクトのデータセット
    4.2 Pandas、Matplotlib、Seabornを用いたデータセットの探索
        4.2.1 Google Colab Notebook上で、Pandas DataFrameにデータを読み込む
        4.2.2 広告データセットの探索
    4.3 AutoMLを用いた線形回帰モデルの学習
        4.3.1 Vertex AIを使用したノーコードAI
        4.3.2 Vertex AIの管理するデータセットの作成
        4.3.3 モデル目的の選択
        4.3.4 学習モデルの構築
        4.3.5 モデル性能の評価
        4.3.6 モデル特徴量の重要度(アトリビューション)
        4.3.7 モデルを使用した予測
    4.4 まとめ

5章 AutoMLを使用した不正取引の検出
    5.1 ビジネスユースケース:金融取引の不正検知
        5.1.1 プロジェクトのワークフロー
        5.1.2 プロジェクトのデータセット
    5.2 Pandas、Matplotlib、Seabornを用いたデータセットの探索
        5.2.1 Google Colab NotebookのPandas DataFrameへのデータ読み込み
        5.2.2 データセットの探索
        5.2.3 データセットのエクスポート
    5.3 分類モデルと指標
    5.4 AutoMLを使用した分類モデルの学習
        5.4.1 マネージドデータセットの作成とモデル目標の選択
        5.4.2 データセット統計の調査
        5.4.3 モデルの学習
        5.4.4 モデル性能の評価
        5.4.5 モデル特徴量の重要度
        5.4.6 モデルによる予測
    5.5 まとめ

6章 BigQuery MLを使用した線形回帰モデルの学習
    6.1 ビジネスユースケース:発電所の発電出力
    6.2 BigQueryのSQLを使用したデータセットのクリーニング
        6.2.1 BigQueryへのデータセット読み込み
        6.2.2 SQLを用いたBigQueryのデータ探索
    6.3 線形回帰モデル
        6.3.1 特徴量選択と相関
        6.3.2 Google Colaboratory
        6.3.3 特徴量とラベルの関係を可視化
        6.3.4 BigQuery MLのCREATE MODEL文
    6.4 説明可能なAIの概要
        6.4.1 BigQuery MLによる説明可能なAI
        6.4.2 練習問題
    6.5 BigQuery MLによるニューラルネットワーク
        6.5.1 ニューラルネットワークの概要
        6.5.2 活性化関数と非線形性
        6.5.3 BigQuery MLによるディープニューラルネットワークの学習
        6.5.4 練習問題
    6.6 ディープダイブ:Cloud Shellを使用したGoogle Cloudストレージファイルの表示
    6.7 まとめ

7章 Pythonを用いたカスタムMLモデルの学習
    7.1 ビジネスユースケース:顧客解約予測
    7.2 ノーコード、ローコード、カスタムコードMLソリューションの選択
    7.3 Pandas、Matplotlib、Seabornを用いたデータセットの探索
        7.3.1 Google Colab NotebookのPandas DataFrameへデータの読み込み
        7.3.2 顧客解約データセットの理解とクリーニング
        7.3.3 Pandasとscikit-learnを用いた特徴量の変換
    7.4 scikit-learnを用いたロジスティック回帰モデルの構築
        7.4.1 ロジスティック回帰
        7.4.2 scikit-learnによるモデルの学習と評価
        7.4.3 分類評価指標
        7.4.4 scikit-learnによる学習済みモデルを使用した予測の提供
        7.4.5 scikit-learnのパイプライン:概要
    7.5 Kerasによるニューラルネットワークの構築
        7.5.1 Kerasの概要
        7.5.2 Kerasを用いたニューラルネットワーク分類器の学習
    7.6 Vertex AIによるカスタムMLモデルの構築
    7.7 まとめ

8章 カスタムモデルの性能改善
    8.1 ビジネスユースケース:中古車オークション
    8.2 scikit-learnにおけるモデルの改善
        8.2.1 既存モデルのNotebookの読み込み
        8.2.2 データセットの読み込みと、学習、検証、テストデータの分割
        8.2.3 scikit-learn線形回帰モデルの調査
        8.2.4 特徴量エンジニアリングと前処理パイプラインの改善
        8.2.5 ハイパーパラメータチューニング
    8.3 Kerasによるモデルの改善
        8.3.1 Kerasの前処理層の概要
        8.3.2 モデルのデータセットと前処理層の作成
        8.3.3 ニューラルネットワークモデルの構築
        8.3.4 Kerasのハイパーパラメータチューニング
    8.4 BigQuery MLのハイパーパラメータチューニング
        8.4.1 中古車オークションデータの読み込みと変換
        8.4.2 線形回帰モデルの学習とTRANSFORM句の使用
        8.4.3 BigQuery MLのハイパーパラメータチューニング設定
    8.5 大規模モデルでハイパーパラメータチューニングを行う際の選択肢
        8.5.1 Vertex AIトレーニングとチューニング
        8.5.2 Amazon SageMakerによる自動モデルチューニング
        8.5.3 Azure Machine Learning
    8.6 まとめ

9章 AIの旅路、次の章へ
    9.1 データサイエンスの深掘り
        9.1.1 非構造データの取り扱い
        9.1.2 生成AI
        9.1.3 説明可能なAI
    9.2 ML運用
    9.3 継続的学習と評価
    9.4 まとめ

付録A Vertex AIを使う
    Vertex AI Studio画面のアクセス
        Google Cloud Platformコンソールを開く
    Google Cloud Platform無料枠の利用
    予算とアラートの作成

索引