機械学習とは

  • データから学習し、明示的にプログラムされていなくてもパターンを認識し予測を行う技術
  • 人間が明示的なルールを設定するのではなく、データから自動的にルールを学習
  • AIの中核技術の一つ

機械学習の種類

1. 教師あり学習

  • 入力と正解(ラベル)のペアを使って学習
  • 例:メールスパム分類、画像認識、不動産価格予測
  • 主な手法:
    • 回帰分析:連続値を予測(例:価格予測)
    • 分類:カテゴリを予測(例:スパム/非スパム)

2. 教師なし学習

  • 正解ラベルなしでデータのパターンを発見
  • 例:顧客セグメンテーション、異常検知
  • 主な手法:
    • クラスタリング:類似データのグループ化
    • 次元削減:データの特徴を少ない変数で表現

3. 強化学習

  • 試行錯誤と報酬に基づいて最適な行動を学習
  • 例:ゲームAI、自動運転、ロボット制御
  • 環境との相互作用を通じて方針を改善

ディープラーニング

  • 多層のニューラルネットワークを用いた機械学習手法
  • 特徴:
    • 自動的な特徴抽出能力
    • 大量のデータと計算リソースが必要
    • 複雑なパターン認識に優れる
  • 応用例:
    • 画像認識・生成(CNN)
    • 自然言語処理(RNN、Transformer)
    • 音声認識・合成

自然言語処理(NLP)

  • コンピュータが人間の言語を理解・生成する技術
  • 主要タスク:
    • テキスト分類(感情分析、トピック分類)
    • 情報抽出(固有表現抽出、関係抽出)
    • 機械翻訳
    • 質問応答
    • 文書要約
    • 対話システム
  • 発展の歴史:
    • ルールベース → 統計的手法 → ニューラルネットワーク → 大規模言語モデル

法務分野での機械学習応用

  • 文書分類:契約書の種類分類、条項の分類
  • 情報抽出:契約書から重要条項や日付の抽出
  • 類似文書検索:類似判例や先例の検索
  • 予測モデル:訴訟結果予測、リスク評価

次回予告:LLMの概要と仕組み

  • 大規模言語モデルとは
  • Transformerアーキテクチャ
  • 事前学習とファインチューニング
  • トークン化と生成プロセス