機械学習とは
- データから学習し、明示的にプログラムされていなくてもパターンを認識し予測を行う技術
- 人間が明示的なルールを設定するのではなく、データから自動的にルールを学習
- AIの中核技術の一つ
機械学習の種類
1. 教師あり学習
- 入力と正解(ラベル)のペアを使って学習
- 例:メールスパム分類、画像認識、不動産価格予測
- 主な手法:
- 回帰分析:連続値を予測(例:価格予測)
- 分類:カテゴリを予測(例:スパム/非スパム)
2. 教師なし学習
- 正解ラベルなしでデータのパターンを発見
- 例:顧客セグメンテーション、異常検知
- 主な手法:
- クラスタリング:類似データのグループ化
- 次元削減:データの特徴を少ない変数で表現
3. 強化学習
- 試行錯誤と報酬に基づいて最適な行動を学習
- 例:ゲームAI、自動運転、ロボット制御
- 環境との相互作用を通じて方針を改善
ディープラーニング
- 多層のニューラルネットワークを用いた機械学習手法
- 特徴:
- 自動的な特徴抽出能力
- 大量のデータと計算リソースが必要
- 複雑なパターン認識に優れる
- 応用例:
- 画像認識・生成(CNN)
- 自然言語処理(RNN、Transformer)
- 音声認識・合成
自然言語処理(NLP)
- コンピュータが人間の言語を理解・生成する技術
- 主要タスク:
- テキスト分類(感情分析、トピック分類)
- 情報抽出(固有表現抽出、関係抽出)
- 機械翻訳
- 質問応答
- 文書要約
- 対話システム
- 発展の歴史:
- ルールベース → 統計的手法 → ニューラルネットワーク → 大規模言語モデル
法務分野での機械学習応用
- 文書分類:契約書の種類分類、条項の分類
- 情報抽出:契約書から重要条項や日付の抽出
- 類似文書検索:類似判例や先例の検索
- 予測モデル:訴訟結果予測、リスク評価
次回予告:LLMの概要と仕組み
- 大規模言語モデルとは
- Transformerアーキテクチャ
- 事前学習とファインチューニング
- トークン化と生成プロセス