information
お知らせ

LOCALLM 2025.12.04

3,ローカルLLMに「知識」ではなく「知恵」を学習させる挑戦

― RAG・QLoRA・スプレッドシート自動化を使った実践アプローチ ―

近年、ローカルLLM(Local Large Language Model)を使って独自AIを育てる動きが加速しています。しかし多くの人が最初にぶつかる壁があります。

「教材テキストを読ませるだけで、本当に賢くなるのか?」

結論から言うと、
それだけでは “知識” は増えても “知恵” は育ちません。

この記事では、

  • 知識と知恵の違い
  • RAG × QLoRA の役割分担
  • 「質問で賢くする」学習設計
  • Googleスプレッドシートを使った自動評価・記録
    まで、実際の試行錯誤をもとに体系化して解説します。

知識と「知恵」はまったく別物

まず重要な前提です。

項目知識知恵
内容情報・事実・暗記思考法・判断法・応用力
増やし方文書を読む問題を考えさせる
RAG向き
学習向き
  • RAG → 必要な「情報」をその場で探す仕組み
  • 知恵 → 問題解決・意思決定・思考プロセスそのもの

つまり今回は、

「知識を詰める」のではなく、「考え方を鍛える」

という方向でLocal LLMを育てる試みになります。


今回の学習思想の核心

今回目指したのは、次の思想です。

資料を読ませるのではなく、質問を投げて考えさせることで賢くする。

これは人間の教育と同じです。

  • 教科書を読むだけ → すぐ忘れる
  • 問題を解く → 思考力が定着する

LLMでも同じ構造が使えます。


採用した学習フォーマット(知恵データセット)

今回作成されたデータは、次の形式です。

{
“question”: “…質問…”,
“reference_answer”: “…模範的な思考プロセス…”,
“local_llm_answer”: “”,
“diff_comment_prompt”: “reference_answer と local_llm_answer を比較して、不足点や改善点をJSON形式で書け.”
}

特徴

  • 単なる正解ではなく
    「思考プロセス」そのものがReference Answer
  • 差分評価もLLMにやらせる
  • 人間は最終チェックのみ

これは「知恵の型(思考フレーム)」を学ばせる設計です。


RAG × QLoRA × 思考学習の役割分担

技術役割
RAG知識の検索・補完
QLoRAモデルの思考特性の微調整
今回の質問学習知恵(判断・構造化・抽象化)の訓練

つまり、

RAG が「図書館」
QLoRA が「脳の調整」
この質問セットが「思考トレーニング」

という構造です。


「知恵を磨く」学習はすでに世界で実証済み

この方向性は決して妄想ではなく、以下はすでに実在します。

  • Chain of Thought(思考連鎖)
  • Self-Reflection(自己内省)
  • Process Supervision(結果ではなく思考過程を学習)
  • Reinforcement Learning from AI Feedback(AI同士で反省会)

今回の設計は、これらの思想を ローカルLLM環境で再現する試み です。


Googleスプレッドシート連携の意味

スプレッドシートでLLMの学習結果を自動記録する仕組み

ただし重要な点があります。

ここでやっているのは「LLMの直接学習」ではない

  • モデルの重みは変わらない
  • あくまで:
    • 回答
    • 模範解答との差分
    • 改善点
      自動記録しているだけ

しかしこれが「再学習データ」になる

  • うまくいった回答
  • ダメだった回答
  • 改善された回答

これらがすべて 後でQLoRA微調整に使える高品質教材 になります。


「再学習データ」とは何か?

再学習データとは、学習成果が思わしくないものを再学習させるためのリストか?

答えは:

その通りであり、かつそれだけではない。

正確には:

種類目的
失敗例苦手分野の補強
成功例得意パターンの定着
改善後思考修正の記録

すべてが「次の学習の材料」になるのが再学習データです。


今回のプロジェクトの本質

最終的に、このプロジェクトの本質はここです。

「正解を覚えさせる」のではない
「考え方をインストールする」

  • 資料を食わせる
    → 知識AI
  • 問題を考えさせ、反省させる
    思考AI(知恵AI)

まとめ

今回の試みを一言で言うと:

「ローカルLLMに人間の“思考訓練”を与える実験」

実践したことは:

  • RAG・QLoRAの役割理解
  • 思考型80問データセット設計
  • Reference Answerとの自動比較
  • Googleスプレッドシートによる記録
  • 再学習データの蓄積設計

これは単なるAI運用ではなく、

「AI教育」そのものです。

ブログカテゴリ
アーカイブ