NEWSお知らせ
社内データを活用した、言語モデル開発について
2024.10.04
SBヒューマンキャピタル株式会社では、社内で長年にわたって蓄積してきたデータを活用すべくAI技術の研究として言語モデル(Phi-3 small)のファインチューニングを行い成功しました。
本プロジェクトは、社内のビジネス課題に対してAIをどのように適用できるかを模索し
タスクに応じた応答生成の実現を目指すものです。
言語モデルのファインチューニングを通じて、社内データを活用するモデルの構築を目指し、ビジネス領域においてAI技術の活用可能性を広げるための知見を蓄積しています。
本研究の主な目的は、
社内データを活用し、言語モデルを使ったAIモデルのファインチューニングを行うことで、そのモデルの実用性と限界を評価し今後のビジネス応用に役立つ知見を得ることです。
この取り組みは社内人材のみで実施し、弊社の技術力および内部リソースを最大限に
活用することを目指しています。
本研究では社内データの特性を分析し、
それに基づいて言語モデルのファインチューニングを行いました。
また、実施環境はクラウド上のGPUを活用して初期構築しました。
Phi-3 smallモデルを用いたファインチューニングを行い、言語モデルの性能を検証しました。
更に、Mixture of Experts(MoE)モデルの技術をベースにしたモデル構築を行いました。
複数のファインチューニングを行うことで、回答精度の向上を目指しました。
◇高精度なモデルの構築
社内で蓄積されたデータを最大限に活用し、SLMによる業務効率化を目指したモデル開発に成功しました。
◇新たな応用可能性の発見
本研究を通じて、AI技術を新たな業務領域に応用するための発展的なステップが確認され、今後の技術的応用範囲がさらに広がることが示されました。
これにより弊社は更なる業務最適化に向けた技術展開が可能となります。
◇クラウドベースでの構築
高価なH100などのGPUを物理的に購入する必要はなく、クラウドサービスを活用して初期構築ができました。
◇クラウド上での構築期間
クラウドサービスを活用したことで、ファインチューニング環境を容易に構築でき、45日間という短期間でモデル構築に成功しました。
今回の研究を通じて、言語モデルのファインチューニングに関する基礎的な知見を得られたことは大きな成果です。
応答生成の安定性、また様々なデータセットを用いた学習プロセスにおける限界も明確となり今後の課題や改善の方向性が明らかになりました。
これにより更なる追加開発に向けた準備が整い、次フェーズでは数値モデル構築へと移行します。
数値モデル構築は高度な技術を要するものの、言語モデルとの組み合わせによって数値解析に強いAIモデルを実現することを目指しています。
これまでに得られた知見を活かし、データの多様性やタスクの特性に合わせたアプローチをさらに強化することで、実用的なAIモデルの構築に努めます。
今後はタスクに応じた柔軟な学習アルゴリズムを導入し、より高い実用性を備えたAIソリューションの開発を進めていきます。
この取り組みによって弊社のAI技術が企業の意思決定や業務効率化に貢献し、ビジネスの成長を支える新たなソリューションとして採用されることを目指します。