
IBMは2024年10月、大規模言語モデル(LLM)ファミリー「Granite」の新版「Granite 3.0」をオープンソースライセンス「Apache License 2.0」の下で公開した。カスタマーサポート、IT自動化、サイバーセキュリティなどの用途で活用が見込める。どのような機能が強化されているのか。
●“オープンソースAIモデル”Graniteは何ができるのか
Granite 3.0には以下のAIモデルがある。
・汎用(はんよう)言語モデル
|
|
・Granite 3.0 8B Instruct
・Granite 3.0 2B Instruct
・Granite 3.0 8B Base
安全性確保モデル「Granite Guardian」
・Granite Guardian 3.0 8B
|
|
・Granite Guardian 3.0 2B
MoE(Mixture of Experts:大きなAIモデルを複数の専門家に分割する手法)モデル
・Guardian 3.0 3B-A800M-Instruct
・Granite 3.0 1B-A400M-Instruct
・Granite 3.0 3B-A800M-Base
|
|
・Granite 3.0 1B-A400M Base
IBMによると、Granite 3.0の各AIモデルは12個の自然言語と116個のプログラミング言語からデータを集め、12兆トークンを超えるデータで学習した。2024年12月にはバージョン3.1にアップデートし、8B(80億パラメータ)と2B(20億パラメータ)のモデル群については、128K(12万8000)のトークンを一度に読み込めるようになった。2025年には、数値や画像、テキスト、音声など複数種類のデータを組み合わせて、あるいは関連付けて処理できるマルチモーダル機能の搭載を計画している。
Granite Guardian 3.0のモデル群は、開発者がAIモデルの出力をチェックできる保護機能を持つ。これによって開発者は、社会的バイアス(偏見)、ヘイト(憎悪)、暴力、ハッキングなどのリスクに対処できる。
●なぜオープンソースなのか
Granite 3.0は、小規模な言語モデルやオープンソースのAIモデルをベンダーが求める中で登場した。IBMのシニアバイスプレジデント兼チーフコマーシャルオフィサーのロブ・トーマス氏は、Granite 3.0が主要オープンソースライセンスであるApache License 2.0を選んだのには理由があると話す。
調査会社Constellation Researchのアナリスト、アンディー・トゥライ氏は、IBMはAI技術が今後オープンなものになると考えているとみる。「小規模で効率的かつ透明なAIモデルを提供し、倫理に配慮した学習と責任ある開発をすることによって、IBMは他社との違いを打ち出そうとしている」とトゥライ氏は言う。
トゥライ氏は、IBMがAIモデルのライセンス料で収益を得ようとしているわけではないとも語る。代わりに、企業が同社のAI技術関連サービス群「watsonx」を通じてAIモデルを実行、調整したり、新たなAIモデルを構築したりすることを望んでいるという。
「Granite 3.0は前のバージョンに比べて効率と精度が上がっているようだ」と語るのは、アナリスト企業Moor Insights & Strategyのストラテジーアナリスト、パトリック・ムーアヘッド氏だ。その理由として、AIモデルの学習に「ワールドデータ」を用いなかった点をムーアヘッド氏は挙げる。ワールドデータとは、インターネットにある一般公開コンテンツ、エンターテインメント系のメディアコンテンツ、コンシューマービデオ(一般の個人が作成する動画)などから成るデータだ。IBMはそうした一般公開データはなく、ドキュメントやスプレッドシートなど、企業の業務データを用いて学習した。
IBMは他にも、以下の機能強化を実施した。
・Graniteのコーディング特化モデルによる、コーディングアシスタント「watsonx Code Assistant」のアップデート
・「Java」「Python」などのさまざまなプログラミング言語でのコーディングを補助する。
AI技術を活用したコンサルティング支援サービス「IBM Consulting Advantage」の拡充
・主にIBMコンサルタントが、ユーザー企業の課題解決を支援することに用いる。
・標準の言語モデルとしてGranite 3.0を採用する。
※本記事は米Informa TechTargetの記事を翻訳・編集したものです。