有限会社GIPU(東京都渋谷区、代表取締役:原田吾一)は、Qwen3-0.6Bをベースに継続学習・強化学習(RL)を施した日本語強化モデル「Qwen3-0.6B_WBD」をHugging Faceにて公開いたしました。
大規模言語モデルの普及が進む一方、スマートフォンやブラウザ上でプライバシーを保ちながら動作する小型日本語モデルは依然として限られています。本モデルは「端末の中でAIが動く」世界を身近にすることを目標に開発しました。0.6Bという極めて小さなモデルサイズにおいて、日本語能力・推論能力・日常会話能力の3点を同時に引き上げることに取り組みました。
| モデル | JCommonsenseQA | JNLI | JSTS | JSQuAD | 平均 |
|---|---|---|---|---|---|
| Qwen3-0.6B(ベース) | 62.40% | 32.20% | 17.20% | 76.00% | 46.95% |
| Qwen3-0.6B_WBD(本モデル) | 59.60% | 72.60% | 35.60% | 82.00% | 62.45% |
JNLI(自然言語推論)が32.2% → 72.6%(+40.4pt)、JSTS(意味的類似度)が17.2% → 35.6%と大幅に改善。JCommonsenseQAのわずかな低下は、知識・語彙が増えた結果、微妙なニュアンスで迷いが生じるケースが増えたためです。
なお、NTTのtsuzumi(0.6B)など同サイズ帯の日本語特化モデルも存在しますが、上記ベンチマークの具体的な数値を公開しているモデルは少なく、同一条件での直接比較は現時点では困難です。本モデルは再現可能な評価条件を公開しています。
| 項目 | 内容 |
|---|---|
| 機種 | AQUOS sense4 basic A003SH |
| 発売日 | 2020年11月19日(約5年前の廉価スマートフォン) |
| OS | Android 12 |
| SoC | Qualcomm Snapdragon 720G(オクタコア) |
| RAM | 3GB |
| 動作速度 | 17.20 t/s |
※ 現時点でのスマートフォン動作はPC経由のケーブル転送が必要です。一般向けアプリとしての配布はまだ行っていません。
なお、本モデルは経済産業省の国産基盤モデル登録申請を予定しています。