次世代日本語Voice AI Agentモデル「VoiceCore」を公開
感情表現と非言語音声で自然な音声対話を実現

2025年7月18日

有限会社GIPU

有限会社GIPU(東京都渋谷区、代表取締役:原田吾一)は、AIが自然な日本語を発声可能にする商用利用可能なVoice AI Agentモデル「VoiceCore」を公開いたしました。

開発の背景

従来のTTS(Text to Speech:音声合成)ソフトウェアは、文章を正確に読み上げることに重点を置いていました。一方、VoiceCoreは、AIが人間と音声を使った意思疎通を行うために設計されており、非言語音声や感情表現が可能であることが特徴です。

主な特徴

技術仕様

モデル名
webbigdata/VoiceCore
ベースモデル
canopylabs/orpheus-3b-0.1-pretrained(Llamaアーキテクチャを利用)
パラメータ数
37億(3B)
推奨GPU
bf16推論時:約8GB以上のVRAM
音声サンプリングレート
24kHz
パフォーマンス
RTX 4060Ti(bf16):約40 tokens/sec
RTX 3090(bf16):約100 tokens/sec
※リアルタイム会話には70 tokens/sec以上を推奨

利用可能な音声タイプ

VoiceCoreには6種類の音声タイプが含まれており、それぞれ異なる特徴と利用条件があります。商用利用の際は、各音声の提供元のライセンス条件をご確認ください。

今後の展開

現在、以下の機能拡張を計画しています:

公開場所

VoiceCoreは、Hugging Faceにて公開しています。
URL: https://huggingface.co/webbigdata/VoiceCore

サンプルボイス

VoiceCoreのサンプルボイスは以下で公開しています。
URL: https://webbigdata.jp/voice-ai-agent/

会社概要

会社名
有限会社GIPU
所在地
〒150-0001 東京都渋谷区神宮前六丁目23番4号 桑野ビル2階
事業内容
AIソリューションの開発・提供、AI導入コンサルティング、AI教育・研修サービス
会社ウェブサイト
https://gipu.app/
運営ウェブサイト
https://webbigdata.jp/

本件に関するお問い合わせ先

有限会社GIPU
お問い合わせフォーム: https://webbigdata.jp/webbigdata/inquiry