https://www.supertone.ai/api
-
「Supertone API」クローズドベータテスト開始···AI音声技術を他サービスに連動させる形で導入可能に
-
TTS APIを皮切りに、今後は歌唱合成音声·音声変換技術などへの拡張予定
AIオーディオ企業のSupertoneは12月23日、自社の技術を各種プラットフォームやアプリケーションなどに連携できるようサポートする「Supertone API」をクローズドベータテスト(CBT)形式で公式ウェブサイトにて公開しました。「Supertone API」CBTは、日本語にも対応しています。
API(Application Programming Interface)は、互いに異なるソフトウェア間でデータをやり取りし、機能を共有できるようにする仕組みです。開発者が他のサービスで提供するデータや機能を、自社サービスに取り込むことができるようになります。
最初にAPIで提供されるAI音声技術は、テキストを音声に変換する「Text-to-Speech」(TTS)です。 Supertoneが独自に開発した音声合成基盤モデルNANSY(Neural Analysis & Synthesis)が適用されたSupertoneのTTS技術は、自然で豊かな感情を表現した音声を作り出せることが特徴です。NANSYを通じて、音色・発音・音高(ピッチ)・アクセントの4つの構成要素を調整し、実際の人の発話に近い声を具現化することができます。
TTS APIは対話型ゲームのキャラクター製作やオーディオブック、アニメーション、チャットサービスなどTTS技術を必要とする誰もが活用することができます。特にSupertoneは既存のNANSYモデルの改善により、テキストが音声で出力されるまでの時間を減らし、チャットボットのように即時的な音声フィードバックが必要なサービス開発を容易にしました。
今回のAPI公開に先立ち、SupertoneはインタラクティブAIコンテンツプラットフォーム「zeta」を運営する韓国のScatter Lab社と協業し、TTS技術をAPIで提供しています。11月初めにzetaはユーザーが自らAIチャットボットキャラクターを製作し、声をつけることができる機能を公開しました。これに連動しているSupertoneのTTS技術がユーザーのサービス体験の満足度を高めています。
今後、Supertoneは「Supertone API」において、TTS技術だけでなく、歌唱合成音声技術(Singing Voice Synthesis)や音声変換技術(Voice Conversion)なども追加していく計画です。
Supertone代表のイ・ギョグは、「Supertone APIはSupertoneのAI音声技術の活用の幅を広げ、商用化を加速させる契機になるだろう」とし「ビジネスパートナー社だけでなく個人または小規模なコンテンツクリエイターもAPI形態でSupertoneのAI音声技術を導入し、より簡単で豊かにサービス製作ができるようになることを願っている」とコメントしています。
※参考
「Supertone API」ユーザーガイド:https://docs.supertoneapi.com/ja/user-guide/welcome
【Supertoneとは】
Supertoneは2020年3月に設立されたAIオーディオ技術企業です。現在、HYBEの子会社として様々なメディア分野で最先端のオーディオ技術を提供しています。2022年、HYBE傘下レーベルであるBIGHIT MUSICと、ゲーム事業を展開するHYBE IMと協業して「MIDNATT」プロジェクトを行いました。また、Disney+のドラマシリーズ「カジノ」やNetflixの「マスクガール」などの主人公の声にAI技術を取り入れ、技術力を披露してきました。
2023年にSupertoneが発表したリアルタイムAIノイズ除去プラグイン「Supertone Clear」は198の国と地域のポストプロダクションエンジニアやビデオ編集者、配信者、ミュージシャン、レコードプロデューサーなどのクリエイターに広く受け入れられ、11月のリリースからわずか半年で27,000人以上の月間アクティブユーザーを獲得しました。これに続いて2024年にリアルタイム音声変換サービス「Supertone Shift」を公開し、SupertoneはAI技術企業の域を超え、コンテンツクリエイターに創作ツールを提供する企業へと進化を遂げています。