この記事の要点: リアルタイム音声AI基盤モデルを開発するKotoba Technologiesは、シードラウンドにて追加で1,000万米ドル(約16億円)の資金調達を実施しました。同社が開発する音声基盤モデル「Koto」は、日本語・韓国語・中国語において業界最高水準の性能を持ち、超低遅延の音声認識や音声合成を実現します。今回の資金調達により、オンデバイス展開やエッジチップ上での効率的な動作、顧客先への導入支援をさらに強化する方針です。
発表内容のポイント
- 超低遅延の音声基盤モデル「Koto」により、2秒未満の同時翻訳や音声認識を実現
- データセンターだけでなく、スマートフォンやウェアラブルなどのオンデバイス展開に対応
- APIアルファ版とPython SDKを公開し、外部システムや機器への組み込みを容易に
発表の背景
製造業やサービス業をはじめとするグローバルなビジネス現場では、多言語間でのリアルタイムな意思疎通や、ハンズフリーでのシステム操作に対する需要が高まっています。しかし、音声AIのリアルタイム処理や東アジア言語への最適化は技術的難易度が高く、実用的な低遅延モデルの登場が待たれていました。同社はこうした課題を解決するため、東アジア言語に特化した高速・高精度な音声AIの開発を進めています。
何が発表されたのか
同社の音声基盤モデル「Koto」は、音声対音声(S2S)モデルに加え、超低遅延の音声認識(ASR)および音声合成(TTS)モデルとして利用可能です。すでにFortune Global 500企業などで本番運用されており、AI音声エージェントやウェアラブルデバイス、同時翻訳アプリ「Kotoba」などに活用されています。今回、開発者向けにAPIアルファ版とPython SDKを公開したことで、企業は自社のシステムやデバイスに「Koto」の音声機能を容易に組み込めるようになりました。
製造業・生産管理への見方
製造業の生産現場や保守点検の現場において、音声AIは「ハンズフリー操作」や「外国人労働者とのコミュニケーション円滑化」を推進する強力なツールとなります。特に「Koto」が注力するオンデバイス展開は、通信環境が制限される工場内やエッジデバイス上での稼働を可能にするため、セキュリティやリアルタイム性を重視する製造現場に適しています。自動車や電子機器、AIウェアラブル端末といったハードウェアへの組み込みが進むことで、現場作業のDXや作業マニュアルのリアルタイム音声翻訳など、生産管理の効率化に寄与することが期待されます。
現場で確認したいポイント
- 自社の工場や作業現場における、音声入力によるハンズフリー操作の導入余地
- エッジデバイスやオンプレミス環境で動作する音声AIモデルのセキュリティ要件
- 外国人スタッフとの意思疎通や技術伝承における、リアルタイム同時翻訳の活用可能性
確認しておきたい点
プレスリリースに記載されている「2秒未満の遅延」や「業界最高水準の性能」は、特定の検証環境における実績値であり、実際の製造現場の騒音環境下における認識精度や動作安定性については、個別での検証や導入支援を通じた確認が必要です。
関連リンク
- 発表企業サイト:Kotoba Technologiesの公式ウェブサイトです。
- 関連ページ:同社の事業内容やサービス詳細を紹介するページです。
- 発表企業のPR TIMESページ:同社のプレスリリース一覧が確認できます。
出典情報
| 出典 | PR TIMES |
|---|---|
| 発表企業 | 株式会社Kotoba Technologies Japan |
| 発表日時 | 2026-06-24 09:00:02 |
| 元記事 | PR TIMESで読む |