この記事の要点: dotData, Inc.は、業務テキストデータから意味を抽出して構造化する「dotData TextSense」の最新バージョン1.3を発表しました。新バージョンでは、大規模言語モデル(LLM)とローカルの機械学習モデルを組み合わせた「ハイブリッドラベリング」を搭載。これにより、大規模なテキストデータのラベリング運用コストを大幅に削減し、データを外部に送信しないセキュアなローカル環境での運用を可能にします。
発表内容のポイント
- LLMとローカルモデルを併用し、大規模データのラベリングコストを大幅に削減
- ローカル環境で実行可能なため、機密性の高いテキストも外部送信せず安全に処理
- データパイプラインや定期バッチ処理に組み込みやすいPython版として提供
発表の背景
営業日報や顧客の声、サポート履歴など、製造現場や保守業務で蓄積されるテキストデータには重要な情報が含まれています。近年はLLMを用いたテキスト分析が進む一方、データ件数が増えるにつれてAPI呼び出しコストが膨らむ課題がありました。また、機密情報や顧客情報を含むテキストを外部のLLMサービスへ送信することに対するセキュリティやデータガバナンス上の懸念から、本番運用への適用が難しいケースが存在していました。
何が発表されたのか
最新版の「dotData TextSense 1.3」では、ラベル設計時にLLMを活用しつつ、運用フェーズでは構築したローカルモデルをPythonライブラリとしてローカル環境で実行する仕組みを導入しました。これにより、すべてのデータをLLMで処理する必要がなくなり、高い品質を維持したまま高速かつ低コストでラベリングが行えます。同社の実証実験では、約100万件のデータに対してLLM単体での処理と比較し、約98%の精度を維持しながらコストを約100分の1に抑えられたとしています。
製造業・生産管理への見方
製造業の現場では、日々の作業日報、設備トラブルの報告書、顧客からのクレームや問い合わせなど、多くのテキストデータが蓄積されています。これらは設備保全の効率化や品質改善のヒントとなる宝の山ですが、機密性の高い社外秘情報や顧客情報が含まれるため、クラウド上のLLMへの送信が制限されるケースが多々ありました。今回の新バージョンは、オンプレミス環境や閉域網などのセキュアなローカル環境で動作させることができるため、製造現場の機密データを安全に、かつ低コストで構造化・分析する仕組みとして、製造業DXや生産管理の高度化に貢献します。
現場で確認したいポイント
- 自社で蓄積している日報やトラブル報告書などのテキストデータ量と、分析にかかる想定コスト
- 社内セキュリティ規定において、外部LLMサービスへのテキストデータ送信が許可されているか
- 既存のデータパイプラインやバッチ処理システムに、Python版ライブラリを組み込めるシステム環境か
確認しておきたい点
コスト削減効果(最大1/100)や精度(約98%)は、同社が特定の財務報告書データ約100万件を用いて実施した実証実験に基づく試算値であり、扱うテキストの性質やデータ量、使用するモデルによって実際の効果は異なる可能性があります。
関連リンク
- dotData TextSense 詳細ページ:製品の機能や詳細な仕様を紹介するページ
- dotData, Inc. 企業サイト:dotDataの企業情報や提供サービス一覧
- dotDataのPR TIMESページ:同社の過去のプレスリリース一覧
出典情報
| 出典 | PR TIMES |
|---|---|
| 発表企業 | dotData, Inc. |
| 発表日時 | 2026-06-23 12:00:02 |
| 元記事 | PR TIMESで読む |