サービスイメージ

パナソニック システムソリューションズ ジャパン株式会社は、放送業界に対して、音声処理・音声認識技術を活用した文字起こしサービス「P-VoT(ピーボット)」をマスメディア業界(放送、新聞、出版等)向けに正式商用サービスとして2019年11月13日から提供を開始する。サービス価格は、1コンテンツあたりの時間長を基準とした従量制で、20円/10秒(10秒未満は切上げ積算)。

現在、放送局をはじめとするマスメディアの業界では、事件・事故・災害など報道現場の速報性や正確性が求められている一方で、業界における不規則な労働や長時間労働など働き方における改革が課題となっている。同サービスは、動画・音声ファイルをパナソニックのクラウドサービスにアップロードするだけで、文字起こしを自動化することが可能。番組制作業務のワークフローのなかで時間と手間がかかる文字起こし作業を、約3分の1の時間に削減可能だとしている。

また、今回の商用サービス化に伴い、2019年6月13日から提供していたベータ版の利用者アンケートであがった要望を反映させた編集画面のユーザーインターフェースを改良。制作現場に寄り添ったシステムとして、マスメディア業界の働き方改革に貢献していくとしている。サービスの特長、ベータ版からの改良点は以下の通り。

(以下、プレスリリースより引用)

【サービスの特長】

1.高精度音声認識による文字起こし
多層のニューラルネットワーク(Deep Neural network:DNN)技術(AI技術)を用いた高精度音声認識により、幅広いジャンルの文字起こしに対応します。

2.グループデータ管理により複数人での修正・編集
現場担当者がリクエスト(アップロード)、事務所での修正・編集担当者が認識結果を確認・編集できます。また認識の完了・結果の通知は登録されたユーザのみに通知され、担当者間による個別メールでの送付がないため、利便性と安全性を兼ね備えた情報管理・運用が可能です。

3.ウェブブラウザで利用可能
インターネットに接続したウェブブラウザでのリクエスト(アップロード)から、テキストの修正作業まで行うことが出来ます。特別な機器・設備を必要とせず導入が可能です。

4.効率的な修正インターフェース
編集画面では文字をクリックすると、文字起こしした音声の位置から頭出し、プレビュー再生を開始します。再生中はプレビュー動画/音声に追従して音声認識結果にマーキングします。煩わしい映像・音声から発声位置を探しだす作業もクリックひとつで、効率的な文字起こしの編集作業が可能です。

5.プロダクトとシステム連携によるさらなる効率化(将来対応予定)
当社のプロダクトとシステムと連携することで、運用ワークフローとシームレスな連携を予定しております。

【ベータ(β)版からの改良点】

1.動画・音声ファイルのマルチアップロード対応
動画・音声ファイルを複数(同時に最大5ファイルまで)アップロードすることが可能になり、アップロードにかかる時間を削減しました。

2.編集画面のユーザーインターフェースの改良

レイアウトイメージ

(1)タイムコードの設定
タイムコードを設定(オフセット計算)することで、アップロードした動画・音声ファイルとのタイムコードを合わせることが可能になりました。 確認・編集後に修正結果をダウンロードするデータは、オフセットで計算後のデータになり、様々なシステムでの活用が容易になります。

(2)編集画面のユーザーインターフェースの改良
編集画面では30秒おきの時間区切り(セクション)にレイアウトを変更。メモ情報欄を設けることで申し送り事項、補足情報などを追記することが可能になりました。

(3)複数人による分担作業のサポート
編集作業において複数人で分担作業を行う場合に、時間区切り(セクション)毎に編集担当者が「編集ロック」を掛けることが可能になりました。セクション単位での分担作業による誤編集を抑止します。

なお、P-VoTは、2019年11月13日から11月15日(金)まで幕張メッセで開催される国際放送機器展「InterBEE2019」の同社ブース(ホール2/ブースNo.2514)にて展示予定。