WORLD

English

Introduction

WORLDの概要 (TANDEM-STRAIGHTとの違い)

WORLDは,肉声と区別できないほど高い品質での音声合成を実現するために作られた音声分析合成システムです. TANDEM-STRAIGHTの計算コストを削減するというコンセプトで開発され,現在はほぼ等価な品質を達成しています. 歌声合成における高さや音色の修正であれば計算コストの面からもWORLDのほうが適していますが,子音の制御の柔軟性ではTANDEM-STRAIGHTのほうが優れています. どちらかが良いというスタンスではなく,用途に応じて使い分ける別系統のものと位置付けています.

【重要】 最新版(0.2.0)で実装したD4Cにより,全ての条件においてTANDEM-STRAIGHTを上回る上位互換となりました.

WORLDによる音声処理

WORLDは,図のように音声から基本周波数,スペクトル包絡,非周期性指標(励起信号は0.2.0から廃止となりました)と呼ばれる3つのパラメータを高精度に推定する方法,および3つのパラメータから音声を合成する合成法から構成されます. 推定された3つパラメータを独立に操作することで,例えばイントネーションの変換等が可能です. また,音声の個人性や感情等のパラ言語・非言語情報の統計的性質を明らかにするためのパラメータとしても有効だと考えられます.