Macにも対応している読み上げソフト「VOICE PEAK(ボイスピーク)」を導入しました!!

 前から検討していた読み上げソフト「VOICEPEAK(ボイスピーク)」を導入しました。Macの場合は読み上げソフトの選択肢が無い状況でしたが3月に「VOICEPEAK」がリリースされたことで光明が指しました。導入までの経緯や使用感などを以下に書いていきますが非常にオススメできる読み上げソフトだと思います。

チュートリアル達成で25%オフクーポンが入手可能なので税込11,850円で購入可能です。

VOICEPEAKとは?

概要は上の動画を見ていただくのがわかりやすいと思います。最新のAI音声合成技術を駆使して手軽にテキスト読み上げが可能というソフトです。

 機能としては入力したテキストの読み上げ、音声合成、イントネーション調整などがあります。また、喜怒哀楽のプリセットが用意されているので大まかな調整ならこれだけで形になります。

 実際にテキストを打ち込んで読ませたのが上の動画。こんな感じで入力するかテキストを貼り付ければそれなりのものができます。

個人的に思うVOICEPEAKの利点

 このソフトの凄いところはこの一つのアプリで「女性3名・男性3名・女の子の7名分の声が使える」という点です。例えばVOCALOIDなどは1つのソフトで1つの声という構成です。さらに男性ボイスも用意されているので汎用性が高いと言えます。

 さらに「商用利用可能」なので使用場面の制約を受けない点も大きな魅力です。商用利用する気がなくとも作成した動画をどういう場所・場面で流すかで規約に引っかかるケースも考えられます。中には商用利用の場合は別途ライセンス料が必要というソフトもあります。特に公的な場面でも使用する場合は権利関係を侵害するのは自他共に大きなリスクとなります。それらを考えながら動画編集するのは非常にストレスです。そういったことを気にせずにそうが編集で使用できるのもVOICEPEAKの大きなメリットと言えるでしょう。

Macユーザーには読み上げソフトの選択肢がほとんど無い状況

 私はたまにYouTubeにサイクリング動画などを投稿していますが以前から「ゆっくり音声」や「VOCALOID」のようなナレーションを入れたいと思っていました。ナレーションがあった方が視聴される方に対して親切だと思ったからです。これは自分自身、他の投稿者の動画を見ていてもそう感じた次第。(ちなみに地声という選択肢は無しです)

 ところがいざ読み上げソフト導入を考えた時にMac環境だと先に触れた「ゆっくりムービーメーカー」などゆっくり音声系や「VOCALOID」は対応していません。Macで使用可能なソフトの情報をググっても「MacにBootCampやパラレルでWindowsを導入する」という方法しか出てきません。現実的な選択肢としては「音読さん」を使うくらいしか方法がありませんでした。

*私のリサーチが甘い可能性があるので他にも良い選択肢があると思います。

 以上の経緯から音読さんでナレーションを入れることもありました。ただ、音声書き出しまでの作業がやや煩雑だったことやイントネーション、声の種類で不満がありました。特に煩雑に感じた音声出力作業は10分程度の動画でも非常に時間と手間がかかり後述のVOICEPEAKでの出力作業がすごく簡単に感じます。そのため最近はほぼ使用していませんでした。

 以上のようにMac環境での読み上げソフトのラインナップはほぼ音読さんのみという状況でしたがVOICEPEAKの登場で大きく前進したと言えます。

実際に動画作成時使用してみた

 実際に作りかけの動画にVOICEPEAKでナレーションを作成して完成させたいと思います。動画の字幕のために作ったテキストを準備。音読さんでは字幕スライドごとに「テキスト貼り付けて読ませて保存」を繰り返しました。この作業がものすごく手間でした。一度に全部貼り付けて読ませると修正が大変になるのでこの方法しかなかったのです。

 VOICEPEAKではテキストのインポートができるので作成したテキストファイルを読ませます。改行・タブ・スペースでブロック区切りを指定できるので全部繋がってしまうということはありません。今回は改行でブロック分けされています。

 辞書登録で単語と読み方を登録できますが今回は都度、修正して調整しました。イントネーション調整はどれだけ時間があるかによりますが全部やるとキリがないのである程度割り切ります。今回は主に固有名詞の読み間違いの修正に留めています。また、感情を強調したいセリフ(ブロック)のみ喜怒哀楽プリセットで設定しています。ちなみに上部ツールバーの「顔アイコン」でファイル全体の喜怒哀楽プリセットを事前に調整できます。まだ調整の余地がありますが「幸せ10%・楽しさ50%」が自分が求めるテンションに近いです。

 試しに両方を80%程度にして喋らせましたが薬か何かで決まってしまったような危ないテンションになってしまったのでやり過ぎはダメですね……。

 一通り調整が終わったら後は書き出せば音声データの出力は完了。ブロックごとに分かれていた方が使いやすいので「ブロックごとに分割して保存」にチェックを入れます。命名規則も指定できます。

 あとは出力したボイスデータを動画編集ソフトで配置・調整すればナレーションしてくれます。

 完成した動画がこちら。まだ調整の余地もありますがそこまで設定をいじらなくてもそれなりに整ったものができると思います。特に喜怒哀楽プリセットの存在が大きいと思います。Macの読み上げ機能や音読さんではできない感情表現ができるので「いかにも機械が喋っっている感」を軽減できます。

Macユーザーにもオススメの使いやすくコスパ抜群の読み上げソフト

 VOICEPEAKでナレーションを付けてみましたが従来の方法よりも簡単にできて感動しました。もちろんゆっくりムービーメーカーと比べると字幕スライドは別途準備が必要など手間はあります。しかし、使い方はとてもわかりやすいので使う人を選ばないとお思います。また、Macの読み上げ機能や音読さんだとどうしても「声の固さ」があったのですがそれを改善できたと思います。

 もうMacでは「ゆっくり音声」や「VOCALOID」のようなナレーションは無理だと思っていたのでVOICEPEAKが発売されて非常に助かりました。私のようにMacユーザーで音声読み上げソフトを探している方には大変オススメできるソフトです。(Macユーザーの場合は選択肢の余地が無いだけですが………)

 記事冒頭で触れた通りチュートリアル達成で25%オフクーポンが入手可能なので税込11,850円で購入可能です。ポイント還元もあるので検討されている方はお早めに導入されることをオススメします。