top of page
執筆者の写真清彦 山崎

めちゃくちゃ使える?!CoeFont(声フォント)...でも、知らないと過労◯するかも。そうならないための使用テクニック公開!



こんにちは、映像ディレクターの山崎です。

今回はめちゃくちゃホットな案件がありまして、お伝えしたいので記事を書いてみました。


Coefont(こえふぉんと)ご存知ですか?

AIナレーションサービスです。


声をテキストのフォントのように使ってナレーションを読んでもらう


というサービスなんです。


今回このCoefontのCoefontスタンダート(月額4,000円)のサービスを利用させていただいき、おそらく、日本でも有数の声フォント使いになったのではないか?と思ったので、もしこのサービスを利用して何かナレーションを使ってみたいと思われる方の参考になればと記事をアップしました。


このサービス、登録されている声はなんと1万種類!

その中から様々な人を選べます。


気になるAI精度ですが…なかなかいい感じ!及第点です。


Youtubeなどで使用する場合はそれでOKなんですが…プロのナレーターに代わってお客様に納品するような場合にはそうはいきません。


CoeFontの弱い部分をまとめます。

良くも悪くもAIがやっているということです。

これは今後このサービスが学習していけば改善する可能性があると思いますが、現状ではAIにすべて任せてしまうのは非常に危険です。

ではどのような対策があるか?をそれぞれ紹介します


1. 固有名詞(それに準ずるもの)のアクセントが前後の文脈で変わってしまう


対策1:

まず、固有名詞をひらがなにします。

入力画面の一番右側のグラフのボタンをクリックし、抑揚をカスタマイズします。


通常はプレイボタンを押すと1回で再生されますが、2回分必要です(お金がその分かかってしまうのかもしれません「誰か検証した方教えて下さい」)


対策2:

ユーザー辞書に登録する

ユーザー辞書荷登録することが出来ます。この時抑揚をつけることが出来ます。



2. BSをバスストップとよんだり、TRFがタミヤレーシングファクトリーだったり、以前利用したユーザー辞書に取って代わられてしまう


対策1:

ひらがな・カタカナに変えます。実はひらがなとカタカナでニュアンスが微妙にかわることがあります。AIを使って素早く〜であればそういったことも行ったほうがいいですが、より細かく行う場合は先ほどの抑揚カスタマイズをおすすめします。


対策2:

ユーザー辞書に登録する

ユーザー辞書荷登録することが出来ます。ただし、反映には少し時間がかかるのか、筆者が使ったときはすぐには反応しませんでした。



3. AIで間を勝手に入れてしまう


対策:

結構優秀な学習をしていて、呼吸音などしぜんな間のつくりを行っているのですが、AIが裏目に出るパターンです。このときはセンテンスごとに句読点【、】や筆者はカギカッコの片側【「】(カギカッコの方が句読点より短い間の時があった)を先に指定して入れておくと勝手な間がなくなることが多いです。

実はCoeFontは間に関して句読点ぐらいしか開ける方法がなく、ニュアンスを厳密にする場合は編集用ソフト(音声・動画)などで修正する必要があります



4. 不適切ワードに認定されてしまう言葉がある


対策:

出戻りというワードが不適切でした。工業機械などでは出戻りという単語は日常的に使用する単語ですが、日常的には不適切ということなのでしょう。コンプライアンスの壁が厳しいと作品をつくるということが非常に困難になりますね。


こういった部分もあるので、プロのナレーターはまだまだ必要だと思います。

むしろ需要が増える?という気さえします。



5. 言葉が消えてしまう


対策:

ナレーターに頼んでも読み違いや飛ばしなどは起こってしまうものです。AIもひょっとするとそのあたりを再現しているのかも?とはいえ、気がついたら「ひらがな」でしていしてあげましょう。


実はナレーターによって金額が異なるようです。聴いた話(裏は取っていないです)では漢字は5ポイント、ひらがなは1ポイント利用するとのことです。

クレジットなしで使えるスタンダードプランは月額4,000円で月8万文字までです。もしそれ以上使う場合でもクレジット決済で買い足せます。



感想とまとめ


テキストのように声を扱うというコンセプトは最高ですが、テキストにはFEPと言われる文字を入力した際に下に小窓がでてきますが、CoeFontの場合はテストレンダリングをします。このテストレンダリングをして確認するというパターンなので丁寧にやっていると


めちゃくちゃ時間がかかります。


筆者は1時間の作品を頼まれて、なんと声だけで3日間修正にかかりました(産業革命時のイギリスの少年のようでした)


「(受注者の私が)お金払うからプロのナレーター使ってください」


と言いたくなるほど辛く長い時間を過ごすことになってしまいました。

まだまだAIには完璧な声のフォントとして代わりをさせるのは厳しいのが現状です。


しかし筆者がこれは使えるかも?


と思った分野は


  • 1分間程度のショートプロモーション

  • 文字がおかしい部分を気にしないで使うYoutube

  • 5分以内の社内プロモ


です。比較的間違いが許される分野ですね。

使ってはいけない分野は


  • お客様に見せるもの(この辺は徐々にハードルが下がりそうですが)

  • 長い時間の作品


です。

これらは


プロのナレーターにやってもらう方がいいです!


弊社ではやってみたら大変すぎた…という悲劇を生み出さないための仕組みのご相談業務も行っております。


実際にやってみたいんだけどどうしたらいい?

という事がありましたら是非弊社へご相談ください。


教育研修動画制作20年の弊社では、今までの経験と知識で人手が少なくなった現代においてより安価にスマートに制作を行えるシステムをご提供します。



閲覧数:39回0件のコメント

Comments


bottom of page