ここ数日、優れないお天気で舌が、今日の東京都江戸川区は朝から気持ち良く晴れています🌞
気温もグンと上がり、本日の最高気温は24℃となっています。明日は更に気温が上がるみたいです。急な気温の変化にまだ身体が慣れていないので、熱中症にはくれぐれも気を付けて水分をしっかり摂るようにしましょう💡
以前、友人と電話しているとき唐突に「ねぇ、電話の声って本物の声じゃないって知ってた?」と友人に言われました。え⁉どういう事⁉と気になって詳しく調べてみる事にしました🔍
スマホの声の正体は《合成音声》
スマホの声は本人の声ではない、というのは本当だそうです。では私たちは何の声を聞いているかというと、スマホの中で“本人の声そっくりにつくられた”合成音声だとの事です。
スマホで通話をする仕組み上、肉声そのままよりも、合成した音声で届けたほうが通信時のデータ容量を軽くできるため、スムーズに音声通信ができるようになります。逆に肉声そのままで音声を送ろうとすると、送信のためのデータ量が膨大になりすぎて回線が重たくなり、事実上通話不可能だそうです。
それでは、スマホで声が届く仕組みについて詳しく見ていきましょう💡
有線・無線はそれぞれの音の届け方が違う
実は固定電話と携帯電話・スマホでは、音声の届け方に違いがあります。それは有線通信と無線通信の違いでもあります。
固定電話の場合、使われているのは「波形符号化方式」という通信方式です。原理としては人が声を発する時、声帯がふるえ、声道を通ることで音声(音波)が出るのと同じで、例えるなら「糸電話」のような仕組みになります。有線(声帯・声道)=糸として考えるとわかりやすいですね。
一方で、携帯電話やスマホのような無線通信の場合は、主に「ハイブリッド符号化方式」という通信方式を使います。話し声は、まずスマホ内でデジタル変換されたあと、「固定コードブック」という“音の辞書”(スマホ内で数学的につくられるもの)から元の声に近い声のパターンが選ばれ、自動合成されます。その音声を電波に乗せ、相手に届けるという仕組みです。さらに受信先のスマホでもまた「届いた声に近い声」に合成され、再生されます。
この“音の辞書”たる固定コードブックとは、声のパターン(音の素の組み合わせ)が入っていて、その数は約43億通りにものぼるのだそうです。また固定コードブックと一緒に「適応コードブック」という音声コードのメモ書きのようなものも参照することで、より元の声に似た声を生成できるとの事。
文章にすると複雑な流れになっていますが、実際はこの「ハイブリッド符号化方式」は「波形符号化方式」よりも通話時のデータ容量が16分の1程度と非常に軽く、回線に負荷がかからないのが大きな特徴です。限られた回線を効率よく使うために開発された技術なんですね💡
SNSアプリで使われる音声は?
現在は電話だけでなく、LINEなどのSNSアプリをはじめとしたさまざまな通信手段が増え、それにともない無線技術も進化してきています。
SNSアプリでの音声通話の場合は「ハイブリッド符号化方式」「波形符号化方式」のほか、音楽向けの符号化方式も採用されているそうです。無線でも有線並に大きなデータを送受信できるようになってきており、容量を軽くする必要性が薄れてきているのです。
スマホ通話音声も、今は容量を軽くするための合成音声がメジャーですが、より原音に近くなっていくのはもちろん、さらに声だけを際立たせる、臨場感を持たせる……など、個人の好みに合わせた音声方式が開発されていくと考えられています。
スマホの声が本人の声ではない、というのは正直とても驚きでしたが、私たちが気づかないうちに音声技術はどんどん進化しているんですね。「つながる」ことがますます重要性を帯びてきている今だからこそ、声が届くことの大切さについて今一度、振り返ってみてもいいかもしれませんね🎵