フォルマントとは?音色や母音の違いをわかりやすく解説

AIの初心者
「フォルマント」ってなんですか?音色と関係がある言葉なんでしょうか。

AI専門家
フォルマントは、音の中で特定の周波数帯が強く響いている部分のことだよ。声や楽器の「その音らしさ」を見分ける手がかりになるんだ。

AIの初心者
同じ「あ」でも人によって違って聞こえるのは、そのフォルマントが違うからですか?

AI専門家
その通り。低い周波数側から第一フォルマント、第二フォルマントのように見ていくと、母音の違いや声の個性、楽器の音色の特徴を整理しやすくなるよ。
フォルマントとは何か
フォルマントとは、音のスペクトル上で特定の周波数帯が周囲より強く現れる部分のことです。声や楽器の音には、ひとつの周波数だけでなく、複数の周波数成分が混ざっています。その中で、共鳴によって目立って強くなる帯域があり、この山のような部分をフォルマントと呼びます。
たとえば同じ高さの音をピアノ、バイオリン、フルートで鳴らしても、私たちは別の楽器として聞き分けられます。音の高さが同じでも、どの周波数帯がどれくらい強く響くかが違うためです。人の声でも、同じ「あ」を発音しているのに話者ごとに声色が違うのは、声道の形や発声の違いによってフォルマントの位置や強さが変わるためです。
フォルマントは低い周波数側から順に、第一フォルマント、第二フォルマント、第三フォルマントのように呼ばれます。特に母音の識別では、第一フォルマントと第二フォルマントの組み合わせが重要な手がかりになります。

音のスペクトルを知るとフォルマントが見えてくる
音は空気の振動として耳に届きます。振動の速さは周波数と呼ばれ、単位はHzで表します。低い周波数は低い音、高い周波数は高い音として感じられますが、実際の音はひとつの周波数だけでできているわけではありません。
音を周波数ごとに分解し、それぞれの強さを並べたものが音のスペクトルです。横軸に周波数、縦軸に強さを置いたグラフをイメージするとわかりやすいでしょう。スペクトルを見ると、基本となる周波数だけでなく、その整数倍にあたる倍音や、楽器・声道の共鳴によって強調された帯域が見えてきます。
ここで注意したいのは、フォルマントは単に「一番高い音」や「基本周波数そのもの」ではないという点です。基本周波数は音の高さに強く関係します。一方、フォルマントはどの周波数帯が響きやすいかを表し、主に音色や母音の違いに関係します。
| 用語 | 意味 | 初心者向けの見方 |
|---|---|---|
| 基本周波数 | 音の高さの中心になる周波数 | 声や楽器の「高い・低い」に関わる |
| 倍音 | 基本周波数の整数倍にあたる成分 | 音の豊かさや明るさに影響する |
| スペクトル | 周波数ごとの強さを表したもの | 音を分解して眺めるグラフ |
| フォルマント | 共鳴によって強く出る周波数帯 | 音色や母音を見分ける山のような特徴 |
スペクトル包絡とフォルマントの関係
スペクトルを細かく見ると、倍音による小さな山と谷がたくさん並びます。ただし、音色を大まかに理解したいときは、ひとつひとつの細かい山だけを見るより、全体の盛り上がり方を見るほうが役に立ちます。
この全体的な輪郭をスペクトル包絡と呼びます。細かいピークの頂上をなめらかにつないだ曲線を想像すると近いです。スペクトル包絡の中で、特に大きく盛り上がっている部分がフォルマントとして注目されます。
人の声では、声帯で作られた音が喉、口、鼻などの声道を通る間に、特定の周波数帯だけが共鳴して強調されます。楽器では、胴体、管、空洞、材質などが共鳴の仕方を決めます。つまり、フォルマントは音源そのものだけでなく、音が通る空間や響く構造によって形づくられる特徴です。

第一フォルマントと第二フォルマントの見方
フォルマントは、低い周波数から順に第一フォルマント、第二フォルマント、第三フォルマントと呼ばれます。英語の資料ではF1、F2、F3のように表記されることもあります。初心者はまず、第一フォルマントと第二フォルマントに注目すると理解しやすくなります。
第一フォルマントは、母音では口の開き具合と関係して説明されることが多い要素です。口を大きく開ける母音では第一フォルマントが変化し、口を狭くする母音とは違った響きになります。第二フォルマントは、舌の前後位置と関係して説明されることが多く、舌を前に出すか後ろに引くかで母音の聞こえ方が変わります。
ただし、これは概念理解のための整理です。実際のフォルマント周波数は、話者の声道の長さ、年齢、性別、発声方法、録音環境、分析方法によって変わります。固定された数値を暗記するより、低い周波数側からピークを読み、複数のフォルマントの組み合わせで音色を考えることが重要です。

母音のフォルマント
日本語の「あ・い・う・え・お」は、口の形や舌の位置がそれぞれ異なります。声帯で生まれた音は、声道を通る間に共鳴します。口を大きく開ける、舌を前に出す、唇を丸めるといった動きによって声道の形が変わり、強調される周波数帯も変わります。
たとえば「あ」は口を開いた響き、「い」は舌が前に出た響き、「う」は唇や舌の位置によってこもった響きになりやすい母音です。この違いは、第一フォルマントと第二フォルマントの組み合わせとして観察できます。私たちは日常的にはグラフを見ていませんが、耳はこの違いを手がかりに母音を聞き分けています。
同じ母音でも、人によって完全に同じフォルマントになるわけではありません。声道の長さや形、話し方、声の出し方が違うためです。この個人差が、声の個性や話者らしさにもつながります。

| 観点 | 関係しやすい要素 | 聞こえ方への影響 |
|---|---|---|
| 口の開き | 第一フォルマント | 開いた母音と狭い母音の違いに関わる |
| 舌の前後位置 | 第二フォルマント | 前寄り・後ろ寄りの響きの違いに関わる |
| 声道の個人差 | 複数のフォルマント | 話者ごとの声色や個性に関わる |
楽器のフォルマント
楽器の音色にもフォルマントは関係します。楽器が音を出すとき、基本となる音だけでなく多くの倍音が同時に鳴っています。その倍音のどこが強く響くかは、楽器の形、材質、空洞、管の長さ、共鳴胴の構造などによって変わります。
同じ高さの音をバイオリンとフルートで演奏しても、音色は大きく違います。バイオリンでは弦の振動が木製の胴体で響き、フルートでは管の中の空気が振動します。この共鳴構造の違いが、強調される周波数帯の違い、つまり楽器ごとのフォルマントの違いとして現れます。
楽器製作では、材質や形状、厚み、空洞の大きさを調整して、望ましい響きを作ります。フォルマントは音作りのすべてを説明する唯一の要素ではありませんが、楽器ごとの「らしさ」を考えるうえで重要な観察点です。

AI・音声処理での使われ方
フォルマントは、音声認識、音声合成、話者分析、発音学習、音響分析などの分野で重要な考え方です。AI音声処理では、音をそのまま人間の耳の感覚だけで扱うのではなく、波形やスペクトルから特徴を取り出して処理します。フォルマントは、母音の違いや声質の特徴を説明する代表的な手がかりです。
近年の音声AIでは、フォルマントだけを直接使う単純な方法に限らず、メルスペクトログラムや各種の音響特徴量、ニューラルネットワークによる表現学習も使われます。それでも、フォルマントを理解しておくと、音声データがどのような情報を含んでいるのか、モデルがどのような違いを利用しうるのかを考えやすくなります。
たとえば、発音学習では母音のフォルマントを見て、目標の発音に近づいているかを確認できます。音声合成では、自然な母音や声色を作るために、声道の共鳴に相当する特徴をどう再現するかが問題になります。楽器音の分析でも、音色を分類したり、録音の特徴を比較したりする際に関連する考え方です。
学習するときの注意点
フォルマントを学ぶときは、いくつか混同しやすい点があります。まず、フォルマントは音の高さそのものではありません。音の高さは主に基本周波数と関係し、フォルマントは音色や母音らしさに関わる共鳴の特徴です。
次に、フォルマントは一本の線だけで決まるものではありません。第一フォルマントだけ、第二フォルマントだけを見るのではなく、複数のフォルマントの位置と強さの組み合わせで考えます。特に母音では、第一フォルマントと第二フォルマントの関係が大切です。
また、実測値は条件によって変わります。録音機材、周囲の雑音、話者の声量、分析窓の取り方、ソフトウェアの設定などで、見えるピークは変化します。入門段階では、細かな数値の正確さよりも、スペクトル上の山がなぜ音色や母音の違いにつながるのかを理解することを優先するとよいでしょう。
まとめ
フォルマントは、音のスペクトル上で特定の周波数帯が強く響いている部分です。人の声では声道の形、楽器では共鳴する構造によってフォルマントが生まれ、母音の違いや楽器の音色を聞き分ける手がかりになります。
スペクトル、倍音、スペクトル包絡、第一フォルマント、第二フォルマントの関係を押さえると、フォルマントは単なる専門用語ではなく、音の「らしさ」を説明するための実用的な概念として理解できます。AI音声処理や音響分析を学ぶ場合も、音を周波数成分として眺める基礎として役立ちます。
更新履歴
| 日付 | 内容 |
|---|---|
| 2025年2月1日 | 初回公開 |
| 2026年5月23日 | スペクトル包絡、母音例、AI音声処理での見方を補足 |
