スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

スポンサー広告
行き止まりか
なんだかんだでのーべんばー。
11月ですな。
朝はもう息が白くなります。


さぁ、前回の振りよろしく今日は卒研の話。
中間発表以降はプログラムのアルゴリズム変えたり数値変えたり色々やってます。
理解度もかなり上がっていると思います。
システム関数的に表現するとこんな感じ。

(インパルス+白色雑音)→[PARCOR係数]→合成音声

システム関数っつうのは、数式に表すことができそうにない事柄を無理矢理関数にして、つまり計算できるようにして表したものです。
y=f(x)みたいな、「関数fに変数xを入れるとyになって出てくる」という関係を作り出すわけです。
つまり、[PARCOR係数]というのは、ようはブラックボックスみたいなもので、箱の入り口に(インパルス+白色雑音)を入れると、出口から人の声が出てきますよ、という意味です。
解りにくいのは重々承知ですが、上手く説明できませんね…でも次に行きます。

人間の声は、まず、肺から吐き出された空気が声帯を震わせ、その振動が空気に乗って口まで伝わります。
その途中で口の形を変えたり、舌を動かすことによって言葉として解る音になるのです。
簡単に言うと、私たちは、「声帯」が出した音を「口の中」で反響させたりして「声」を作っていることになります。
そこで先程のシステム関数に戻りますが、インパルスとは声帯が出した音を近似したものなのです。白色雑音は、声帯が振動しない声を近似しています。
そして、PARCOR係数というのは、すごく乱暴に言えば口の形を表すものです。
つまり、このシステム関数は、人間が発声する過程を表しているのです。

で、俺は何をしているのかというと、声帯の振動であるインパルスを作る為の研究をしています。
前までは「残差波形を作る」とか言ってましたが、その表現が変わったこと自体が進歩なわけで、つまり理解度が上がったことを示しています。

なぜ「残差=声帯の振動」なのかはまた次の機会に。
つーか文章だけでは限界を感じます…
でも次のは絵で描いても伝わるかどうか…俺も何となくで理解している程度ですから。でも理論的にはあってるはず。


音声合成の研究をなさっておられる方でフォローして下さる方を随時お待ちしておりますm(__)m
スポンサーサイト

卒研@音声工学  CM(0) TB(0)

COMMENT


 管理者にだけ表示
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。