スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

スポンサー広告
行き止まりか
なんだかんだでのーべんばー。
11月ですな。
朝はもう息が白くなります。


さぁ、前回の振りよろしく今日は卒研の話。
中間発表以降はプログラムのアルゴリズム変えたり数値変えたり色々やってます。
理解度もかなり上がっていると思います。
システム関数的に表現するとこんな感じ。

(インパルス+白色雑音)→[PARCOR係数]→合成音声

システム関数っつうのは、数式に表すことができそうにない事柄を無理矢理関数にして、つまり計算できるようにして表したものです。
y=f(x)みたいな、「関数fに変数xを入れるとyになって出てくる」という関係を作り出すわけです。
つまり、[PARCOR係数]というのは、ようはブラックボックスみたいなもので、箱の入り口に(インパルス+白色雑音)を入れると、出口から人の声が出てきますよ、という意味です。
解りにくいのは重々承知ですが、上手く説明できませんね…でも次に行きます。

人間の声は、まず、肺から吐き出された空気が声帯を震わせ、その振動が空気に乗って口まで伝わります。
その途中で口の形を変えたり、舌を動かすことによって言葉として解る音になるのです。
簡単に言うと、私たちは、「声帯」が出した音を「口の中」で反響させたりして「声」を作っていることになります。
そこで先程のシステム関数に戻りますが、インパルスとは声帯が出した音を近似したものなのです。白色雑音は、声帯が振動しない声を近似しています。
そして、PARCOR係数というのは、すごく乱暴に言えば口の形を表すものです。
つまり、このシステム関数は、人間が発声する過程を表しているのです。

で、俺は何をしているのかというと、声帯の振動であるインパルスを作る為の研究をしています。
前までは「残差波形を作る」とか言ってましたが、その表現が変わったこと自体が進歩なわけで、つまり理解度が上がったことを示しています。

なぜ「残差=声帯の振動」なのかはまた次の機会に。
つーか文章だけでは限界を感じます…
でも次のは絵で描いても伝わるかどうか…俺も何となくで理解している程度ですから。でも理論的にはあってるはず。


音声合成の研究をなさっておられる方でフォローして下さる方を随時お待ちしておりますm(__)m
スポンサーサイト

卒研@音声工学  CM(0) TB(0)
万事休すか
ども、いっぱいいっぱいなアキヒトです。
中間発表の予稿の締め切りが明日なんですが、ついに担当教官に会えませんでした
最悪、推敲ナシで予稿集に載ってしまう…
ま、それはそれでいいんですけど。
なにせ発表題目があいまいなままで確認したいんですけどねぇ…


>"ken"さん
ども、おはつですm(__)m
タイトルと本文が乖離してしまっているのにコメントありがとうございます(笑
あの日は雨が降ったので学校に行けなかったみたいな事も言わなきゃいけなかったんですが、どういうわけか…
予稿の方は何とか埋まりそうです。あと一息。

では、最後の一息いってきますm(__)m

卒研@音声工学  CM(0) TB(0)
残差波形生成
はい、卒研の話2回目。
そもそも俺の卒研のことについて何も触れてないですね。


コンピュータに喋らすってのはどの研究でも一緒なんです。
俺の引き継いだ研究というのは、携帯電話における通話音質向上の技術の流れをくむものでして、それを応用してどうにかしてやろうって感じです。
中間発表まであと2週間。発表の予稿締め切りまで10日。
もう時間が余りありません。
で、昨日さっそく卒研の方向性を伺うために指導教官のもとへ行きました。
久しぶりに会いました



卒研@音声工学  CM(2) TB(0)
1/f
ハイ、今日から始まります。卒業研究略して卒研のコーナーですよヽ(・∀・)ゝ

卒研@音声工学  CM(2) TB(0)
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。