« Nature 2/2 | メイン | 大規模シミュレーション »

2006年02月22日

Nature 2/22

Efficient auditory coding
Evan C. Smithand Michael S. Lewicki

声音などの音の波形は、けっこう複雑な形をしている。

でももし、音の波形が、何個かの関数の足し合わせで表現できたとすると、音を情報として伝達するのに都合がよい。

つまり、音の波形 x(t) を、ある kernel function φ1,・・・, φmを使って表したい、とする。すなわち、

 x(t) = Σm Σi smi φm (t - τmi) + ε(t)

と書きたい(論文中式1)。(ε(t) は残差。)では、どのような kernel function を選べば、x(t) を最適に表現できるだろうか?

この問題に対して、音 x(t) が自然界の音であったり、人の声であったりするとき、学習アルゴリズムによって最適な kernel 関数の組をもとめる方法を開発したのが Lewicki NN 2002 論文みたい。これを彼らは「population spike code」と呼んだりしています。

それで、今回の論文では、この最適化学習アルゴリズムによって得られた kernel function と、ネコの auditory nerve の impulse response function(つまり生理学的データ)を比較してみたら、実にそっくりだった(Fig2a、赤(kernal)と青(実データ))、という話。つまり、auditory nerve の impulse response function は、自然界の音や音声などの音情報を伝達するのに、最適な kernel である、という結論。

(この論文では、auditory nerve の impulse response function を「revcor filter」と呼んでいるのですが、このあたりの話は僕は不勉強でよく知りません。。)


補足
Probabilistic Models of the Brain: Perception and Neural Function (eds Rao, Olshausen & Lewicki, MIT Press, 2002) の第12章にも、「population spike code」の話がありますね。

投稿者 sfujisawa : 2006年02月22日 22:13

コメント

コメントしてください

サイン・インを確認しました、 . さん。コメントしてください。 (サイン・アウト)

(いままで、ここでコメントしたとがないときは、コメントを表示する前にこのウェブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)


情報を登録する?