TokyoNLP #6で発表しました〜言語アフリカ起源説〜

6/25にTokyoNLP #6で発表しました。id:nokuno さんがまとめてくださっています。

発表の中身は、世界の音素の多様性が言語がアフリカから広がる時の連続創始者効果を表しているという、Scienceの論文 を読むというものです。
僕自身、「この言語とこの言語には関連があるんじゃなかろうか」とか思ったときは、確かにまず音素を見るので、「音素を考える」という方針は悪くないと思っています。というわけで、音素について話しだしたら、音声学入門みたいな話に…(汗
全く自分の専門ではない話を、しかも言語処理の勉強会でするということで不安だったのですが、興味をもっていただけた方も多いようで、ほっとしています。
時間がオーバー気味だったので、最後の線形回帰とBICのところは端折ってしまいました。まぁ、最初から説明不足な点も多いスライドだったので、ここは、後で補足するかも知れません。

追記:@takeda25さんがスライドの異音のページに間違いを見つけてくださいました。スライドをreplaceしましたが、6/26 23:00現在、まだr反映されていないようです。6/27 5:00に見たら反映されていました。

僕以外の発表の感想はこちら。

@uchumikさん CRFと素性テンプレート

自分の発表の直前なので、あんまり聞けなかった…(汗
CRFと素性テンプレートのお話。
素性テンプレートは、去年、自分もちょっと使ったことがあるが、ちゃんと説明している文献が少ないので、貴重であると思う…と、思ったが、高村本には、そんな話まで載っていたんだっけ(汗
高村本の5章には、素性テンプレートっぽい話が載っているように見えますが、素性テンプレートに関してだけ言えば、やはり、こちらのスライドの方がよく説明されていると思います。

@niam 音素と発音、線形回帰とBICの話〜言語アフリカ起源説(Atkinson, Science 2011)を読む〜

僕の発表。

@shuyoさん はじめての生成文法(後編)

生成文法の色々ある理論が凄く分かりやすく説明されていて、大変おもしろかったです。
結局、やっていることは、「いくつかの言語で文と非文を分けられる文法を構築する」こと。
そうして得られた文法処理能力を、
1)人間が持っていること
2)持っていることを仮定したとしても、さらに生得的に持っていること
については、生成文法は説明が乏しいな、と感じました。

一定の文法処理能力を人間が生得的に持っていることは確かだと思います。
しかし、人間の文法処理が、本当にそのように行われているのかは分からない→真のモデルはよく分からない。さらに、その真のモデルを人間が生得的に持っていることの証明に乏しい。
僕は、実際には脳科学とかで頭の中の処理を見てみないと分からないんじゃね?と思っています。
ただ、文法理論の一部は、計算機で扱い易い構造を持っていたり、語学教育の場で文法を教えるのにもよい性質を持っているので、有用性は高いと思います。

@y_shindohさん 音声認識向け単語N-gram言語モデリング入門 ?今日からあなたも言語モデラー?

音声認識系の話はあまり知らなかったので、おもしろかった…chasenとか、普通に使われているんですね。

@nokuno 統計的機械翻訳入門 その2 ?フレーズベース編?

SMTの話。高次のIBMモデルが何をやっているかのまとめスライドが素晴らしい。