英語の発音とARPAbet

今週末にTokyoNLP #6で発表させていただくことになりました。
で、その下準備をしていましたが、論文の内容や線形回帰よりも、音素や発音の話の比重のほうが多くなりそう…。
発音上は、母音はopennessとかbacknessの2パラメータ+円唇/非円唇ぐらいを気をつけておけばよい、とか、そういうことは話そうと思います。

で、英語の母音について調べていました。英語の母音には、方言によって色々なmerger(音を区別しないこと)があって、結局、初学者には「どの音とどの音を最低限区別する必要があるのか」が分かりにくいのです。そこで思いついたのが、「とりあえず、Text-to-speech(音声合成)の分野で区別されている音は区別して発音があるのではないか」という発想です。

早速調べてみると、音声合成をする前に、発音すべき音素をコードするための記法としてwikipedia:en:ARPAbetというのがあるらしいです。とりあえず日本語母語話者にとって一番分かりにくそうな単母音の項を見てみると…


Arpabet IPA Word examples
AO ɔ off (AO1 F); fall (F AO1 L); frost (F R AO1 S T)
AA ɑ father (F AA1 DH ER), cot (K AA1 T)
IY i bee (B IY1); she (SH IY1)
UW u you (Y UW1); new (N UW1); food (F UW1 D)
EH ɛ red (R EH1 D); men (M EH1 N)
IH ɪ big (B IH1 G); win (W IH1 N)
UH ʊ should (SH UH1 D), could (K UH1 D)
AH ʌ but (B AH1 T), sun (S AH1 N)
AH ə sofa (S OW1 F AH0), alone (AH0 L OW1 N)
AX ə discus (D IH1 S K AX0 S); note distinction from discuss (D IH0 S K AH1 S)
AE 〓 at (AE1 T); fast (F AE1 S T)

wikipedia:en:IPA_chart_for_English_dialectsなどに比べて、シンプルでとてもわかりやすい!1のあるところがアクセント位置だそうです。

日本語には母音の長短(vowel length)の区別があるので(雪と勇気の「う」の発音時間の長さの違い)、IHとIYのように、長さが明らかに違うものは日本語母語話者には区別がしやすいはずです。逆に、注意しなければならないのは、日本人には全て「あ」に聞こえてしまいがちな、AE, AH, AX, AAを聞き分け・発音し分けられるようにすることが最も重要そうである、と考えられます。