備忘録的な何か

研究内容とかプログラミング関連とか趣味(オーディオなど)とかそのへんのことを書いていければいいな

情報処理学会全国大会(2016)一日目(1R)

というわけで会場に来ています。

面白いセッションがいくつかあったので紹介。ただ会場で走り書きしてるため、聞き間違いや聞き逃し、思い違いがあることは否めず、そこまでの正確性は保証できないのであしからず。

一つ目:

雑談対話における未知語や属性の獲得のための質問生成

これまでのシステムの雑談はユーザの発言に対してオウム返しに聞き返したり、無難な返答をすることが多い。例えば、

ユーザ:ラーメン食べたい

システム:ラーメンはおいしいですね

みたいな。ラーメンをそのまま継続してオウム返しに使用している。これでは面白くないだろ、という思想がこの研究の根底にある。

 

ユーザ:バーニャカウダを食べた

システム:バーニャカウダってなんですか

 

このようにシステムが知らない言葉(=未知語)を尋ねるときにオウム返しに聞き返されるばかりでは面白くない。ちなみにこのような聞き方を「明示的確認」と定義されていた。

誰しも一度くらい、知らない言葉が会話中に出てきて、「あー、あれね!」みたいな感じで知ったかぶりをしたことがあるだろう。それで会話をごまかして続けていって、なんとなくどのようなものだったか察するという作戦。この作戦は「暗黙的確認」と定義されていて、これをシステムにやらせようというのが本研究の内容だ。

未知語に対してクラスタリングを行い、どのようなジャンルのものかを予測し、それを元に会話を生成すると都合がよい。

 

ユーザ:バーニャカウダを食べた。

システム:イタリアンはおしゃれなご飯が多いですね。

ユーザ:そうだね

 

システムは「バーニャカウダ」を知らないけど、ユーザ発話の「食べた」という発話から「食べ物」と予測でき、さらに文字の響きからなんとなーく「イタリアン」だと予測し、例のような発話を生成する。

提案されていた手法は、

  1. いくつかの言葉を人手でラベリングし、それを教師として機械学習を行う
  2. 未知語に対し適応し、予測する

このようなシンプルな手段である。

一つおもしろいのが、最下層のクラスタリング結果を採用するのではなく、中間層のクラスタリング結果を採用する点である。以下例。

 

バーニャカウダを食べた→パンは美味しいですよね(パンという最下層クラスを用いたが誤り)
バーニャカウダを食べた→洋食はおいしいですよね(洋食という中間クラスを用いると正解)

 

例のようにパンという最下層のクラスを用いると範囲が狭すぎて誤りとなってしまうが、中間クラスを用いることでクラスの幅が広がり、誤った返答が行われなくなるという利点がある。誤った返答をしてしまうと対話破綻に陥るため、正しい返答を行うことは非常に重要である。

とはいえ、焼きそばパン、といったものは焼きそばパンの「そば」に引っ張られて和食とクラスタリングされてしまったとのこと。

 

発表では言及されていなかったが、辞書を改良することで解消されそう。もしくは複数の名詞が組み合わさった名詞にはある程度重みを与えて解析にブレが生じないようにすると良いかもしれない。いずれも辞書をいじる必要がありそうだ。

 

心に響く励まし文の自動生成

つらいときに慰めてくれるシステム。斬新だ。実際これが実現できると人間味が増すのではないだろうか。

とはいえ文の自動生成は骨が折れる。通常のシステムは自力で文章を生成できないからだ。

そこで本研究では、名言とされる文章を構文解析・頻度解析を行うことで、名言テンプレートを作成し、ユーザ発話からヒントを得て励まし文を作成するというアプローチを取っている。

例えば、「AにBするよりも[だからこそ]、CにDがある」 (Aには名詞、Bには動詞、Cには名詞、Dには形容詞(プラスの意味)が入る)

というテンプレートが生成されたとする。これを元に次の対話を見てみよう。

 

ユーザ:試験に落ちた

システム:試験に受かるよりも、勉強の過程に価値がある

 

このシステムはユーザが落ち込んでいるという前提で作られているため、落ちるの対義語の受かるを当てはめて、「試験に受かる」という文章を作成する。これをN-gramに当てはめ、その前によく使われている「勉強」という言葉を得て、これをユーザが行っていたと予測し、上記のテンプレートに当てはめていく(分かりにくい説明ごめんね)。

このような手法で作られたシステムの発話は、主観評価であるが、人が作成した文章と遜色ないという結果がでたとのこと。

 

ただセッション後の質疑応答での指摘もあったが、主観評価以外のデータも欲しいところではある。難しいんだけどね。

 

まとめ

発表のしかたなど、とても参考になった大会でした。後日もうちょっとまとめて再アップロードするかも。