ほんやくコンニャク。
「『ことば』を理解するコンピュータ」(永田亮先生)
予習する暇がなかったので,予備知識のないまま聴講しました。
内容(プレゼンファイル)は非常によく検討されている様子でしたが,語りが淡々としておられたせいか,受講生の中にはちょっと船を漕ぎかけている方もおられたのが少々残念。
でも,最近テキストマイニングに興味を持っているlionusとしては,自然言語処理入門として非常に興味深く聴きました。
- ことばはあいまい・例外が多い⇔コンピュータはあいまいさや例外が苦手。
- ことばは無限(つまり造語が可能)⇔コンピュータは有限(メモリ等)。
- どうなったらことばを理解したといえるのだろうか?うわ,素朴ながら根本的な問題提起だわ。理解するということ自体を分かっていない・・・のでは。
- ことばの理解を柔軟に捉える必要がある。例えば英語教育では何をもって理解のテストとしているのか:英文和訳(翻訳できたら理解できているとみなす),内容に関する質問して答えられたらOKとする,(文法等の)誤りの指摘が出来るか。
- いくつかのWeb上のサービスを紹介しておられました。URL一覧を示して欲しかったです。以下,講義中デモンストレーションされたもので,ググったりして分かった分:
- 質問応答システム MinerVA-N(Web文書から「名前や数値・日時」を探す):デモンストレーションでは,甲南大の場所を尋ねたところ,どこかの駅の中みたいな検索結果が出てきて笑えてしまった。機械は人間と違って「常識」がないので,そのような結果もそのまま返してしまう。
- 可算/不可算の判定に基づいた英文誤り検出システム
- 日本語構文解析システム KNP