lionusの日記(旧はてなダイアリー)

「lionusの日記」http://d.hatena.ne.jp/lionus/としてかつてはてなダイアリーにあった記事を移転したものです。

情報検索と言語処理 (言語と計算)(検索といえば最近はWeb検索かもしれませんが。)

情報検索と言語処理 (言語と計算)

情報検索と言語処理 (言語と計算)

文書の検索と(自然)言語処理についての研究書(概説的)です。
様々な研究が紹介されています。
やっぱり数式がいっぱい出ていてちんぷんかんぷんなのですが,所々はっとするところがありました。

情報要求(information need)
ユーザがある目的を達成するために現在持っている知識では不十分であると感じている状態

本書では,Taylor(1968)による情報要求に関する4階層の分類を紹介しています。

Q1:直観的要求(visceral need) 現状に満足していないことは認識しているが,それを具体的に言語化してうまく説明できない状態。
Q2:意識された要求(conscious need) 頭の中では問題を意識できるが,あいまいな表現やまとまりのない表現でしか言語化できない状態。
Q3:形式化された要求(formalized neeed) 問題を具体的な言語表現で言語化することができる状態。
Q4:調整済みの要求(compromised need) 問題を解決するために必要な情報の情報源が同定できるくらい問題が具体化された状態。

ユーザは情報を探したいと思ったときに,何を探すのかについて必ずしも明確にそれを言語化しているとは限らない,ということです。
言われてみれば当たり前なのですが,言語化できるかどうかが,情報検索における最初の高いハードルなんだと思いました。
例えば,「調べ学習」みたいなことを課題に組み入れた時に,学生が調べることをどれだけ言語化できるかどうかその程度(能力)を見積もった上で,ヒント等を与えるかなど準備を考える必要があります。
他には,Bates(1990)による,検索過程におけるシステムの関与のレベル(0〜4)と検索過程における行動のレベル(1〜4)の組み合わせにより,情報検索システムをどこまで(あるいはそのどの部分を)自動化すべき/できるか(あるいは自動化しない部分を残すべきか)の議論を紹介していたのが面白かったです。
研究協力者としていただいている先生が,エキスパート・システムみたいなものを使ったシステムを作ろうとされているのですが,全部お任せで”できちゃう”ことを目指しているのか,もしそうなら,それってどうなん?と漠然とした違和感を感じていたことに関係するように思ったからです。