Showcase Gig Blog

Watson Retrieve And Rank について(概要編)

こんにちは。ディレクターの永田です。
本日はWatsonの Retrieve & Rank(通称:R&R) について調べましたので、発表いたします。皆様の参考となれば幸いです。

R&Rとは何?

R&Rとは検索&ランク付けという機能で、Apatch Solrをベースとした検索機能と、Watsonによる機械学習モデルによるランク付けを提供しています。
もっと簡単に言うと、「質問に対して回答を関連度順で返してくれる」機能です。
入力の質問から検索して関連しそうな項目を上げるだけでなく、訓練データからより質問に関係しそうなものを順番に上げてくれるところがかしこいところと言えると思います。

randr_1

R&Rやり方(ざっくり)

1. Solrのコンフィグレーションを行います。

【Solr】Solrの各種設定ファイルについてにあるような設定ファイルを作ってSolrに設定します。
こいつがいきなりキツいですがIBMさんがサンプルのデータを用意してくれていますので安心してください。
get startedのcranfield_solr_config.zipがサンプルです)

2. 回答一覧を用意し、R&Rに設定します。

下記にような形式を用意します。

randr_2

3. 回答に対する質問を用意してR&Rを訓練します。

下記のような形式のデータを用意するのですが、質問に対する回答とそのスコアを設定します。
複数当てはまる回答の場合は横につなげて書いていきます。
この質問データはある程度量が必要なようです。

randr_3

4. あとは設定したデータに質問をぶつけるだけです。

randr_4

設定

次号に続きます。

参考

コメントは受け付けていません。