■■■■■メールマガジン;六車技術士事務所■■■■■  2018.12/3

■「単なる」キーワードの出現頻度を数えるものか?

 概念検索のことを、
「単なるキーワードの出現頻度で類似度を判断している」だけで、
大したものじゃない、と思っていませんか?

 私も概念検索と付き合いだした最初の頃(2000年前後)には
そのように考えていました。
いま考えると「単に」というのは間違いだと断言できます。


なぜそう言えるのか?

◆まず第一にコンピュータと言うものはそういうものである。

コンピュータは「単に」0と1の足し算引き算をしているに過ぎないものです。

しかし、現在では社会全体のインフラを支え、人間の寿命さえコントロールし、遺伝子解析や組み換えとして生物を改造するようなことを支え、さらにAI処理として人間の気付かない観点で最適な回答を見つけることさえやっています。
人間の感情を読取って反応するロボットも出てきています。

それらのすべての基礎は、0と1の計算でしかありません。


◆人間と違うやり方でも同じ目的を達成できる

機械(コンピュータ)は人間とは違うやり方で世の中を理解し反応します。

私はよく引き合いに出すのですが、飛行機は鳥のように羽根を動かすことはしませんが、空を飛んで人間を遠くに運んでくれます。

機械は、対象物を単純なことに分解し、膨大な回数繰り返すことが得意です。
コンピュータは単に0と1の足し算するだけじゃないか、と言って高度な処理ができないものと無視するのは間違っています。ソフト次第で、または使い方次第で、ものすごく高度なことを行ないます。

すでに、その特徴を生かして早く利用した者だけがそのメリットを享受して、素晴らしい研究成果を上げ、金儲けし、長生きできる世の中になっています。

特許明細書の類似度を処理する概念検索は、そのやってることはキーワードらしきものに切り離して「単に」その出現頻度をカウントすることです。ところが、それを使って高度な処理も進んでいます。


◆人間が忘れた面も補足してくれる

検索式は、指定したキーワードの有無だけを処理するものなので重要なキーワードを指定し忘れると漏れやノイズが大きくなります。

ところが概念検索の場合は、質問文に重要なキーワードを入れることを忘れても、それが入っていた場合とほとんど違わない検索結果を得ることが期待できます。

例えば「GPS信号とジャイロデータを使う芝刈り機」という質問文で概念検索をした場合、下記のようなキーワードが入ってないことが気になることがあります。

「自走式」、「自律走行」、「自律航法」、

しかし、これらを入れた質問文でも検索結果はほとんど同じです。

なぜそうなるのか?

GPSとジャイロと芝刈り機が出てくる特許であれば、とうぜん自走式であり、自律走行するものだから、「自走式」などのワードはあってもなくても同じ結果になるわけです。

つまり、検索者が「自走式」を入れ忘れたことをシステムが補完しやってくれるような効果が期待できるのです。

このような面を見ると、概念検索自体が一種のAIシステムと言えるかもしれません。


以上のような見方で、概念検索のことを「単なるキーワードの出現頻度で類似度を判断している」だけなので「つまらないもの」と考えると間違うことになると考えています。


--- <広告> --------------------- 

知ってましたか?、概念検索は無効資料調査に最も適しています。

概念検索の無料セミナーを開きたい方、詳細は下記URL。
 ⇒ http://www.patentcity.jp/merumaga/2018019.htm
---------------------------------

◆今回の記事は面白かった!と思った方はワンクリックしてください。
  (クリックしても何も義務はないし、誰なのか分かりません)
  http://clap.mag2.com/kaethihaet?20181203
----------------------------------------------
◆過去のメルマガ一覧
  http://www.patentcity.jp/merumaga/index.htm
発行元 六車技術士事務所/六車正道
  http://www.patentcity.jp/muguruma/index.htm
メール http://www.patentcity.jp/mailtomug.htm
----------------------------------------------