• 広告を利用しています/紹介製品の価格・スペックは記事作成時点のものです

ブログ通信簿の秘密(2)

写真さっくり淡々とレポート書く予定が、やっぱ結局、長文に・・・。ったく、自分。

さて今回のブロガーイベントの主催はNTTレゾナント株式会社の「gooラボ」。「goo」中心としたNTTグループのネットサービスをつかさどるNTTレゾナントの中で、新サービスに繋がる様々な新技術を開発し、実験的にサービスリリースしているところ。・・・ということみたいだ。

写真

今回のブロガーイベントは「学校風」。

スタッフは全員白衣で、区切りには懐かしのチャイムがなり、プロジェクターが映し出すのは黒板。

一時間目は「先生からのお話」だった。

写真

ちなみに「ブログ通信簿」知らない人もいるかもしれないので、先にこっちを見てもらおう。

●gooラボ「ブログ通信簿」

ここにURLを入力して、最新記事10件からブログの「性質」などを分析してもらうというものだ。ちなみに自分の採点簿はこれ。

写真


ブログ性別:男性


この時点で実際の管理人の性別とは違っているのだが、実を言うと、このブログを初めて偶然訪れた人の多くは、「管理人さんは男性」と思うらしいので、間違っているわけではない。

注:ココログユーザの場合「http://wada.cocolog-nifty.com/」だけだと通信簿でません。「http://wada.cocolog-nifty.com/blog/」など、フォルダ名まで入力必要です。


意見性判定技術

写真

ブログ通信簿の最初の項目「主張度」は、この意見性判定技術がベースになっている。
「主に文末に含まれる表現をもとに、文が意見を表しているかどうかを判定する技術」とのこと。

NTTレゾナントというか、NTTグループでは、昔からずっと日本語解析技術の研究が行われている。最近だと文章から意味を理解&分析するなんて技術の研究が進んでいるみたいだけど、自分は門外漢なので、「セマンティック」とか流行りのキーワードしか知らない。

でもちょっと興味ある。
自分たちが毎日めっちゃ使い続け頼り切っている検索エンジンの裏側でどんな小人さんたちが動いているのかなあと。

今回このブロガーイベントに参加したのも、そんな好奇心があったからだ。

写真

「意見性判定技術」についてもわかりやすく説明してくれた。

上記は「これは意見と判定される」語尾の一例。
評判・推量・要望・主張と4つのカテゴリが書かれているが、実際にはもっとたくさんのカテゴリがあるそうだ。

技術もすごいんだろうけど、
判定に使うための辞書を作り上げてゆくのも大変な作業そう。


評判情報抽出技術

写真

次に紹介されたのが、通信簿の「気楽度」のベースとなる「評判情報抽出技術」。
ネットで語られている口コミを分析するというのが大きな当初の目的というか狙いだったというような話があったので、ここがメインの技術の部分なのか。

「残念」「おいしい」など、「ブログ記事の中から評判を表す表現を抽出して、ポジティブ/ネガティブに分類する技術」とのこと。これは、大学の研究室などでも結構研究対象になっている部分で、これまでも実験的なサイトが登場している。

質問タイムの時に聞いたら、この技術のために辞書に登録されているキーワード数は数万語にのぼるそう。

ちなみに「ブログ通信簿」では、ポジティブな表現のほうが多いと「気楽度」があがるらしい。自分は「3」で、可もなく不可もなくって感じか。


Eigen Rumor(アイゲン・ルーモア)

写真

なぜかここ突然ドイツ語???よくわからないんだけど、これはgooラボ生まれではない、ブログランク付けアルゴリズム。

●「goo」が口コミ検索を強化、評判情報を自動抽出して分析可能

多数のブログで引用(リンク)されているブログはすごく、すごいブログからたくさんリンクされているブログはさらにすごい・・・と書くとなんだか、あまりに単純な仕組みみたいに見えてしまうが、実際はもっと複雑で「すごい」んだろう。

このアルゴリズムは、「gooブログ検索」の中で実際に使われているそうなので、さっそく何か検索してみよう。


●gooブログ検索で「牛の着ぐるみ」を検索!


あ、ほんとだ。
ちゃんとスコアが5段階で表示されている。

ついでに、「評判情報のみ」で検索対象を絞り込んだら、自分のレビュー記事が1番目にでてきた。minaさんのブログもスコア4だ。ちょっとうれしい(ニッチすぎるけど)。

●追記:そうだ!欠席だったminaさんの「ブログ通信簿名刺」もらってきてあげればよかった・・・後悔。


ブログ性別・年齢の推定

写真

ここの説明も面白かった。

そもそも、自分が「男性/27歳」だったりするので、「な・・・なんでわかったの・・・!?」という実感値は自分の中にはなかったんだけど、性別や年代を判定するためのプロセスについての説明で、「解析の技術ってこういう感じなのか」というのがほんのちょっとだけ理解できた気がするので。

年代については、いろいろ年代推定につながりそうなキーワードから「10代と推定される要素/10代以外と推定される要素」「20代と推定される要素/20代以外と推定される要素」みたいな判定をしていって、最後、推定年齢を絞り込むというような話だった。

こういうの、普段の生活の中でも応用できる。

「この人はどんな人なんだ?いい人なの?悪い人なの?」

と、いきなり漠としたところから入ってくのではなく、

「初対面の人に対する許容度はあるほうか、どうか?」「自意識の強い人なのか、そうではないのか?」「どの程度感情を表に出してくる人なのか?」みたいな項目別の観察で、その人の人物像をつかんでゆくような。

写真

で、ちょっと難しい話とかもあったけど・・・

写真

何を伝えたかったかというと・・・

写真

ってことなんだって(笑


・・・なんか急激に親近感わきました、この瞬間。


(確かにいろんなお遊び系の「判定ツール」とか次々でてて、素人的にはいま一つ根本的な違いがわからないよな・・・)

あと途中で「給食」がでたので(ミルメークも!!!)、それはまた別の記事で。


> 続く

好奇心を刺激するイベント参加レポートの記事一覧