ブロガーイベント「ブログ通信簿の秘密を学ぶ」に参加しました

twitterはてなブックマークlivedoor クリップYahoo! ブックマークbuzzurlFC2ブックマーク

参加抽選に当選していたブロガーイベント「ブログ通信簿の秘密を学ぶ」に、10月9日に参加してきました。

ブログ通信簿で使われている技術について、深いお話を聞くことができました。

「ブログ通信簿の秘密を学ぶ」は、大手町のNTTレゾナントにある、gooで行われました。


まるで、そこは秘密基地のような入り口。
すごくおしゃれな内装で、こういうところで働けるのは、すごくうらやましいですね。

はじめに

  • gooラボについて
    • ブログ通信簿はgooラボのサービスのひとつ
    • 2003年10月7日スタート
    • ひとあし早く、未来のインターネットサービスを体験
    • 商用サービスに導入する前に利便性や有効性を検証
    • 5年間で60件開発、18件が正式導入
  • ブログ通信簿、発行回数100万回突破

ブログ通信簿の仕組み

ブログ通信簿の仕組み

  • 対象ブログの記事の最新10件をみて判断
  • 記事の取得はgooブログ検索エンジン経由で行う
    • そのため、ブログが見つからないという表示が出るブログがある
    • pingを送ってくださいと表示
    • 発行日
      • 測定日
    • 氏名
      • ブログタイトル
    • 主張度
      • 記事中の分全体に占める意見文の割合から算出
      • 意見性判定技術、主に文末に含まれる表現をもとに、文が意見を表しているかどうかを判定する技術
    • 気楽度
      • 記事中の評判文からポジティブな情報の割合から算出
      • 評判情報抽出技術:ブログ記事の中から評判を表す表現を抽出して、ポジティブ/ネガティブに分類する技術
    • マメ度
      • 10件の最新記事から平均投稿時間(記事間の間隔)をもとに算出
    • 影響度
      • 「すごい」ブロガーかをもとに算出
      • EigenRumor:リンク情報をもとに記事とブロガーに対してスコアを付ける技術
      • gooブログ検索の検索結果にグラフを表示しているが、この数値をそのまま利用
      • ちょっと厳しい、1とか2の人がたくさんいる
    • 通信欄
      • タイプとメッセージ
        • 前述4つの値をもとに決定
      • 話題
        • 記事タグ推定技術:対象ブログ記事から特徴語を取得し、その特徴語と関連の深いタグを推定する技術
      • 職業
        • 文章ドメイン判定技術:記事に含まれている単語の分野から記事の分野を求める技術
    • 性別
      • 文章属性推定技術:事前にブロガーのプロフィール情報を参考にして性別や年代ごとに、ブログ記事から特徴的な言葉を取得しておき、推定対象のブログ記事で、その特徴的な言葉がどの程度使われているかによって、性別や年代を推定する技術
    • 年齢
      • 前述の技術を用い、10代なのかそれ以外か、20代なのかそれ以外か・・・という判定を行い、隣り合う年代のどちらに近いかによって年齢を推定

ブログ通信簿が生まれるまで

  • ブログが生まれたころ、いろんなものに関する評判が知りたいというニーズが高まってきた
    • 評判情報抽出技術→gooブログ評判分析
  • どんな人がその評判を書いているのか知りたい
    • 公開プロフィール抽出(文書属性推定技術の材料)→gooブログ検索の右枠
  • プロフィール公開してない人もどんな人か知りたい
    • 文書属性推定技術→ブログ自己分析サービス(案)
    • いろいろ組み合わせてみよう
  • こだわりがある
    • 紙の画像を背景にしている
    • 数字のスタンプ
    • 印鑑はお遊び

スタッフ紹介

Q&A

  • 意見性判定の辞書のキーワード数はどれくらい?
    • 数万キーワードの辞書
  • すごいブロガーになるにはどうすれば?
    • 本文で文章中にリンクが貼ってあると参照されているということになる
    • コメントやトラックバックなどを見て「注目度」といった項目を作ってもいいかも

休み時間

休み時間には、なんと揚げパンとミルメークが配られました。


gomaさん、KypDurronさん、hyoutan2005さん、はなさんと楽しく会話しながら、頂きました。

もちろんぼくも、おいしく頂きました!(嫁が)
1人2つずつ配られたのですが、ちょっと脂っこさに重くて、2口ぐらい食べて持ち帰らせていただきました。
2つとも食べたKypDurronさんは若いなぁー。

班会議:ブログ通信簿に使われている仕組みを元に新しいサービスを考える

前述の4名とディスカッション。

  • goo Hyoka's
    • あるアイテムがどの年代のどんなタイプの人たちから支持されているかを表示
    • 例)『「麻生太郎」は20代アキバ系男子から支持されています』
    • マーケッターとかに提供できるかも
  • キャラ度診断
    • ドラえもんのキャラだと誰?とか、女王様度とか

いろいろとアイデアが出ていましたが、個人的にはgoo Hyoka'sはかなりいいアイデアなんじゃないかと。

その他の班のアイデアは以下

  • 犯人度認定
    • 強盗/詐欺師/被害者
    • ブログ内容から新しい事件を作る「Jリーガー殺人事件」
    • クロサギとかとタイアップ
  • ブログ通信簿にセクシー度を追加
    • エロ度、セクシー度からアバターが育っていく
  • ブログ通信簿で過去データとの比較できるといいな
    • 一般生徒→生徒会へ成長
    • 卒業/留年
  • ブログ同士の相性
    • 一つのクラスにするとか
  • Google Street Viewと組んで、あなたの家はここでしょう!
    • 地名、駅名から判定

お土産

お土産いっぱい貰いました!



まとめ

大企業であれ、個人であれ、日々様々なWebサービスが産まれている昨今ですが、こうして裏側の技術を余すところなく、教えてくれるというのは嬉しい限りです。
こうした技術を見ると、他にもこういうのができるんじゃないかという想像力をかき立てられますし、そういうディスカッションがあったのも、このイベントはよかったと思える要因のひとつです。

また、実際に、サービスを作った人の思いを知ることができ、また、使ってみての感想を直接伝えることができる、こうしたイベントはすごくいいものだと思います!
NTTらしくはないですけどね。

gooラボ スタッフブログの「ブログ通信簿の秘密公開終了」という記事にトラックバックを打つ宿題が出されていましたので、参加者のブログ記事はここを見れば出てきます!