わすれっぽいきみえ

みらいのじぶんにやさしくしてやる

インターン中開催、勉強会メモ

id:yanbeさんの発表

ブックマークスパムの判定に関する研究

  • 新着エントリーが急にブックマークに登録されたりすると、スパムと判定する。
  • スパム判定には経験的に良い指標・良いパラメータを与えれば、それなりに良い判定。
  • しかし規模が巨大化していくと、管理が大変だし、誤判定も増えてくる。
    • スパムが新着エントリーとして増えると不快感が強いため、安全側にパラメータを振る
  • これまで
    • パラメータ固定。融通が利かない。
  • これから
    • 機会学習的にパラメータを変化させて、よりよいスパム除去を行えるようにする。
    • 管理画面を簡素化
      • 機械だけでは厳しいところもあるから、そこは確認。でもできるだけ少なく。
  • 新判定システムの方が旧判定システムよりも誤判定が少なくなってる。