次にやりたいこと
やっと公開することができましたが、ご覧のとおりに空白が沢山あります。空白を埋めるためのアイデアはあるのですが、実現にちょっと時間がかかりそうなので、空白のまま公開しました。
今回は、そこに何を入れていきたいかをお話しします。
node.jsを使って、Tiwtterタイムラインのリアルタイム分析をやりたい。
Streaming APIを使ってつぶやきを取得し、それをさらにWebSocketサーバを立てて流すという流行のアレです。これをランキングの横に載せたい。
「ゆっくり実況」とかシリーズタイトルとか#動画IDとかで検索し、定型文を削除したら意味のある言葉が残ると思うので、それを流すだけでも面白いんじゃないかと思うんです。あとは、動画IDを抽出してリアルタイムでサムネイルを表示するとか、ですね。TL上での人気をトップページに載せたいとも思っています。
node.jsじゃなくてRubyでもいいんですけど、流行りものは早いうちにやっておきたいのです。この場合、Herokuに無料でサービスを作ってiframeで中継とかがいいんでしょうか。現在node.jsの初期設定で大苦戦してるので、ちょっと実現に時間がかかるかも知れません。
動画コメントを取得して、コメント濃度から盛り上がりどころを判別して視覚化したい。
これは最近思いついたんですが、今回の提案の中では一番面白いんじゃないかと思う。
動画って、盛り上がる場面がありますよね。そしてそこではコメントが集中するわけですが、その濃度の高い部分を抽出して、「?分??秒で盛り上がってる!」みたいな指摘をすれば、見てる人も興味をそそるんじゃないかと思うのです。さらに変化率とコメント総量から盛り上がり度合いも出せるでしょう。これを各シリーズの右下の空白に入れたい。
nicoscraperの一機能として組み込むことになりますが、コメントは単純なスクレイプでは取得できず、いくつかの複雑な手順を踏む必要があるので、これもちょっと時間がかかりそうです。
タグを取得して、固定タグからゲームタイトル(の可能性が高いもの)を抽出したい。
現在、シリーズマイリストのタイトルから、シリーズを検索することはできます(シリーズマイリストとは、投稿者が作った、その動画シリーズを入れているマイリストの事を指すことにします)。
しかし閲覧者としては、ランキングから面白そうなものを探すか、あるいは見たいゲームのタイトルを探すというパターンのいずれかですよね。そうすると、必ずしもシリーズマイリストのタイトル中に、ゲームのタイトルが含まれていないという問題があります。これは、シリーズ内動画まで範囲を広げれば解決するかも知れません。しかし、ゲームタイトルを一覧化したい!という目的には使えません。どの範囲で文字列を切り取ればいいかの判断材料が無いから。
そこで、タグを使うということを考えています。タグには高確率でゲーム名を含んでおり、ゲーム名である可能性が高いタグさえ判別できれば、それをゲームタイトルとしてシリーズに結びつけ、さらにリスト化などもできます。
ゲーム名の可能性の高いタグをどうやって判別するかという問題ですが、これは
- 固定タグを抽出
- ジャンルタグ等の定型タグを排除
- 一定期間ごとにタグの変化を監視し、変化が無いものを採用
などの方法で、高い可能性でゲーム名タグを抽出できるんじゃないかと思います。あとは閲覧者に、「これはゲーム名タグじゃない指摘ボタン」等で教えてもらうとかですね。
これは地味だけど実用性が高いはずなので、優先順位を高く設定したいです。