提供データについて - リコメンデーションコンテスト

提供データについて

データ内容

動画のマスターファイル

==> ファイル名:movie.csv <== 
mid   動画ID 
title  動画タイトル 
url   動画のページのURL 
turl  サムネイルのURL 
sec   動画の長さ(秒) 
site   Youtubeとか 
delete  動画の削除フラッグ(1が付いていればすでに削除されていることを表す) 
uname   アップロードしたユーザー名 

再生履歴ファイル

==> ファイル名:play_up20.csv <==お気に入りに20以上の動画を登録しているユーザのデータ 
==> ファイル名:play_oth.csv  <==その他のユーザのデータ 
uid  再生したユーザーがログインしている場合のユーザーID
sid  再生したユーザーのセッションID
ip   再生したユーザーのIPアドレスのMD5ハッシュ
mid  動画ID 
date 再生を開始した日時

中断履歴ファイル

==> ファイル名:skip_up20.csv <==お気に入りに20以上の動画を登録しているユーザのデータ 
==> ファイル名:skip_oth.csv  <==その他のユーザのデータ
uid  再生したユーザーがログインしている場合のユーザーID
sid  再生したユーザーのセッションID
ip   再生したユーザーのIPアドレスのMD5ハッシュ
mid  動画ID
date スキップボタンを押した日時
sec  スキップが実施された動画の再生開始からの秒数
    (別の動画を割り込み再生した場合、それ以前に再生されていた動画はスキップされたとになります)

完了履歴ファイル

==> ファイル名:finish_up20.csv <==お気に入りに20以上の動画を登録しているユーザのデータ 
==> ファイル名:finish_oth.csv  <==その他のユーザのデータ
uid  再生したユーザーがログインしている場合のユーザーID
sid  再生したユーザーのセッションID
ip   再生したユーザーのIPアドレスのMD5ハッシュ
mid  動画ID
date 再生完了した日時

お気に入りに入っている動画のデータファイル

==> ファイル名:favorite_up20.csv <==動画を推奨すべきIDの答え以外にお気に入りに入っている動画のデータファイル 
==> ファイル名:favorite_oth.csv  <==その他のユーザのデータ
uid   再生したユーザーがログインしている場合のユーザーID
mid   動画ID
cdate 登録日時

動画を推奨すべきユーザーID

==> ファイル名:output_id.csv <== 
uid 動画を推奨すべきユーザーID

検索キーワードファイル

==> ファイル名:keyword.csv <== 
uid   キーワード検索を行ったことがあるユーザーID 
keyword  ユーザーが動画を検索した際に入力されたキーワード 
cnt    キーワードの検索数