読者です 読者をやめる 読者になる 読者になる

小町研の日常@しん

小町研にきて早1年,自然言語処理を学び始めたとある学生の日記

リクルートホールディングス WINTER INTERNSHIP に行ってきた

リクルートに興味のある皆さんこんにちは.小町研M1の叶内です.

2016/2/10~2/26の間,リクルートホールディングス Winter Internship [Data Analyst コース] に参加してきたので, 軽く以下の報告.

  • インターンの雰囲気
  • チーム「自分」の話
  • 融通を利かせて通してくれたことへの感謝

LDA の Blei さんと top kaggler の Owen Zhang さんが来てくれた話はここではしないので,誰かお願いします.

インターンの雰囲気

期間は土日抜いて12日間,メンバーは全体で30人弱で6チームあり,それぞれのチームが別々のことに取り組む感じ.なので周りのチームとは競いつつも情報交換し合える関係でよかった(休憩しにコンビニへ行ったときは,今どんな感じなの?と聞き合う感じ). どれくらいの人と話せるかなと思っていたが,前半・中盤・最終日に公式の飲み会があり,半分以上の人と話せた.飲み会以外にも他のチームとコミュニケーションを取る機会が数回あり,優秀な知り合いがたくさんできた(みんな優秀だった震え).

出身大学的には東大と京大が1,2番目に多く,学年はほぼM1でそれ以外はB3とD1の方が数人ずつ.ちなみにうちのチームは東大M1・京大B3・早稲田M1・首都大M1.そして性別的には女の子はどのチームにもいなかった...なお,インターンを運営してくださっていた人事の方には,ゆ〇さんもり〇ほさんという美女二人がいらっしゃったため,どのチームも優勝して「おめでとう」と言ってもらうために全力を尽くしていたことは言うまでもなし.

テーマについては各事業所(住まいやジョブズなど)から集められていて,メンターの方も各事業所から数人ずつという感じ(このメンターの方々の面倒見がかなり良い). データについてはどこまで言っていいのかわからないので全く触れませんが,全部リクルートらしいデータだった.

チーム「自分」

私たちのチーム名は「自分」で.チームロゴは心優しい知り合いに数時間で書いて頂きました.(仕事早くてめっちゃ感謝) f:id:shinkanouchi:20160301005116j:plain

(ロゴの背景に,自分を指す本田△の手が混ぜられています.) f:id:shinkanouchi:20160301024947j:plain:w200

チームの雰囲気としては最高で,お互いが自分の意見を主張できる関係を保ちつつ自分に必要とされていることを理解できていた. 作業している時以外も過ごしやすく,昼はもちろんみんなで食べに行ったが,夕食も東京のラーメンや牛タン定食に行ったりした.

さらに良くできた点2つ

やりきったので後悔とかではないが,後から考えるとさらに良くできるポイントはいくつかあった.

  • KPIフラフラ時間使いすぎ問題

今回のインターンで一番悩んだ点であり,一番学べた点. 私たちはタスク的に最終的なゴール(KGI)がほぼ決まっており,さらにデータを見た感じから,ゴールを達成するための手段(KPI)もこんな感じだよね?というのがチーム全体ではじめから何となく共有できていた(悪い意味で). 実際生のデータで何か試したら新たに問題点も見つかるだろうし,まずはデータを触ってベースラインを実装してから考え直そう,という感じでスタートした.

その後データを理解して簡単なベースラインを実装し,そろそろ面白いことをしようかという状態に(ここで4日目.まだ順調). しかしいくつかチャレンジしてみるが基本的には上手くいかず,ベースライン+αの実装で中間報告をすることに(7日目.まだ順調). 中間報告では「もう一捻り欲しいね(直訳すると、なんだか内容がつまらないね)」というコメントを頂き,自分たちでもわかっていることであったが,そこのもう一捻りがかなり難しかった.

このあたりで停滞するうちに「そもそも自分たちのストーリーって何だっけ」という一番初めの議論へカムバック.さらにこの議論の闇が深く,みんなでどう考えても正解にはたどり着けず,完全に闇のゲーム(笑). この闇のゲームは最終日の前日(11日目)に妥協するまで続き,発表の大きなストーリー(KPI)が固まったのは結局最終日の前日の夜なのであった.

最終発表においては,議論の甲斐あって,この点においてかなり明確に表現できていた.ただ闇の議論は有意義で楽しかった一方,完全に時間の使いすぎで,もっとそれぞれができることを細かく探さなきゃいけなかったと結果的には感じる.(そのときは気付かなかったが,途中で結果論的にはベターな選択肢が上がったりもしていた.)

  • 役割分担と作業の効率化の問題

データ作成・基礎集計・モデル作成・素性エンジニアリング・スライド作成など,大きく仕事を分担できそうな所では分担することができていたが,作った物の受け渡しがあまりうまくなかったように感じた. それぞれ部分的には効率的にコードを書いて,ある程度自動化することはできたが,結果的には(今回のタスクは特に)似たような作業に多く時間を奪われていたように感じる. 夜帰るときにエンターを押して帰り,朝にはCSV出力とプロットが全部終わってるくらいまでできていたら,もっと他のことまでチャレンジできたかも知れない.

融通を利かせて通してくれたことへの感謝

偉そうに言葉を並べていますが,私の欠席率がこのチームで圧倒的に高かったりします.実は論文投稿の時期と他のインターンとトリプルブッキングしていて,みんなの2/3くらいの時間しか参加していません(だったら参加するなよ!と自分でも思いますが,それでも受け入れてくれました.感謝).インターンに応募した時点で結構行けないことが分かっていたのに通過させてくれた人事の方,後半迷惑をかけてしまったチーム・メンターの方,そしてインターンを通じて声をかけてくれた方々に本当に感謝しています.最高に楽しかったです.皆さん,またいつでも飲みにでも誘ってください!