INFORMATION

CATAPULT

IT企業インターン直結の学生向けエンジニアブートキャンプ「DATA ENGINEER CATAPULT」 実践的な機械学習モデルの構築手法を学び、福岡の企業とデータドリブンなWEBプロダクトの構築に挑戦!

大学生・専門学生・高専生に向けたIT企業インターン直結のエンジニアブートキャンプ「データエンジニアカタパルト」は、最終審査を通過した27名の学生がデータサイエンスの講義に進みました。

Phase02では、laravelフレームワークを用いた初めてのチーム開発を通して、オルターブース代表の小島淳さんからプロダクト設計や効率的なコーディング技術、アジャイルによるチーム開発について学びました。

そこで学んだ開発力にさらに「データを活用する」力をつけるため、Phase03ではデータサイエンスの講義が行われました。

Phase03のデータサイエンスの講師を勤めた、株式会社パタンナー代表取締役CEOの深野さんは、
「本講義は良い意味でストイックな講義スタイルで進めます。受講生のみなさんには自走力を求めます。自走力は新しいことに挑戦するときに最も大切なスタンスです。 なぜ、自走力を求めるのか?というと、自走力がなければ実践的なスキルの習得(学習目標の達成)はむずかしいからです。」
というエンジニアとしての心構えを前提に、
「 講義で取り組んだことがそのままインターンや就職のためのポートフォリオになること。起業志望者にとってはAIアプリの実装イメージを具体的に考えられること」
を目標として実践的な講義を行いました。

人それぞれ異なるデータ分析の仮説検証の思考を共有するために、互いのナレッジを共有できるデーセンというアプリを用いて講義が進められ、学生たちは互いの分析から刺激しあい、オープンマインドで切磋琢磨し、まさにプロのエンジニアのように成長した姿がみられました。

講義を通して学生自身が興味を持ったデータセットから機械学習モデルを構築するのに加えて、最終課題として世界中のデータサイエンティストが参加している機械学習コンペである「kaggle」にも挑戦しました。

ランダムフォレストやlightGBMなどのアルゴリズムを用いて仮説検証をもとに前処理や特徴量エンジニアリングを何十回も試行錯誤するほどコンペを楽しむ生徒もみられました。

ついにカリキュラムは最終Phase04に進み、これまで積み上げてきたスキルを2月末(予定)に行われるデモデーに向けて開発する段階まで来ました! Phase04では、デモデーでの発表を目標にデータサイエンスのみを行うのではなく、データエンジニアリングから機械学習モデル構築、そしてWEBアプリ作成まで総合して、学生たち自身でメンター企業の課題を解決するプロダクトの作成を行います。

初日のキックオフでは、学生たちが10チームに分かれて各々のメンター企業との顔合わせが行われ、企業の持つ課題を解決するためのアイデアを出しあって設計を進めました!

その後はチームごとコミニュケーションをとりながら開発を進めています!各チームメンバーどうし集まって議論開発している様子も!

デモデーではインターン採用を希望する企業が観覧に参加でき、終了後にインターン採用のマッチングが行われます。これまでのカリキュラムをとおして、よりエンジニアらしくなった27名の学生たちが作り上げるプロダクトが楽しみですね!

 

Phase03を通しての学生の声

【第1回講義】

  • データ分析の業務フローや、データエンジニアとデータアナリストの役割の違いがわかりました。
  • 機械学習を目標にするのではなく目的の達成のために手段として使うということに納得しました。
  • Kaggleという超面白いサイトがあることを知れてよかったです。データサイエンスとは何かを理解できたこと。

【第2回講義 BIツールを使おう データビジュアライゼーション】

  • BIについて。普段、Rを使ってデータ分析しているので、もっとお手軽なものがあるんだなぁとわかった。
  • 今日は描画ライブラリはmatplotlib以外にもあり、それぞれ別のルーツでできているということがわかりました。さらにjavascriptベースの描画だと動くグラフを書くことができることが目からうろこでした。ヌルヌル動くのが面白かったです。また他の人のポートフォリオを見ることでノートブックの書きかたの参考になったり様々な手法が知れたりしてとてもよかったです。

【第3回講義 機械学習、前処理】

  • teachable machineなどノーコードでも機械学習ができるものがあるのがすごいと感じました!
  • 機械学習とは何か、を問われたときに、もうしっかり答えられるようになったと思います。
  • 具体的な機械学習を学んでみて、想像していたものよりも簡単な手順で作成できることに驚きました。今回学んだ内容をもとに個人的にも色々と機械学習のモデルを作ってみたいと思いました。

【第4回講義 機械学習アルゴリズム】

  • aiの持つ嗅覚や味覚や触覚に関する考え方がよく分からなかったのですが、私は匂いを感知して、臭かった場合に気絶する犬型ロボットや、物の重さによって持つ力を変えて、形の変形などを防ぐアームが存在することから、味覚や嗅覚、触覚の数値化は十分に出来ているのではないかと考えていたのですが、ワインの例えで主観的な指標をデータとして揃える難しさがわかりました。
  • アルゴリズムのチートチャートの存在が知れたことと、sklearnに数理統計モデルがある事がしれてよかったです。
  • プログラミングの限界突破という観点から機械学習を考えている視点が新鮮でした!

【第5回講義 教師なし学習】

  • 具体的な機械学習を学んでみて、想像していたものよりも簡単な手順で作成できることに驚きました。今回学んだ内容をもとに個人的にも色々と機械学習モデルを作ってみたいと思いました。
  • 自然言語処理について MeCabは触る機会がなかったので、実際の自分の書いたtxtの結果を出せて面白かったです。

【第6回講義 WEBスクレイピング 総復習】

  • データ分析の総復習を受講して、データ分析の活用方法の多様性を学ぶことができました様々な分野でも必要不可欠になるくらい実用的でデータ予測や、分析を自分の武器にしたいと感じました。
  • Plotlyの利用やOctparseを使ったデータの取得は普段学ぶ機会が得られないことだと思うので貴重な経験になった。
  • データ分析の総復習を受講して、データ分析の活用方法の多様性を学ぶことができました様々な分野でも必要不可欠になるくらい実用的でデータ予測や、分析を自分の武器にしたいと感じました。
  • 何より、デーセンに成果物をまとめたことで、自分の学んだ跡を残すことの大切さを学びました。復習もしやすければ、モチベーションにもつながると実感しました。他の人のポートフォリオをデーセンで見ることができたのでノートブックの書きかたの参考になったり様々な手法が知れたりしてとてもよかったです。楽しかったです!ありがとうございました!

DATA ENGINEER CATAPULT