私はデータサイエンティストとして米国の企業で働いています。生物系での教育バックグランドの持ち主ですが、情報学を学んで今の仕事に至っています。
この経験を生かして、コンピューターサイエンス・情報・統計学等での学歴がなくても、20代、30代、40代の方が、データサイエンティストとして転職できる道を紹介したいと思います。
データサイエンティストの就職・転職に学歴が必要なのは一部の巨大IT企業での研究職。実際に多く求められているのはデータサイエンスの技術を使いこなせる実力者。
最初に、GAFAと括られるGoogle、 Amazon、 Facebook、 Appleなど情報系大企業では、コンピューターサイエンス、統計、数学等で博士の学歴に加えて、更に情報系分野で研究実績がある人達を「主に」採用しています。
何故なら、これら巨大IT企業は、AI、深層学習のアルゴリズム、データサイエンスの技術そのものを研究開発しているので、コンピューターサイエンス・統計での理論的なバックグランドをしっかり理解していることを求めているからです。
日本の大企業でも、事情は一緒だと思います。
ですがビジネスの多くの場ではデータサイエンスの技術を使える、使いこなせる力が求められています。その点で、データサイエンスは分野が新しく、ストリートファイトなところが多分にあり実力重視です。
例えばデータサイエンスに特化しているビッグデータナビの求人を見ても、ほぼ全ての求人が研究職でなく、スキル重視の実践者を求めていることが分かります。
これはGoogle、 Amazon等でも同じで、使いこなせる実力を証明してデータサイエンティストになる道も開かれています。
この記事では、未経験者がデータサイエンティストとして転職を成功させる方法について、華やかな道と手堅い道を教えます。
実力を証明してデータサイエンティストになる華やかな道
データサイエンスを行う様々なツールがオープンソースで開発されていて、無料で手に入ります。それらを如何に使いこなすかという事が、難しい理論を知っているよりも、多くのビジネスの場で重要です。
そして、データサイエンティストとして実力を客観的に国際的に確実に証明する方法があります。
この方法で証明できれば、大企業に就職して年収数千万、またフリーランスとして「より稼ぐ」ことも実現できます。
その方法は、データサイエンティストの戦いの場「Kaggle」において、上位入賞することです(サイトは英語です)。
Kaggleでは、様々な企業、団体が複雑な問題の解決を求めるコンペティションを常時複数開催しています。
ここで上位に入れば、何十万、百万円単位での賞金と共に、興味さえあればグーグル、アマゾン、マイクロソフト、Facebookに採用されることは容易いです。米国での話ですが、私の周りにそういった人達がいます。日本でも大きな企業は注目していると考えられます。
ちなみに、Kaggle自体2017年にグーグルに買収されていますが、マイクロソフトやフェースブックもコンペティションを出しています。
常に何かしらのコンペティションが行われているので、英語にアレルギーがなければ一回覗いてみることをお勧めします。
高額の賞金がまず目につくでしょうし、非常にオープンなコミュニケーションが交わされていて、こういう人達がデータサイエンティストなんだと触れることが出来ます。
殆どの人がデータサイエンスを独学している
2番目がオンラインコース、3番めが仕事を通じて、大学で習ったというのは4番目です。さらに、4番目に伯仲しているのが、Kaggleのコンペティションへ参加して実践の場で習ったというのが続いています。
ほぼすべての人が新たに習っているということです。つまり未経験者にも機会は開かてているということですね。
日本語オンラインコースでデータサイエンスを独学するならUdemy
データサイエンスを学べるプラットフォームは、今は日本語でも結構あって悩むところです。
でもKaggleコンペティションに参加できるくらいの実力をつけられるコースは限られています。
実はKaggleに参加している世界中のデータサイエンティスト達も、様々なオンラインコースを使って学んでいますが、その中でも
これらのプラットフォームが良いところは、ユーザーからの評価、コメントが見られ、世界レベルで評価されているコースを、非常にお手頃な価格で受講できることです。
この3つの内で、仕事関係のスキルアップに強いコースを揃えているUdmeyは、実は日本語のサイトがあります。
以下のコースを完了できれば、Kaggleコンペティションに参加できるスタート地点に立てると思います。
それぞれのクラスは2000円以下で受講できます。また、講座は一度購入すれば視聴期限なく受講できるので、自分のペースで進められます。
のどちらかを受講して
を受講して、Kaggleに挑戦してみましょう。何回かコンペティションに参加すると、確実に実践力がつきます。
上位を取れれば、華やかに高給取りデータサイエンティストとしてデビューができます。
が、
ここまで色々書きましたが、未経験だとこれ無理だよ!という声も(多く)聞こえます。
データサイエンスでなくとも、新しいことを学ぶときは、始めが一番難しいです。
特に独学だと、疑問や技術的な問題にぶつかった時に、それが初歩的な問題であったとしても、暗闇を手探りで歩いているようなもので、一人で乗り越えるのは時間がかかります(逆にそこを乗り越えられる人が、独学に向いているのでしょうか)。
自分のペース云々以前に、やはり最初は経験者について学ぶことで、最初の取っ掛かりがつかみやすくなります。
次の章では、最初の壁を乗り越え、技術をビジネスまでつなげることを学ぶ、より堅実な道を紹介します。
未経験者がデータサイエンティストとして転職を狙うには、スクールで学ぶのが手堅い
さてここまでは、ストリートファイトで切磋琢磨し、突き抜けたデータサインティストの技術を看板にして転職、フリーランスになって大きな収入を得るという華やかな世界への道の話しました。ただ未経験者にとって、この道のハードルが高いのも確かです。
ここからは、手堅く未経験者がデータサイエンティストになる話をします。
Kaggleでは問題を解決をする技術を競う場ですが、実際のビジネスの場では、問題すらよく分かっていないことが多いです。
そもそも多くの会社で、データサイエンスの技術でどういった問題を解決できるかを把握している人は少ないし、解析結果を理解してビジネスへ繋げられる人が非常に少ないです。
トップに理解がある人がいる恵まれた一部巨大IT企業を除いたら、実はデータサインティストとして高度なデータ解析したとしても誰も評価しない現実があります。
ではデータサイエンティストは、こういった一部のIT企業を相手にする仕事なのでしょうか?それだと、情報系で博士を取るか、一部突き抜けた技術を持っているかのどちらかになってしまいます。
でも実は、中小企業を含め、ほぼ全ての企業でデータサイエンティストが活躍できます。
ズバリ、解析結果とビジネスの橋渡しを出来るようになれば良いわけなのです。
- データサインティストとして技術があり、さらにビジネスでの基本的な知識があり、解析結果をどうビジネスに活かせるかを説明できたら、どこでも評価されるようになる。
- ビジネスの世界とデータサインティストの世界で話されている言葉が全く違う。技術的な内容を一般人にわかりやすく翻訳して、解析結果への信頼性を説明できたら更にレベルアップ。
ただ、これらの点はオンラインコースで学ぶには限度があります。
ですので技術に加えてジネスへの応用を橋渡ししてくれるスクール、データミックスで学ぶことをお勧めします。
このスクールをおすすめできる理由は主に以下の点です。
- 「本当に未経験者」のためのコース、準備ステップが用意されている。
- データサイエンティストとして、ビジネスのドメイン知識があり、ビジネス担当とのコミュニケーションが円滑であって、始めてデータの活用が出来ることをよく理解している。
- 転職支援サービスも行っている。データサイエンティストが必要なのはグーグルやアマゾンだけではありません。技術の上に、解析をビジネスへ活かす視点と技術翻訳力を身に着けたデータサイエンティストは、様々な場面で活躍できるようになります。
- 解析結果をビジネスに活かすことを学ぶことがカリキュラムに組み込まれている。また、ビジネスへ直結した講座も用意している。データサイエンティスト育成コース、ビジネス統計とマーケティング分析です。
- 卒業後も継続したフォローアップ体制があって、OG・OBネットワークが使える。様々な業界・職種の受講生と授業だけでなく、勉強会やイベントで交流ができるようになっている。
未経験者にとって、技術を体系だって基礎から学べるようになっているのがとてもいいです。その技術をビジネスに繋げるところまで学べるのが手堅いところです。
勿論授業料はオンラインコースに比べれば高くなりますが、有望な投資だと思います。何故なら、リターンが非常に大きいからです。
受給資格およびデータミックスの定める修了要件を満たし、指定の期日までにハローワークへ所定の申請を行うことで、最大受講料の70%(最大で約51万円)の給付を受けることができます。
因みにアメリカでの話ですが、州立大学のコンピューターサイエンス修士過程で1つのクラスを取るのに約30万円はします。コースを終了するまでに12クラス位取る必要がありますが、何らかのファイナンシャル援助が無いとキツイですね。でも修士と言った学歴よりも、使える技術を得ることが大切な分野なので、データミックスで学ぶコストパフォーマンスは非常に高いと思います。
4番目の理由に関して、以下の章で補足します。
転職して直ぐに使える技術を身につける:データの可視化技術
プロジェクトを始めて直ぐに役に立つ技術を一つ身につけておくことが重要です。そもそも転職はその能力を買われて採用されているので、比較的短時間の間に成果を求められます。評価があって、始めて新しい環境で先に進んでいくことが出来ます。
特に未経験者がデータサインティストの技術を身につけた後の転職ともあれば、直ぐに使える技術を持っていることがキャリアーへの自信にも繋がります。
インパクトがあって直ぐに使える技術、それはデータの可視化です。
データサイエンティストとして転職した後、新しい職場に比較的短時間に導入できます。
またデータを可視化することで、データ解析結果をビジネスに繋げるストーリーとして説明できるようになります。
統計的な解析を行う前に探索的データ解析(Exploratory Data Analysis:EDA)を行って、全体的なデータの形をつかむことも大切で、この時もデータの可視化が必須になります。
その上でPythonであればmatplotlib、Seaborn、Plotly、R言語であればggplot2で用意されている主なプロット機能でデータ可視化をできるようにしましょう。他にも様々な強力なデータ可視化パッケージをフリーで使うことが出来ます。
ここらへんの学び方は、次の章で述べます。
さらに一歩上となる
「インターラクティブなデータの可視化」
が出来ると転職先でデータサイエンティストとしての評価を固めることができるます。
Shinyという可視化Webアプリケーションを使います。ShinyはR言語を学んだら比較的簡単に使えるようになります。
このような事が出来たら非常に強力だと思いませんか?
実際のビジネスの場で使っている技術です。
このようなデータの可視化は、解析をビジネスへつなげる説明を行う非常に強力な助けとなります。データサイエンティストの醍醐味ですね。
しかもShinyのコミュニティーバージョンは無料なので、いくらでも試せます。
機械学習、ディープラーニングなどが注目を浴びている技術ですが、ハッキリ言って大量のデータを集めている一部大企業以外で機械学習、ディープラーニング・言語処理を利用する機会は少ないです。
勿論、長い目で見て学んでおくことは必要ですし、Kaggleコンペティションへの準備にも使えます。それに、この技術を学んだと履歴書に書くことは、所謂バズワードでもあり、強みとなります。
ただ、プロジェクトを始めて、ディープラーニング等の技術を使って結果を出すまでに時間がかかりることは念頭におきましょう。
データの可視化技術についての学び方
可視化の基本技術は良質なデータサイエンティスト向けのPython、R言語を学ぶコースには含まれているはずなのです(逆に純粋にプログラマー向けだと入っていなでしょうし、データサイエンティスト向けのこれらの言語クラスで入っていないと、まとが外れている可能性もあるので気をつけましょう。データミックスでのコースではJypyterまたは、グーグルのColabを使うことを確認しました。)
以下のUdemyでのコースには、これらの言語を学びデータの可視化も学べるという、オススメコースです。自分のペースで学べるのもが良いと思います。
実はこの記事で紹介している一番大切なコースなので、大文字で強調しておきます。
社会人のためのPython活用術(10時間)
Rではじめる統計基礎講座(6時間)
ゼロからはじめるR言語でのデータ集計・可視化・機械学習・テキスト解析とPython言語での機械学習と可視化(19時間)
これらのコースのどれかをキッチリと抑えておけば、スクールでの勉強もスムーズになることは確実です。
Shiny
これも抑えておきたい技術です。
英語ですが公式、またYouTubeでのチュートリアルが数多くあります。R Shiny Tutorial for beginnersが評価が高いですね。
日本語だと、Qittaに「R - ShinyによるWebアプリケーション作成: 基礎編」という記事あるので、ここから始めてもいいと思います。
現職からデータサイエンティストとしてスキルアップ
転職ではないのですが、これがデータサイエンティストになる最も近道と言えます。
何故なら、既にビジネスに関して知識と経験があるので、技術を得ることによって、データから価値を生み出すアイデアを出すことが出来るようになるからです。
この場合、何が必要かをある程度分かっているので、まずUdemyで適切なコースを探すことををお勧めします。米国だと、スキルアップのため会社ぐるみでUdemyと契約して、全てのコースを社員であれば無料で受けられるところもあります。
また、データミックスでも関連あるコースを使って、手堅くスキルアップできますね。
- 「ビジネスでデータを扱うことのある 」のであればビジネス統計
- データによって更に今の商品・サービスから更に価値を生み出す「プロダクトマネジャー」「データアナリスト」「企画職」に興味があればデータアナリスト講座
- マーケティングの分析に最新のデータサイエンスの技法を取り入れることを視野にしているのであれば、マーケティング分析のコース
でしょう。
まとめ
記事が長すぎと言われたので、ここで手っ取り早くまとめます。
転職してデータサイエンティストとして直ぐに使える技術、データ可視化
- 社会人のためのPython活用術(10時間)
- Rではじめる統計基礎講座(6時間)
- ゼロからはじめるR言語でのデータ集計・可視化・機械学習・テキスト解析とPython言語での機械学習と可視化(19時間)
さらに強力なインターラクティブ可視化で転職後一気に高評価スタートダッシュを狙う:Shiny
スクールに行ってデータサイエンティストとして手堅くキャリアーを形成していく:データ解析に加えてビジネスへの活かし方を学ぶ
統計、機械学習、人工知能、データベースと広範囲な分野を体系的に身につけられるカリキュラムになっていますね。また解析結果のビジネスへの応用・活用を学べるのが大きいです。
年収数千万、華々しいデータサイエンティストの道に挑戦する:Kaggle
加えて
最後に
データサイエンティストで転職することに興味を持っている人が、その可能性を色々な場所で発揮していただきたいと思って記事を書きました。
データサイエンティストが活躍している場所として、巨大IT企業での華やかな高給の例がよく出されます。
でも「データから価値を生み出す」ことを可能にするのがデータサイエンティストなので、どこの会社、団体でもデータを持っている場所であれば、活躍の場所はあります。データから生み出せる価値を大きくできれば、収入も大きくなるでしょう。巨大IT企業がデータサイエンティストに非常な高給を払っているのは、その生み出す価値の大きさによるからです。
世界中でも、日本でもデータサイエンティストと言っている人の大半は、ここ数年の間に一歩踏み出した人達です。
「データサイエンス」という言葉は新しく、米国でも多くの人が独学、オンラインコース、スクール等によって学んでいます。
また、実践で実力をつけて行けられるので、物は試しで最初の一歩を踏み出すのが早道だと思います。
長い記事を最後までお付き合い頂き、ありがとうございました。