スマートフォン版で表示

現在、お知らせはありません。

データサイエンティスト 資格のイメージ

データサイエンティスト向けの資格|コンペもあわせて紹介

注目を集める職種であるデータサイエンティスト。この記事では、データサイエンティストとはどういう職種なのか、客観的指標である資格試験および相対的指標となる競技会の2つの観点から解説します。

このエントリーをはてなブックマークに追加

データサイエンティストの定義

以下の記事でも取り上げていますが、2012年に21世紀最も魅力的な職業と称され、実際、今、最も注目を集め、各種業界でニーズが高まっているデータサイエンティストという存在。

その定義にはさまざまな解釈が存在するのですが、端的にいえばAI社会におけるデータを扱うプロフェッショナルです。詳しくは「データサイエンティストになるには」をご覧ください。

データサイエンティストになるには?求められるスキルセットや道のりを解説

IT企業はもちろんのこと、たとえばサプライチェーンに関わる小売業者や部品メーカー、さらには配送業者、各種サービス事業者までさまざまな分野の企業においてその存在の重要性が高まっています。

背景にはネット社会・デジタル社会になり、人間の生活そのものがデジタル化し、その行動や特徴が知らず知らずのうちにデータとして蓄積されていることが挙げられます。分かりやすい例でいえば、ネットでの「検索ワード」であったり、ECサイトにおける購入履歴、あるいはSNSによるさまざまな写真の投稿などです。

これらはすべて「インターネット」のうえにデータとしてアップされています。こうしたネットの情報はもちろんのこと、たとえば、農業や水産業などの一次産業、その先の二次産業においても、収穫量などと天候や自然の状況などはデータとして記録することが容易になり、各事業者にとって未来のビジネスに向けた「データ」が労せずして蓄積される時代となりました。

そして、これらのデータ、いわゆるビッグデータを活かせるかどうかがビジネスの成功の鍵を握っており、そのデータを活用するための人材こそ、データサイエンティストであることが周知されてきました。

では、ビッグデータを活用する専門家として活躍するデータサイエンティストを目指すにはどうすれば良いのでしょうか。

今回は、データサイエンティストとして活動するための客観的指標として、データサイエンティストにまつわる資格、さらに、データサイエンティストを対象としたさまざまなコンペティションについて紹介します。

データサイエンティストに関係する資格について

それでは、「データサイエンティスト」という名称が含まれた資格をはじめ、データサイエンティストを目指す上で役立つ資格を紹介します。

データサイエンティスト検定 リテラシーレベル

まずは何といってもこの資格です。データサイエンティスト検定 リテラシーレベル。

「データサイエンティスト検定 リテラシーレベル(略称:DS検定)」とは、一般社団法人データサイエンティスト協会が定義する「アシスタント・データサイエンティスト(見習いレベル:★)と、数理・データサイエンス教育強化拠点コンソーシアムが公開している「数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラム」を総合された、実務能力と知識を有することを証明するための試験です。

毎年2回実施され、2021年秋に行われた第1回は受験者数約1,400人・合格者数927人(合格率約66%)、2022年6月の第2回は受験者数約2,900人・合格者数1,453人(合格率約50%)となっています。

スキルレベル 目安 対応できる課題
Senior Data Scientist
シニア データサイエンティスト
★★★★ 業界を代表するレベル
  • ・産業領域全体
  • ・複合的な事業全体
Full Data Scientist
フル データサイエンティスト
★★★ 棟梁レベル
  • ・対象組織全体
Associate Data Scientist
アソシエート データサイエンティスト
★★ 独り立ちレベル
  • ・担当プロジェクト全体
  • ・担当サービス全体
Assistant Data Scientist
アシスタント データサイエンティスト
見習いレベル
  • ・プロジェクトの担当テーマ

データサイエンティスト検定のスキルレベルと目安、課題。
一般社団法人 データサイエンティスト協会発表資料より)

データサイエンティスト(DS)検定の対象、合格者の位置づけ

データサイエンティスト(DS)検定の対象や合格者が証明されること、また、実際の試験内容について簡単に紹介します。

DS検定の受験対象者は、

  • - データサイエンティスト初学者
  • - これからデータサイエンティストを目指すビジネスパーソン
  • - データサイエンティストに興味を持つ大学生や専門学校生など

となっています。

また、データサイエンティスト協会は、合格者は「データサイエンティストに必要なデータサイエンス力・データエンジニアリング力・ビジネス力についてそれぞれ見習いレベルの実務能力や知識、また、数理・データサイエンス・AI教育のリテラシーレベルの実力を有していることを証明する」としています。

つまり、まだデータサイエンティストとしての素養(スキルセット・マインドセット)を持っていない方が、より実践的なデータサイエンティストになるために、まず取得すると役立つのがこのDS検定です。いわば、データサイエンティストになるための登竜門といえるでしょう。

データサイエンティスト(DS)検定の試験範囲

最後に試験範囲です。対象は初学者とはいっても、データサイエンティストという専門職種として認定するわけですから、そのために必要な分野の知識が試されます。

まず「データサイエンス力」「データエンジニア力」「ビジネス力」の3つの力です。難易度は前述の「アシスタント・データサイエンティスト」の範囲に収まるものです。

データサイエンス力では、統計数理基礎、線形代数基礎、微分・積分基礎などの数学的知識やデータクレンジング、データ加工といったデータ操作の基本、また、データの応用技術である機械学習、深層学習、自然言語処理、画像認識などに関する内容が対象となります。

データエンジニア力は、もう少し業務に近い内容として、システム企画、システム設計、アーキテクチャ設計などの知識、データ処理にかかわるマッピング処理やサンプリング処理の手法、暗号技術などが対象となります。

ビジネス力は、上記2つをビジネスに応用した内容として、ビジネスマインドやデータ・AI倫理、説明能力、リソースマネジメント、リスクマネジメントなど、実際のプロジェクトに加わる上で必須の項目が対象です。

また、モデルカリキュラム(スキルセット)としては、

  • 1:社会におけるデータ・AI利活用……社会で起きている変化、社会で活用されているデータ、データ・AIの活用領域、データ・AI利活用のための技術、データ・AI利活用の現場、
  • 2:データリテラシー……データを読む、データを説明する、データを扱う
  • 3:データ・AI利活用における留意事項……データ・AIを扱う上での留意事項

が範囲として設定され、試験に含まれます。

すでに2回実施された実績もあり、各種参考書が発売されているため、取得したい方はそれらをご一読することをおすすめします。

データサイエンティスト(DS)検定以外の資格試験

データサイエンティストの名前が付いた資格試験以外にも、データサイエンティストという職種を目指すうえで、取得するとメリットがある資格試験をいくつか紹介します。

基本情報技術者試験/応用情報技術者試験

最初に紹介するのは、経済産業省が情報処理技術者としての「知識・技能」が一定以上の水準であることを認定している国家試験「情報処理技術者試験」です。

この試験のうち、さまざまなスキル分野・業務分野を横断的に扱う内容として、「基本情報技術者試験」「応用情報技術者試験」が用意されています。

それぞれ、「高度IT人材となるために必要な基本的知識・技能をもち、実践的な活用能力を身に付けた者」(基本)、「高度IT人材となるために必要な応用的知識・技能をもち、高度IT人材としての方向性を確立した者」(応用)を対象としています。

データサイエンティストという職種よりも対象の幅は広いですが、ITエンジニアとしてのバックグラウンドがない方がデータサイエンティストを目指そうとするのであれば、基礎力を身につける意味で学習して損はないでしょう。

基本情報技術者試験

応用情報技術者試験

データベーススペシャリスト試験

前述の基本情報技術者試験/応用情報技術者試験と同様に、経済産業省が認定する国家試験に「データベーススペシャリスト試験」があります。

この試験も、上記と同じく「情報処理技術者試験」の枠の中にありますが、対象は「高度IT人材として確立した専門分野をもち、データベースに関係する固有技術を活用し、最適な情報システム基盤の企画・要件定義・開発・運用・保守において中心的な役割を果たすとともに、固有技術の専門家として、情報システムの企画・要件定義・開発・運用・保守への技術支援を行う者」となっています。

データおよびデータベースという観点から、データサイエンティストが扱うスキル領域と非常に近い内容が対象です。2022年時点では、公式サイトにおいても、「ビッグデータ時代に求められる、データ志向の担い手」という説明がされているように、この資格を取得することもまた、データサイエンティストとしての素養を身につけている証明といえます。

データベーススペシャリスト試験

統計検定

次は、これまで紹介した試験よりも、さらに対象内容を絞った「統計検定」を紹介します。

「統計検定」は、統計に関する知識や活用力を評価する全国統一試験で、一般財団法人統計質保証推進協会が実施、一般社団法人日本統計学会が認定する資格試験です。

この試験も、データに基づいて客観的に判断し、科学的に問題を解決する能力が、業務・研究を行う上での21世紀型スキルとして国際社会で広く認められていることが背景となり誕生しました。

国際通用性のある統計活用能力の体系的な評価システムとして統計検定を開発し、さまざまな水準と内容で統計活用力を認定した内容となっています。

統計検定

G検定、E資格

最後に、一般社団法人日本ディープラーニング協会が実施・認定する「G検定」「E資格」を紹介します。

日本ディープラーニング協会は、ディープラーニングを事業の核とする企業が中心となり、ディープラーニング技術を日本の産業競争力につなげていこうという意図のもとに設立された団体で、中でも人材育成に軸足を置いた活動を行っているのが特徴です。

G検定、E資格とも、こうした意図を持った団体が認定した資格試験であり、ディープラーニング領域の人材育成につながる資格として評価されています。

G検定は「ディープラーニングの基礎知識を有し、適切な活用方針を決定して、事業活用する能力や知識を有しているかを検定する」もの、E資格は「ディープラーニングの理論を理解し、適切な手法を選択して実装する能力や知識を有しているかを認定する」ものです。

G検定

E資格

資格ではない、実践的データサイエンティスト力量チェック――コンペ

これまでは、データサイエンティストとして活動するための基準という観点から、国家試験をはじめ、その分野の権威である団体が実施・認定する資格試験を紹介してきました。

ただ、データサイエンティストに限らず、プロフェッショナルは実際の現場で考え、行動できるかが重要になります。

次は、データサイエンティストとしての力量を測る競技会(コンペティション)をいくつか紹介します。前述の資格試験が、一定の能力に関する客観的評価であるのに対し、コンペティションは、参加者同士の結果を競う相対的評価であるため、実際にデータサイエンティストとして働く人や目指す人の中での、自分自身のレベルが分かるものとして捉えることができます。

Kaggle

データサイエンティストを対象としたコンペティションとして最も有名なのがKaggleです。もともとは企業や研究者がデータを投稿し、世界中のデータ分析家たちがそのデータの最適モデル構築を競い合うためのプラットフォームです。

いわゆるオープンな参加型のクラウドソーシングを活用したプラットフォームとしてデータを扱う専門家たちの注目を集めました。2017年に運営会社のKaggleをGoogleが買収し、今はGoogle傘下の企業によって運営される予測モデリングプラットフォームとなっています。

このプラットフォームには、専門家たちだけではなく、世界屈指のコンサルティング企業をはじめ、データサイエンスを事業とする企業がホスト(データ提供者)として参加し、その中で競われるモデルに賞金を提供するなど、コンペティションとして認知されるようになり、より実践的かつ業務(賞金獲得)としてのデータサイエンスの分野を活性化させる一助になりました。

最近の題材としては、新型コロナウイルスのmRNAワクチンや世界金融の動きを扱ったものから、プロ野球など趣味の範囲でのデータを扱うものまで幅広く、さまざまな人が参加しやすくなっているのが特徴です。

なお、Kaggleには賞金付きのもの以外にも、ランキングには反映されない練習用の「Getting Started」、入門よりも難易度が高い「Playground」など、初学者から参加しやすい仕組みが用意されています。

ホスト(データ提供者)は、複数のコンペティション形式から提出させるデータ形式を選んでコンペティションを設定します。

Kaggle

SIGNATE

次に、日本国内のものを紹介します。まず最初に紹介するのが「SIGNATE」です。データサイエンスプラットフォームとして、株式会社SIGNATEが運営・提供を行います。

「Competition 」「Learning」「Career」の3つの分野から構成されており、コンペティションの参加(課題提供)に加えて、データサイエンティストとしての学習(育成)およびキャリア構築までを、1つのエコサイクルとして考えているのが特徴です。

SIGNATE

Nishika

Nishikaも、SIGNATEと同じく日本国内で、Nishika株式会社が運営しているデータサイエンティストコンペティションです。こちらは「国内最大級のデータサイエンスコミュニティ」と銘打ち、データサイエンティスト同士のコネクションづくりにとくに注力したプラットフォームとなっています。

Nishika

統計データ分析コンペティション

最後に、少し変わったコンペティションを紹介します。

独立行政法人統計センターが事務局となって2018年度から毎年実施している「統計データ分析コンペティション」です。

高校生、大学生等を対象に、地域別の統計をまとめたSSDSE(教育用標準データセット)を用いた統計データ分析の論文を募集し、そのアイデアと解析力を競うコンペティションとなっています。

統計データ分析コンペティション

データサイエンティストへの転職を考えるのであればエージェントサービスの活用も

ここまででデータサイエンティストに関連する資格やコンペティションについて解説してきました。

データサイエンティストには、名称独占資格のような必要な資格があるわけではありません。またデータサイエンティストへ転職するというケースにおいても、特定の資格があることで選考通過を保証するわけではありません

ただし、データサイエンティストを目指すのであれば、土台となる知識、スキルを身につける上で資格試験の学習は役立ちますし、学んだことを客観的に示す指標にもなります。コンペティションであればより実践的な知識が得られますし、良い成績を上げられれば、選考の際に資格よりも評価されることもあります。

データサイエンティストになるための勉強をするのであれば、資格やコンペティションも一つの手段として検討するとよいでしょう。

とはいえ、実際にデータサイエンティストへの転職を目指す場合、未経験からの転職はハードルも高く、独学だけではうまくいかないことも多々あります。どの程度勉強したら転職を考えるべきか、そもそものキャリアプランをどう考えるべきか、など考慮すべき点も多いため、転職エージェントの活用も視野に入れるとよいでしょう。

dodaエージェントサービスでも、転職を見据えた独学のコツや具体的な選考対策、求人探しのサポートなどを行っていますので、お気軽にご相談ください。

この記事の監修者

馮 富久(ふぉん・とみひさ)

株式会社技術評論社デジタル事業部部長

1975年生まれ。横浜市出身。1999年4月株式会社技術評論社に入社。入社後から『Software Design』編集部に配属、同誌編集長(2004年1月~2011年12月)や『Web Site Expert』編集長を歴任。その後、2007年、gihyo.jpの立ち上げなど、技術評論社のWeb・オンライン企画、イベント企画などを担当。現在は、2022年4月に設立したデジタル事業部にて、技術評論社の電子出版やEC、企業マーケティング、広告を中心に、デジタル・オンライン事業を取りまとめる。2021年5月、電子書籍専門企業 株式会社GREEPの社外取締役に就任。社外活動として「電子書籍を考える出版社の会」の代表幹事や「WebSig 24/7」のモデレーター、「TechLION」プロデューサーなども務める。過去にIPAオープンソースデータベースワーキンググループ委員やアックゼロヨン・アワードほか各賞審査員などの経験を持つ。

自分の強みや志向性を理解して、キャリアプランに役立てよう
キャリアタイプ診断を受ける
ITエンジニア専任のキャリアアドバイザーに無料で転職相談
エージェントサービスに申し込む(無料)
キャリアパスをかなえる求人を探してみよう
求人を探す

関連コンテンツ

このエントリーをはてなブックマークに追加

【人気企業300社の合格診断】今、転職できる可能性は?
ハイクラス転職サービスdodaX