データサイエンス初学者のための実践的な学習環境 「データサイエンス100本ノック(構造化データ加工編)」をGitHubに無料公開

一般社団法人データサイエンティスト協会

一般社団法人データサイエンティスト協会(所在地:東京都港区、代表理事:草野 隆史、以下データサイエンティスト協会)は、構造化データの加工について実践的に学ぶことができる無料の学習環境「データサイエンス100本ノック(構造化データ加工編)」をGitHubに公開しました。

「データサイエンス100本ノック(構造化データ加工編)」は、データサイエンス初学者を対象に、データの加工・集計、統計学や機械学習を駆使したモデリングの前処理等を学べるよう、データと実行環境構築スクリプト、演習問題をワンセットにしています。

近年、データ活用の重要性についての認知が広がる中で、書籍やWebサイトなど、データ分析のスキル向上に役立つ情報源も多く提供されています。一方で、実践するための「データ」や「プログラミング実行環境」を持ち合わせていないことも多く、「実践力」を身につける機会が限られていました。特に、「構造化データ」に関しては、無料で利用できるオープンデータが多数あるものの、データ分析力の実践という観点で環境整備がなされたものはあまり多くありません。しかし、分析実務においてはデータの多くが構造化データであり、このようなデータを自由に加工・集計する技術はデータサイエンスの実践において極めて重要となります。

こうした状況を鑑み、データサイエンティスト協会スキル定義委員会(委員長:安宅和⼈)は、データの加工・集計、統計学や機械学習を駆使したモデリングの前処理など、基礎的なデータハンドリングの修行場として利用することを目的に「データサイエンス100本ノック(構造化データ加工編)」を公開しました。

■「データサイエンス100本ノック(構造化データ加工編)」 概要
・アクセス:GitHub https://github.com/The-Japan-DataScientist-Society
・実行環境のサポート言語:SQL、Python、R
・演習問題:各言語の設問100問
・解答例:各設問に対する解答例のファイルを用意
・本学習環境の説明資料ファイルを付属(環境構築手順などはこちらの資料をご確認下さい)

■演習問題の内容


必要なPCリソースおよびソフトウェア
1.OS:
・macOS 10.13 以上
・Windows10 Professional Edition
・Windows10 Home Edition
2.メモリ:8GB以上(Dockerへの割当4GB以上)を推奨
3.HDD:15GB以上の空きスペース
4.ソフトウェア:
・Docker DesktopまたはDocker Toolbox
・git(GitHubからZIPで取得する場合は不要)

実践環境
データサイエンス100本ノック(構造化データ加工編)の仕組みは以下の通りです。


データサイエンス100本ノック(構造化データ加工編)の仕組み

データサイエンティスト協会スキル定義委員会は、 データサイエンティストに必要とされるスキルセットの定義ならびにスキル育成と評価のための軸・基準を作ることを目的に活動しています。2014年にデータサイエンティストの「ミッション、スキルセット、定義、スキルレベル」策定、2015年に「データサイエンティスト スキルチェックリスト」作成、2016年に422のスキル項目がインターネット上でセルフチェックできるウェブサイトの立ち上げなどの活動を行っています。

《参考》
・ 「スキルチェックリスト ver.3」(2019)
    https://www.datascientist.or.jp/common/docs/skillcheck_ver3.00.pdf
・ DSスキルチェック ウェブサイト
    http://www.datascientist.or.jp/dssjournal/ds_skillcheck/
・ 「データサイエンティスト協会 6th シンポジウム(2019)」での「スキル定義委員会発表資料」
    http://www.datascientist.or.jp/symp/2019/pdf/1115-1155_skill.pdf

今後も、データサイエンティスト協会は、データサイエンティストという新たな職種が健全に成長をするための環境整備に取り組んでまいります。

一般社団法人データサイエンティスト協会について
データサイエンティスト協会は、新しい職種であるデータサイエンティストに必要となるスキル・知識を定義し、育成の支援など、高度IT人材の育成と業界の健全な発展への貢献、啓蒙活動を行っています。また、所属を超えてデータ分析に関わる人材が開かれた環境で交流や議論をし、自由に情報共有や意見発信ができる場を提供しています。2020年6月現在、111社15団体の法人会員と約14,200名の一般(個人)会員が参画しています。
代表理事:草野 隆史(株式会社ブレインパッド 代表取締役社長)
所在地:東京都港区白金台3-2-10 白金台ビル
設立:2013年5月
http://www.datascientist.or.jp/

*データサイエンス100本ノック(構造化データ加工編)の利用に関するご質問等について、個別での対応は受けかねますので予めご了承ください。
*また、データサイエンス100本ノック(構造化データ加工編)の利用により生じるいかなる問題についても、当協会は一切の責任を負いかねますのであらかじめご了承ください。

*本プレスリリースに記載されている会社名・商品名は、それぞれの権利者の商標または登録商標です。
*本プレスリリースに掲載されている情報は、発表日現在の情報です。

【本件に関するお問い合わせ先】
一般社団法人データサイエンティスト協会 事務局 小島
TEL:03-6721-9001 / Email: info@datascientist.or.jp

その他のリリース

話題のリリース

機能と特徴

お知らせ