筑波大学は人文・生命・理工・情報・医学・体育・芸術など極めて広範な分野にわたる教育を擁する大規模総合大学です。それぞれの教育組織においては、データサイエンスの基礎となる確率・統計を学ぶための科目が開設されていますが、データサイエンスのスキルは学問分野を問わず必要とされていること、また卒業後もあらゆる行政・産業分野においてデータに基づいた客観的な判断や意思決定の必要性が今後ますます高まることから、すべての学部において「データサイエンス」(2単位)を1年次必修科目として開設することとなりました。
データサイエンス・リテラシープログラムは、「データサイエンス」と、「データサイエンス」を履修する上で必要となるコンピュータサイエンスの基礎を学ぶ科目として、「情報リテラシー(講義)」(1単位、1年次必修)の2科目3単位で構成されています。
筑波大学の学生が所属する教育組織の専門分野は多岐にわたり、それぞれの学生が持つ背景知識やスキルは大きく異なります。この点を考慮して「データサイエンス」の授業内容は、以下の点に留意して設計されています。
データサイエンスの詳細な教育内容については、開設科目一覧を参照してください。
第1週では、「社会におけるデータサイエンスの位置付けとその意義」について学びます。ここでは、筑波大学の人文・生命・理工・情報・医学・体育・芸術など様々な分野において、データサイエンスに関わる研究者が提供する演習付きビデオ講義を視聴します。
さらに、個人情報保護法や統計法など、ヒトに関わるデータを扱う上で知っておくべき法令の基礎知識や、データ利用に関わる人権侵害やプライバシー侵害の事例、ヒトに関わるデータを用いた研究を行う上で必要な研究倫理の考え方と手続などを学びます。
第2-3週では、データサイエンスの全体像やライフサイクル(データ収集・管理・分析)について学び、導入としてデータの種類、データの収集、データの前処理、データの再利用性などついて学びます。
第4-5週では、データ管理の意義と目的、データ収集項目の設計、情報構造と表現の分離、データ工学の基礎などについて学びます。IoTやCPSなどの高度なデータ管理や、ビッグデータの高度活用など、アドバンスな内容は、本学のデータ工学を専門分野とする教員による演習付きビデオ講義により学びます。
第6週ではデータの可視化の意義と目的、データの可視化の方法、視覚的表現の選び方について学びます。
第7-9週では、データ分析の方法について学びます。具体的には、離散変数の理解と離散変数の統計、量的変数の理解と統計、因果と相関、複雑なデータの分析(時系列データ、ネットワークデータ)などを含みます。分野によっては必要に応じて、離散変数の統計検定(カイ2乗検定)、量的変数の統計検定(z-検定、t-検定)、線形回帰も扱います。
第10週では、高度なデータ分析として機械学習と人工知能について、本学の人工知能を専門分野とする教員による演習付きビデオ講義により学びます。
開講科目数は日本語50クラス、英語1クラスです。データサイエンス科目は、10週2コマ(1コマは75分)2単位の科目として設計され、授業はすべて一人一台のコンピュータが利用可能な計算機室で実施しています。授業時間は150分であり、標準的には講義60分、授業管理システムを用いたクイズ15分、計算機を用いた演習75分で構成されています。演習課題は授業後の課題としても課されます。各クラス150分のうち75分は、学生による演習の実施を補助するために、大学院生によるティーチングアシスタントが割り当てられています。
様々な学部の学生の必修科目であることを念頭に、理学・工学分野だけでなく、文系や体育分野、芸術分野等の非理工系分野まで全ての学士課程に対応可能な標準教材(スライド)、演習課題、クイズ(小テスト)を作成しています。入門レベルから高度なレベルまで複数の演習問題を用意し、数学的スキルに応じて柔軟に授業内容を構成をできるように設計しています。データサイエンスの個別分野への応用や、高度なデータ管理、データ分析などについては、これを専門とする教員によるビデオ講義および演習を作成し、提供しています。また筑波大学で実施する英語プログラムに対応するため、標準教材およびビデオ教材については英語の教材も作成しています。動画講義はオープンコースウェアとして一般公開されています。
筑波大学 オープンコースウェア データサイエンス講義
作成した教材は、数理・データサイエンス教育強化拠点コンソーシアムに提供し、数理・データサイエンス教育の普及を図ることを予定しています。