データ科学研究室

法政大学 理工学部 経営システム工学科

研究室の学び データを正しく読み解き、未来の姿を見通す

情報通信技術の進歩によって、身の回りのさまざまなモノとインターネットがつながり、モノの情報(価値)やその生産への需要を把握しやすい時代になりつつあります。本研究室では、モノやインターネットなどから生まれるそれらのデータの意味を、統計学の観点から解釈する研究を行っています。データの背後にある構造を数理的にモデリングし、データを読み解くことで、その価値を見出すことの出来る人材の育成を目指します。

社会との接点 データと統計学で予測する

現在の社会を取り巻く環境において、多くの異常とも言える現象を観測しています。地球温暖化・大型地震・感染症のパンデミックなどの自然現象や、計算機器の高速化・IoTなどの情報通信技術の発達・人工知能と思しきアルゴリズムの開発などの近代技術は、ここ数年で大きく変化しています。これらの変化を出来る限り理解し、解釈した上で将来の姿を想定することが重要です。本研究室では、統計学の目指すところは予測であるという信念のもと、さまざまなデータから、その将来の状態を予測することをテーマとして扱います。科学と工学と社会を、統計学と情報技術のもとでリンクさせることを試みます。

製品寿命は加速寿命試験で推測する

本研究室で行う加速寿命試験の統計モデリングの研究については、身の回りに存在する電気機器の寿命を予測することに役立っています。寿命を予測することで、製品の信頼性を実証したり、保証期間の設定に応用されます。

試験そのものも評価して、学力を高精度に

本研究室で行っている能力評価の推定とその予測に基づく出題方式の最適化に関する研究で扱う理論は、多くの人が利用している英語語学力試験であるTOEICなどで利用されており、今後この研究をさらに進めることで、資格試験の場面だけではなく、もっと身近な日頃の学習支援の場面で活用されることも考えられます。

見る・知る・見せる データの加工・分析・可視化

データはさまざまな方法で集められます。それは、センサの出す出力だったり、web閲覧履歴だったり、スポーツ勝敗結果だったりします。 まずはそのデータを人が見れるようにします。可視化してグラフを作ったり、勝ち負けを1や0で置き換えたりして、いろいろなデータの見え方を探ります。 次に、そのデータが生み出されたメカニズムを考えます。統計モデリングといいます。観測されたデータはとてもノイズが含まれています。たとえば、web閲覧履歴は、みなさんの嗜好が情報として入りますが、操作ミスによるものや不本意なページ遷移なども含まれます。これがノイズです。統計モデリングではこういったノイズを、個人によるものか、webページ由来のものか、はたまた全くの偶然によるものかを切り分けて考えていきます。 切り分けることができたら、その結果を分かりやすい形で表現します。分析結果を伝えることで社会に還元します。

卒業後の進路 データサイエンスはあらゆるビジネスの武器になる

この研究室ではデータサイエンスの基礎となる統計学を軸とした研究を行っています。卒業後の進路としてはSEやコンサル系、または証券、運輸、不動産など多岐にわたっています。データを扱う統計学は、あらゆる業種で必要とされ、また適応できる学問だと思います。情報化やグローバル化が進む現代社会では、さまざまな仕組み(企業、情報、生産等)が複雑化しており、そういった仕組みを収集したデータから分析し、科学的にアプローチできる人材は今後どの分野でも求められていくでしょう。ぜひともデータを正しく読み解く目を養ってほしいと思います。