〒103-0027 東京都中央区日本橋1-4-1 日本橋一丁目三井ビルディング 15階
経済学における実験設計と機械学習におけるデータ識別に関するレクチャーです.
(講演は日本語で行われます.)
詳細は以下の通りですが,イェール大学の成田氏には,被験者の幸福をおもんばかった実験の設計についての研究をお話し頂きます.とくにこのアルゴリズムが多腕バンディット問題と関連するので,近い研究者の方には必見です.
東京大学の小宮山氏には閑話休題として,公平性配慮型機械学習に関する話題提供をしていただきます.
最後に東京大学杉山・本多・佐藤研の坂井智哉氏に機械学習の文脈でやっているデータの分類研究をお話いただきます.
これは計量経済学分野の部分識別に近いテーマだったので,一度レクチャーしていただこうと企画しました.
---- スケジュール
14:00~15:30
成田悠輔 (Yusuke Narita) (Yale University)
倫理実験設計と反実仮想予測
概要:
前半では、被験者の幸福をおもんばかった実験の設計についての研究を紹介します。機械学習(特にcontextual multi-armed bandit)との関係について機械学習の皆さんに質問いたします。後半では、機械学習がお得意な現実予測ではなく、世界が変わってしまったあとの世界を予測する「反実仮想予測」を考えます。反実仮想予測についての問題提起をし、機械学習の皆さんの反応を伺ってみます。前半は以下の論文に基づきます。
Title: Toward an Ethical Experiment
Abstract: Randomized Controlled Trials (RCT) enroll hundreds of millions of subjects and involve many human lives. To respect subjects’ welfare, I propose an alternative design of RCT which I call Experiment-as-Market (EXaM). EXaM optimally randomly assigns each treatment to subjects predicted to experience better treatment effects, or to subjects with stronger preferences for the treatment. EXaM is almost incentive compatible for preference elicitation. Finally, EXaM unbiasedly estimates any causal effect estimable with standard RCT. To quantify these properties, I apply EXaM to a water cleaning experiment in Kenya (Kremer et al., 2011). Compared to usual RCT, EXaM substantially improves subjects’ predicted well-being while reaching similar treatment effect estimates with similar precision.
15:30~16:00
小宮山純平 (Junpei Komiyama) (University of Tokyo)
公平性配慮型機械学習に関する話題提供
機械学習アルゴリズムを用いて意思決定を行う場合、データに内在するバイアスによって特定のグループに不利な決定をすることが起きうる。例えば、特定の人種・性別・年齢などに不利なクレジット与信をアルゴリズムが与えてしまうということが考えられる。このような問題を防止する学習を公平性配慮型機械学習(or データマイニング)と呼ぶ。本発表では、いくつかの公平性基準を紹介する。それらの中でどれが望ましいのかを議論したい。
16:00~17:30
坂井智哉 (Tomoya Sakai) (University of Tokyo)
正例とラベルなしデータからの学習とその半教師付き学習への展開
人間を超える分類精度を達成する画像認識システムが開発されるなど,機械学習技術の発展が目覚ましい.こうしたシステムを構築するアプローチの一つに教師付き学習がある.例えば教師付き分類では,分類したいクラスそれぞれに関してラベル付きデータを用意し,分類規則を学習する.一方,実応用では,あるクラスに属するデータの正解を得ることは容易だが,他方のクラスに対しては難しいことがある.例えばSNS上の友達関係は,友達であることは友達申請からわかるが,友達でないことはわからない.このような状況は,正例(Positive data)とラベルなしデータ(Unlabeled data)からの学習(PU学習)と呼ばれ,近年盛んに研究されている.本発表では,このPU学習の設定の下で,二値分類,マルチ・インスタンス分類,情報量推定を行う手法を紹介する.加えて,PU学習に基づく半教師付き学習についても紹介する.
Public events of RIKEN Center for Advanced Intelligence Project (AIP)
Join community