News
お知らせ
2024 12.19 18:00
2024年12月19日(木)にMDA異分野融合/連携ゼミナール「AIと個性」を開催しました。東京大学の五十嵐歩美氏と、筑波大学システム情報系の福地一斗氏を講師にお迎えし、公平性を軸とした資源配分と差別のない公平な機械学習アルゴリズムについて講演いただきました。
公平な資源配分メカニズムの理論と応用
五十嵐歩美(東京大学)
限られた資源を多様なニーズを持つ個人にどのように分配すればよいかという課題に対し、「公平性」や「効率性」を両立する資源配分メカニズムの設計理論と、それが社会でどう応用されているかについて講演いただきました。
東京大学マーケットデザインセンターの一員として、経済学研究科の枠組みで数学・科学的知見に基づく制度設計を探究してきた。ケーキ分け問題など、限られた資源をいかに公平に分けるかを主題としている。好みが異なる参加者間でも妬みのない配分は理論上存在し、近年は計算アルゴリズムも示されている。理論の応用は、タスクの割当や相続財産の配分など広範にわたっている。
公平配分理論の要点は、公平性だけでは不十分で、効率性との両立が必要という点である。何も配分しない案は妬みがないが無意味である。そこでまず、エージェントとアイテム、各自の効用を前提に、公平性と効率性を厳密に定義する。妬み(他人の割当を欲する状態)が生じない配分、妬みなし(EF)を理想とするが、資源が少ないとこれは存在しない。そこで、一人分のアイテムを除けば妬みが消えるEF1を用いれば、常にEFが存在し効率的に計算できる。効率性はパレート最適で測り、加法的で正の効用なら効用積最大化によりEF1とパレート最適を同時達成できる。家事やタスクのように効用が負になり得る場合の両立は一般には未解決であるが、二者などの特殊ケースでは簡単なアルゴリズムが知られている。
この理論の家事分担への応用として、夫婦間のジェンダーギャップや、「名もなき家事」への無関心を課題に、話し合いのきっかけを作る家事分担アプリを開発した。NHKとCode for Japanの育児ハッカソン発の取り組みで、まずは家事リストに対する三段階の好みと所要時間を入力し、負担度を算出する。EF1とパレート最適を同時に満たす公平アルゴリズムで理想配分を提示し、パイチャート等で可視化する。このアプリを扱ったNHKスペシャルの放送後には1万人超がサイトを訪問した。2024年3月のデータ解析では、現状配分に比べ、EF1+パレート配分で「私」側の妬みなし割合が約2倍、パートナー側も10%超増加と推計された。提案結果は負担を正規化して示し、得意な作業を得意な人へ回すことで双方の負担が下がる例も確認した。公平配分の数理モデルでは、公平性や効率性といった概念を数学的に定義でき、達成すべきゴールを明確に示すことができる。ただし、複雑な問題に応用していくときの効用関数の設定が課題になる。
公平な機械学習アルゴリズム
福地一斗(筑波大学 システム情報系)
AIや機械学習の社会実装が進む中で、「公平性」という価値をどのようにアルゴリズムに組み込むかという課題について、具体的な研究事例を交えて解説いただきました。
機械学習における不公平の過去の事例として、履歴書を機械学習によってスコア化するシステムのなかで女性関連語が不利となることで開発を断念したり、顔認証APIにおいて黒人女性の精度が低く差別的な結果を招いたりといったものがある。公平性に関する研究は社会科学・哲学・法学を巻き込む学際領域で、国際会議でも議論が盛んに行われている。
機械学習に公平性を組み込むには、曖昧な「差別」を数学的に定義して最適化問題として定式化する必要がある。公平学習では、精度最小化に加えてジェンダー等のセンシティブ情報を受け取り、公平性制約を満たすモデルを学習する。基本発想は、群間での影響を等しくすることになる。ただし住所などの代理変数により、敏感属性を直接使わなくても間接差別が起こるため、公平性指標を用いて誤差と同時に最小化/制約化する。達成度は男女の採用率差などの指標で数値化し、ある閾値以下に制約するか、損失にペナルティとして加えて最小化するアプローチが取られる。誤分類の種類に基づく別定義も多い。実務では母集団ではなく経験的近似で最適化することから、指示関数に起因する非連続性・計算量の困難が残る。
近年の公平性研究は、非連続な指示関数等に起因する最適化の難しさを乗り越える手法が中心だったが、現在はアルゴリズム上の公平性が現場導入後にも成り立つか、より複雑な状況で機能するかに関心が移っている。まず理想化設定で最適な予測器を復習し、デモグラフィック・パリティ制約下では群別に閾値を変えるのが最適、回帰でも群別写像の導入が有効と示されている。これにより精度とのトレードオフや「公平性のコスト」を閾値調整量で記述でき、後段のポストプロセッシング設計にもつながっている。さらに、最悪ケース損失の枠組みやガウス×線形の解析で、間接/直接差別を取り込んだ最適学習の性質と、平均整合は無コストだが分散整合はコストを伴うといった知見が得られている。研究的意義は、既存モデルに後処理で公平性を付与できる点で、従来の学習努力を活かしつつ、実運用の要請に応えられることが求められている。
文責:浦田淳司