PrivacyTech

( EVENT REPORT )

トップトップ

お役立ち情報お役立ち情報

イベントレポートイベントレポート

【音声あり】実践における合成データ──機会と課題

【音声あり】実践における合成データ──機会と課題

PlayBook(社内ルール)
開発支援サービス

AI・パーソナルデータ利活用のルールをまとめ、現場の機動力を加速する。

総務省
RECRUIT
RECRUIT
RECRUIT
もっと詳しくもっと詳しく
arrow_forwardarrow_forward

Panel Session 3: Synthetic Data in Practice: Opportunities and Challenges
GPA 2025 SEOUL: 47th Global Privacy Assembly 現地レポート[Vol.3] 

この記事は、GPA 2025 SEOUL: 47th Global Privacy Assemblyにおける講演内容をもとに、AIによる自動音声認識および自動翻訳技術を用いて作成されたものです。その性質上、実際の講演内容と異なる表現や解釈が含まれる可能性があり、一部の情報が省略または不正確である場合があります。
また、この記事は音声でもお楽しみいただけます(Notebook LMの音声概要機能を利用しています。記事の内容との齟齬や文字の読み方が正確でない部分がありますので、予めご了承ください)。

この度、株式会社プライバシーテックは、2025年9月に韓国ソウルで開催された国際会議「GPA Seoul 2025」に参加いたしました。本会議では「日常生活における人工知知能(AI):データとプライバシーの課題」をテーマに、AI時代のデータガバナンスについて活発な議論が交わされました。弊社が聴講した主要セッションの内容を、皆様の実務に役立つ形でお届けします。

◆ この記事でわかること
===
・合成データは、プライバシー保護に加え、AI学習のためのデータ拡張やバイアス是正にも活用される有望なプライバシー強化技術である。 
・合成データはプライバシーリスクの評価が最大の課題であり、各国の規制当局においてガイドラインの策定が進められている。
・韓国の金融業界やドイツの自動車業界(自動運転)などで既に合成データの活用が始まっており、各分野の特性に応じたプライバシー課題への対応が模索されている。
===

登壇者


転載:GPA SEOUL 2025
Moderator & Presenter: Khaled El Emam (Canada Research Chair, Medical AI at the University of Ottawa)
Khaledはオタワ大学疫学・公衆衛生学部の教授であり、同大学において医療AI分野のカナダ研究チェア(ティア1)を務めている。また、東部オンタリオ小児病院研究所の上級研究員、オンタリオ州情報・プライバシー委員会(IPC)の客員研究員も兼任している。
データ管理・データ分析分野において6つの製品・サービス企業を設立または共同設立し、そのうちいくつかは成功裏に売却された実績を持つ。学術職に就く前は、カナダ国立研究評議会の上級研究官を務めた。またドイツ・カイザースラウテルンにあるフラウンホーファー研究所では定量手法グループの責任者を歴任。博士号は英国ロンドン大学キングス・カレッジ電気電子工学科にて取得。


転載:GPA SEOUL 2025
Sungkyu Jung (Professor, Seoul National University)
Sungkyuはソウル国立大学の統計学教授であり、科学データイノベーション研究所の所長を務めている。ノースカロライナ大学チャペルヒル校で統計学の博士号を取得し、以前はピッツバーグ大学の教員であった。彼の研究は、非ユークリッド空間、高次元データ、およびマルチソースデータに対する現代統計理論と手法に焦点を当てており、次元削減、データプライバシー、多様体ベースの分析への応用を含む。

Jörn Wittmann (Group Privacy Ambassador, Volkswagen Group)

はじめに:プライバシーとデータ活用の未来を拓く「合成データ」

司会: 皆様、セッションにご参加いただき、また多くのご質問をお寄せいただき誠にありがとうございます。それでは、第3パネルセッションへと移ります。本セッションでは「実践における合成データの機会と課題」という、非常に今日的で重要なテーマについて議論を深めてまいります。

近年、注目を集めている「合成データ」は、実在するデータセットが持つ統計的な特性を忠実に維持しつつも、全く新しいデータを人工的に生成するプライバシー強化技術(PETs)の一つです。

この技術は、社会が求める高いレベルのプライバシー保護と、イノベーションに不可欠なデータの有用性という、時に相反する二つの要求を両立させる有望な手法として、大きな期待が寄せられています。信頼性の高いAIシステムやデータ分析モデルを構築する上で、その重要性はますます高まっています。

本日のセッションでは、まず合成データに関する現状の概念整理や最新の研究動向、そして各国の政策がどのような方向を向いているのかを概観します。その後、産業界において合成データが実際にどのように応用されているのか、その具体的な事例や実践から得られた知見に焦点を当てて、議論を掘り下げていく予定です。

それでは、本日の豪華な登壇者をご紹介します。モデレーターを務めていただくのは、この分野の第一人者であるカナダ・オタワ大学のKhaled El Emam教授です。そしてパネリストとして、ソウル国立大学よりSungkyu Jung教授、フォルクスワーゲン・グループよりJörn Wittmann氏をお迎えしております。まずはセッションの導入として、El Emam教授からプレゼンテーションをお願いいたします。

合成データの基本概念と規制の動向

Khaled: ご紹介ありがとうございます。この重要なセッションの冒頭として、まずは「合成データ」とは一体何なのか、そしてそれが現在の法規制や政策の中でどのように位置づけられているのかについて、基本的な解説をさせていただきたいと思います。

合成データの定義とプライバシー保護における役割

本日私たちが議論の対象とする「合成データ」とは、プライバシー保護を強化する技術の一環として、特定の個人を識別することが不可能な情報、すなわち「非個人情報」を生成することを主な目的として開発されたものです。

その最も典型的な生成プロセスは、次のようなステップで構成されます。まず、実在する個人情報を含むデータセット(トレーニングデータ)を用いてAIモデルを訓練します。この過程で、AIモデルは元のデータが持つ統計的なパターンや変数間の相関関係を深く学習します。

そして、その学習が完了したモデルから、全く新しいデータを生成するのです。これが合成データです。重要なのは、生成されたデータと元のデータの間には、個人単位での一対一の直接的な対応関係が存在しないという点です。この特性こそが、合成データがプライバシーを強力に保護する根拠となります。

プライバシー保護にとどまらない合成データの可能性

しかし、合成データがもたらす利点はプライバシーの保護だけに限りません。例えば、高性能なAIモデルの学習には、膨大かつ多様なデータが必要不可欠ですが、現実には十分なデータが得られないケースが少なくありません。

医療分野における希少疾患の研究や、法規制が厳しい小児関連のデータなどがその典型例です。このような場合に、小規模な実データセットから統計的な特徴を維持した合成データを大量に生成することで、データ量を拡張し、AIモデルの訓練に活用することが可能になります。

また、多くのデータセットには、特定の性別や人種、社会的背景を持つ人々のデータが過剰または過少に含まれているという「バイアス」の問題が存在します。これは、AIが差別的あるいは不公平な判断を下すアルゴリズムを生み出す深刻な原因となります。

合成データは、このようなデータセットの偏りを意図的に是正したり、あるいはその影響を軽減したりするための有効なツールとしても活用することができます。

合成データを取り巻く法規制と今後の展望

もし合成データが、法的に個人を特定できない「非個人情報」として明確に扱われるのであれば、データ主体の同意取得や権利に関する義務は最小限となり、組織はこれまで以上に自由かつ柔軟にデータを活用できるようになります。例えば、新しいソフトウェアのテスト、社内での高度な分析モデルの訓練、さらには外部のパートナー企業との安全なデータ共有など、その応用範囲は多岐にわたります。

しかし、ここで最も重要な問いが浮かび上がります。それは、「生成された合成データは、本当に非個人情報であると断言できるのか?」という点です。残念ながら、これまでに行われてきた合成データに関する学術研究の多くは、生成されたデータが持つプライバシーリスクの評価を十分に行ってきませんでした。

この根本的な疑問に対し、近年、英国やシンガポール、そして韓国の規制当局が相次いでガイドラインを発表しており、そのいずれもが「合成データであっても、そのプライバシーリスクを評価するプロセスが不可欠である」という点で完全に一致しています。つまり、合成データを匿名化されたデータの一つの形態とみなし、匿名化データに関する既存のルールや評価基準を適用するというのが、現在の国際的な共通認識と言えるでしょう。

最近では、合成データが抱えるプライバシーの脆弱性を定量的に評価するための国際的な専門家パネルも組織され、評価手法の標準化に向けた動きが大きく前進しています。こうした客観的な評価手法が確立されることで、データを活用する組織はより安心して合成データを導入できるようになり、規制当局もまた、一貫した基準に基づいた監督や指導を行いやすくなるはずです。

韓国における合成データの活用と法的課題

Sungkyu: 現在の韓国におきましては、合成データの活用が政府機関と民間企業、その双方で急速に進展しています。具体的な例を挙げますと、国の行政機関が保有する公共データを合成データ化して一般の研究者や企業に公開したり、「AI Hub」という政府主導のウェブサイトを通じて、金融や医療といった機微な情報を含む分野の合成データセットが共有されたりしています。

特に金融業界では、データ駆動型の新しいサービス開発が活発化しており、それに伴い、合成データの需要が非常に高まっています。しかし、そこには法的な課題も存在します。生成された合成データが、法的に完全に「匿名化データ」として扱われ、自由に利用できるのか、あるいは、特定の目的でのみ利用が許される「仮名化データ」の範囲に留まるのか、という点について、産業界全体での明確なコンセンサスがまだ形成されていないのです。

この重要な課題に対応するため、韓国の個人情報保護委員会(PIPC)は、企業や研究者が参照すべき詳細なガイドラインを策定しました。このガイドラインは、合成データが法的に「匿名化データ」と見なされるための具体的な条件や、その評価手順を定めています。そして、プライバシー・バイ・デザインの原則に基づいた開発フレームワークを提供することで、安全なデータ活用を社会全体で促進することを目指しています。

自動車業界におけるデータ活用の最前線

Jörn: 私たちが身を置く自動車業界、とりわけ自動運転技術の開発において、データは安全性快適性という二つの至上命題を実現するための、まさに根幹をなす要素です。自動運転システムは、車両の周囲に搭載された多数のカメラやセンサーから得られる膨大な情報を基に、周囲の環境をリアルタイムで認識し、次の行動を判断します。

このシステムの認識精度や判断能力を高めるためには、考えうる限り多様な走行データでAIを訓練し続ける必要があります。しかし、現実世界で起こりうる全ての交通状況を事前に予測し、限られた数のテスト車両だけでその全てを網羅するデータを収集することは、物理的に不可能です。

そこで極めて重要になるのが、実際に市場で顧客が運転する一般車両から、安全上特に重要な意味を持つ「稀な事象」、例えば、予期せぬ歩行者の飛び出しや、前方の車両の急ブレーキといった事象が発生した際にデータを収集し、そのデータを用いてAIを継続的に再学習させるという仕組みです。

もちろん、このアプローチを実現する上では、ドライバーや同乗者のプライバシーに対する最大限の配慮が不可欠です。私たちが技術的に関心を持っているのは、個々の車両の識別情報や、車内に誰が乗っているかといった詳細ではありません。あくまで、「そこに車両が存在する」という事実そのものを、可能な限り高い精度で、いかなる状況下でも認識することです。

私たちの究極の目標は、ご自身の、そしてご家族の命を安心して預けられるような、安全で快適な自動運転システムを実現することです。そのためには、実世界のデータをプライバシーに配慮した形で最大限に活用し、システムの性能を継続的に向上させていく必要があり、社会の皆様のご理解とご協力が不可欠であると考えています。

結びの挨拶

司会: 皆様、それぞれのお立場から大変興味深いご意見を誠にありがとうございました。本日の議論が、合成データという新しい技術への理解を社会全体で深めるための一助となれば、これに勝る喜びはありません。ご清聴、ありがとうございました。

以上

===

◆ 関連記事
[Vol.1]GPA 2025 ソウル 開会セッション ── 基調講演
[Vol.2]AI時代のグローバル・データガバナンス 
[Vo.3]実践における合成データ──機会と課題←この記事
[Vol.4]AIが医療サービスとプライバシーに与える影響
[Vol.5]基調講演──EUにおけるAI規制とデータ保護の調和
[Vol.6]AI時代のデータ保護法と法的根拠──世界の規制当局が語る最前線
[Vol.7]データ保護機関(DPA)の新規設立と制度化
[Vol.8]基調講演──ヒューマン・フラッキングとプライバシーの未来
[Vol.9]AIは「エージェント」の時代へ──未来のプライバシーを考える
[Vol.10]AI時代のルールメイキング──規制とイノベーションの共存
[Vol.11]プライバシーは「人間性の未来」──OpenAIが描くAIとの共存
[Vol.12]越境データ移転における相互運用性の強化
[Vol.13]データ保護における救済と相互運用性──消費者の視点から
[Vol.14]AI時代の健康データ活用とプライバシー──イノベーションと社会的信頼の両立←この記事
[Vol.15]AI医療とプライバシー──健康データ「二次利用」の最前線
[Vol.16]AI医療と規制当局──いかにして「公衆の信頼」を築くか

===

<<前へ:AI時代のグローバル・データガバナンス 
>>次へ:AIが医療サービスとプライバシーに与える影響

===

GPA 2025公式サイト:https://gpaseoul.kr/

#AIガバナンス #AI利活用 #プライバシー #GPA #プライバシーガバナンス #データガバナンス #AI #プライバシー保護 #プライバシー強化技術 #PETs #AI開発 #合成データ #データの有用性 #プライバシーリスク評価 #非個人情報 #匿名化 #AIモデル訓練 #AIとプライバシーの両立 #プライバシー・バイ・デザイン #AIリスク管理 #自動運転

お問い合わせ・資料ダウンロード

人手不足のガバナンス業務をAIで自動化する。

プライバシーテックは、人手不足のガバナンス業務をAIで自動化します。最新のデータ利活用時におけるプライバシー保護技術に関して、資料ダウンロードも可能です。是非ご覧ください。

過去の支援実績

総務省
RECRUIT
dentsu
SONY
odakyu
unerry
Loyalty Marketing
CCC MARKETING
GMO
HAKUHODO
NTT BP

最新資料

PrivacyTech GRoW-VA

散在する情報を、複利を育むIntelligenceに変え、AI・データガバナンスの実行を支援・自動化。AIとデータガバナンス領域の専門性を深いレベルで統合し、顧客ごとにカスタマイズされた出力をスピーディーに実現できるプラットフォームです。

この資料をダウンロードこの資料をダウンロード
file_downloadfile_download

PlayBook開発支援サービス

AI・データ活用の原理原則・ルールをまとめた、PlayBook(プレイブック)は急速に進化する技術を乗りこなしていくため、現場の従業員が課題を発見し、対策を導くための手順・戦略・ノウハウをまとめた指南書です。

この資料をダウンロードこの資料をダウンロード
file_downloadfile_download

PIAとはなにか? (策定と運用)

Privacy Impact Assessment (Data Protection Impact Assessment)プライバシー影響評価(データ保護影響評価)に関する概要説明、及びプライバシーへの配慮を前提とした開発モデル「プライバシー・バイ・デザイン(PbD)」について記載しております。

この資料をダウンロードこの資料をダウンロード
file_downloadfile_download

プライバシーポリシー改定の進め方

AIや3rdParty、Cookieレスへの対応など、従来の個人情報管理だけではない、利用者への説明責任や選択機会の提供の対応が求められています。そういった環境変化に対応するための戦略的プライバシーポリシー改定の方法を記載しております。

この資料をダウンロードこの資料をダウンロード
file_downloadfile_download

プライバシーセンター新規開設の進め方

Webサイトやアプリのアクセス時に突如出現する「同意取得バナー」や、難解で大量の文字で埋め尽くされた規約で、生活者(ユーザー)から同意取得をすればよいという対応は、既に形骸化しており、もはや時代にそぐわないものになっています。生活者との信頼の醸成に繋がるプライバシーの同意取得の方法・考え方を記載しております。

この資料をダウンロードこの資料をダウンロード
file_downloadfile_download

改正電気通信事業法 外部送信規律の対応事例

2023年6月16日から改正電気通信事業法が施行されることになり、「外部送信規律」が新たに追加されました。これは、インターネットでビジネスを展開する際、利用者に対して、透明性を高めることを義務化する法律です。この対応を怠ると、行政指導や業務改善命令、従わない場合は200万円以下の罰金が課されるため、他社事例を元にこの規律を学んでいただける資料を作成しております。

この資料をダウンロードこの資料をダウンロード
file_downloadfile_download

関連記事