Binance Casino,USDT娱乐,数字货币游戏,区块链游戏,BTC娱乐场,USDT投注,数字资产平台,体育娱乐,电子游艺,快速提现
依据我国的《国家健康医疗大数据标准、安全和服务管理办法(试行)》《中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》《数字中国建设整体布局规划》等文件,技术赋能旨在人民幸福感的提升。
就AI医疗而言,数据是其必备条件。在我国,医疗本身就在于增进人民的福祉,且AI的发展本应向善、为善。因此,AI医疗的宗旨也应是以技术推进福祉。
然而,由于技术的不确定性与监管的不完善,AI医疗中的数据问题频发。其中,与“数据-隐私”相关的问题更为密集且普遍。
数据的质量、数量、获取的正当性、使用的边界、泄露等问题是当下全球数智化进程的重点与难点所在,特别是医疗数据的高敏感性与高隐私性使得数据的安全性备受关注。这种安全性从技术的视角来看,至少包括获取安全、使用安全与存储安全。
从理论上来讲,应以合法合规和伦理的方式来释放数据潜能,进而推进医疗创新。易言之,医疗数据应确保患者的知情权和选择权,在数据流通的过程中应遵循公益性原则,且应确保数据的安全性和完整性。
然而,现实情况却并非完全如此。如,存在不知情同意的数据获取现象,存在即使患者是在知情同意的条件被获取数据,却也并不一定能知晓数据未来可能会被如何使用的现象等。
2020年6月,英国 Babylon Health 的 GP app 出现软件缺陷导致患者数据泄露[1];2024年9月,美国 AI 医疗保健公司 Confidant Health 的服务器配置错误,暴露了5.3 TB的敏感心理健康记录,包括个人详细信息、评估和医疗信息,给患者带来了严重的隐私风险[2]等事件引发了患者和公众对个人健康信息隐私和安全的深刻且合理的担忧。
因此,在AI医疗发展的进程中,一方面是医疗行业需要海量、多样化的高质量数据集以构建精准且可靠的AI模型,进而有效实现疾病的早期筛查、诊断与个性化治疗等;另一方面是患者和公众担心数据可能被滥用、泄露或用于商业牟利的恐惧。基于此,出现了AI医疗中的“数据-隐私”困境。
当前围绕AI医疗发展进程中的“数据-隐私”困境有着诸多争议,并导致了一场旷日持久的辩论。“医院应采集多少数据”恰恰是此中的一个关键问题,因为该问题是出现“数据-隐私”困境的缘起所在。
假设你是医生或者医疗机构,你期望采集多少数据呢?假设你是患者,你期望医疗机构应当采集你的哪些数据呢?
从个人信息保护的视角来看,过度数据采集显然是既不合理更不应当。在知情同意的前提下,“按需收集、最小必要”的数据最小化原则是采集数据的有效措施,这种措施有利于降低数据泄露风险,保护患者隐私。
然而,不得不面对的情况是,若数据采集过少,虽然体现了采集过程中的隐私保护,但是却会因数据不足或者代表性差而导致模型能力缺陷甚或偏见等,进而使得数据最小化原则在有些具体的技术研发与应用中,特别是某项技术本身所涉及的数据范围尚未确定时,必将出现该原则落地难的现象。
事实上,这种僵局的出现至少可以从如下两个方面进行解释,一是源自将数据采集的“量”视为确保AI医疗有效性的预设。迄今为止,在AI医疗领域中,关于数据采集的“量”的多少往往很难形成共识;二是源自患者对于数据的共享意愿。肖纳•卡尔克曼(Shona Kalkman)等通过定性和定量的研究发现:信任的缺乏不利于数据共享的目标。
尽管参与者认识到数据研究的实际或潜在好处,但他们对违反保密性和可能滥用数据的情况表示担忧,英国的 care.data 的失败就是一个典型的警示[3]。 即,就数据共享而言,信任是患者是否愿意数据共享的关键所在。
因此,“AI医疗该采集多少数据是个怎样的问题?”可被进一步转化或者归结为如何走出基于量的数据采集困扰,如何建立和维护信任。
长期以来,AI医疗的发展受制于高质量、大规模且合规的训练数据。但事实上,伴随技术的不断发展,AI医疗的未来不应再纠缠于“采集多少数据”,真正的出路在于通过前瞻性的技术选择与有效的AI医疗认知普及相融合,从根本上构建一个可信的AI医疗体系。
在AI赋能的当下,对AI的充分理解是有效推进技术向善、为善的必要条件。面对数据采集的困境,不妨通过AI对人类科研、认知、生活方式的范式转移的认知,来充分释放已有数据的潜能。
如,使用生产对抗网络(Generative Adversarial Networks, GANs)、变分自编码器 (Variational Autoencoders,VAEs)、 扩散模型 (Diffusion Models)等技术将已有的数据进行合成,即合成数据生成(Synthetic Data Generation,SDG)来降低采集成本,以隐私保护技术的方式减少隐私泄露的风险,克服对于罕见病或特定少数族裔群体,现实世界中可供研究的数据样本极其有限的数据稀缺性问题,进而提升AI医疗模型的公平性,缩短创新周期。
如,NVIDIA所的MAISI的医疗影像生成基础模型,就是在通过提供一种可靠、高效的方式来生成可用于研究、临床应用乃至外科机器人训练的高质量合成图像,从而克服数据稀缺和隐私限制的挑战[4]。
但需要高度警惕的是,鉴于合成数据本质上依然是来自于真实记录,进而仍然存在被重新识别的风险。因此,合成数据不是技术的肆意泛滥,而是重在对已有数据的高效使用,整个数据流程中的伦理监管依然不能缺席,且需要重塑数据治理框架,务必注重源头数据的伦理审查,特别是要高度重视合成数据过程中的知情同意。
破解“数据-隐私”困境的关键并非仅仅在于限制数据采集的多少,因为若医患之间的关系是不信任的,若医疗机构本身不被信任,那么,患者对数据采集本身就很担忧。
因此,不妨将破解的困境从数据采集本身的担忧着手,打造一个AI驱动的、以信任为基石的医疗体系,在这里,技术创新与个人尊严不再对立,而是携手并进,共同促进人类的健康与福祉。
具体而言,从引发该问题的相关因素来看,如,从与“数据-隐私”困境相关的利益群体来看,既需要通过对AI医疗技术的普及提升相关利益群体的信任度,也需要通过全民数字素养的伦理启蒙来减少与预防数据生命周期中的潜在风险。
如,除了数据采集者与使用者、相关技术研发者的伦理意识需要加强之外,患者不能将数据采集中的知情同意仅仅视为默认式的或者无关紧要的“必选项”而流于形式化的“听之任之”。
数据被采集者关于相关程序、条例等的认真审查与质疑等恰恰是发现问题的高效方式;从技术研发来看,提升技术的可信度是的信任的必要条件。
如,可以通过构建一个以合成数据保障模型训练安全、以去中心化身份(Decentralized Identity, DID)与可验证凭证(Verifiable Credentials, VCs)来提升个人数据安全,保护个人隐私进而构筑走向信任的技术屏障,以多方协同的方式形成以患者为中心的安全数据生态,打造基于信任的AI医疗体系。
特别声明:智慧医疗网转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。
上一篇:AI医疗与数据安全(二):解析《政务数据共享条例》对AI医疗数据应用的影响
下一篇:【SHAQ划重点】“三位一体”智慧医院建设工作中,网络与数据安全被重点提及!
不得以非医疗、教学、研究目的泄露患者的病历信息!国家卫健委发布《关于进一步加强医疗机构电子病历信息使用管理的通知》
AI医疗与数据安全(二):解析《政务数据共享条例》对AI医疗数据应用的影响
【SHAQ划重点】“三位一体”智慧医院建设工作中,网络与数据安全被重点提及!
不得以非医疗、教学、研究目的泄露患者的病历信息!国家卫健委发布《关于进一步加强医疗机构电子病历信息使用管理的通知》
AI医疗与数据安全(二):解析《政务数据共享条例》对AI医疗数据应用的影响
【SHAQ划重点】“三位一体”智慧医院建设工作中,网络与数据安全被重点提及!