ChatGPT的AI安全之道_微动态
近期,关于ChatGPT在数据采集和使用方面有安全隐患的报道层出不穷。
(资料图片)
4月6日凌晨,OpenAI在官网发布了《 Our approach to AI safety 》(“我们的AI安全之道”),介绍了自己在安全、可靠地为全球用户提供ChatGPT服务方面所做的努力。
以下是我对重点部分的翻译(括号中斜体文字是我的评论,另点击“阅读原文”可以查看原文):OpenAI 一直致力于确保人工智能系统的安全性和广泛的效率提升。我们的全球用户告诉我们,ChatGPT可以提高他们的生产率,增强他们的创造力,并提供量身定制的学习体验。 我们也认识到,像任何技术一样,这些工具会带来真正的风险——因此我们在系统的各个级别上都建立了强有力的安全保障。
建设越来越安全的AI系统
在发布任何新系统之前,我们会进行严格的测试,邀请外部专家提出反馈意见,通过强化学习、人类反馈等技术改进模型的行为,并构建广泛的安全监控系统。
例如,在我们最新的模型GPT-4完成训练后,我们花费了超过6个月的时间,全力打造更加安全和一致的模型,并在发布之前进行了充分的测试。
我们认为,强大的AI系统应该接受严格的安全评估。需要监管措施来确保采取了这样的规定。同时,我们也积极地与政府合作,讨论这种监管措施的最佳形式。
( 监管措施的增长曲线会在技术逐步进入快速发展期之后启动,目前各国已经出现这样的趋势,下图为我的朋友龚总Robin画的技术发展阶段曲线图,在Gartner曲线基础上叠加了监管曲线、市场占有率曲线和社会接受度曲线,很有参考意义。 )
通过在实践中学习,加强安全保障
虽然我们尽力在部署新系统之前防范各种可以预见的风险,但是我们在实验室中所能学到的知识毕竟是有限的。因为,尽管进行了广泛的研究和测试,但我们仍然无法预测人们将如何使用我们的技术。 这就是为什么我们认为,从实践中学习,是建设和发布越来越安全的AI系统的重要手段。
因此,我们以小心谨慎的、循序渐进的方式,向越来越广泛的人群发布新的AI系统,期间采取了大量的保护措施,并根据我们学到的经验,进行持续的改进。
保护儿童
我们安全工作的一个关键重点是保护儿童。我们要求人们必须年满18岁,或在父母的批准下年满13岁才能使用我们的AI工具,并正在寻求年龄验证方法。
我们不允许我们的技术用于生成仇恨、骚扰、暴力或成人内容等其他类别。我们最新的模型GPT-4对不允许的内容的响应请求比GPT-3.5少82%,我们建立了一个强大的监测系统来监测滥用。GPT-4现已可用于ChatGPT Plus订户,我们希望随着时间推移,将其提供给更多人使用。
尊重隐私
我们的大型语言模型是基于广泛的文本语料库进行训练的,其中包括公开可用的内容、许可内容和人工评审生成的内容。
我们不使用数据来销售我们的服务、广告或创建人们的资料——我们使用数据使我们的模型更有益于人们。例如,ChatGPT通过进一步训练人们与其进行的对话而改进。
虽然我们的一些训练数据包括可在公共互联网上获得的个人信息,但我们希望我们的模型学习世界,而不是个人隐私信息。
因此,我们努力在可能的情况下从训练数据集中删除个人信息,微调模型以拒绝请求个人信息,以及回应个人请求从我们的系统中删除其个人信息。这些步骤最大程度地减少了我们的模型可能生成包含私人个人信息的响应的可能性。
( 这部分是对个人输入信息可能会用于模型训练的回答,事实上,在ChatGPT的使用条款中,OpenAI注明,用户可以选择是否允许将自己的数据用于模型训练,而且对于API用户,其选项默认就是关闭的 )
改善事实准确性
今天的大型语言模型根据它们先前看到的模式,包括用户提供的文本输入,来预测下一个系列的单词。在某些情况下,下一个最可能的单词可能不准确。
( 这里描述的是Transformer模型的工作原理 )
改善事实准确性是OpenAI和许多其他AI开发人员的主要关注点,我们正在取得进展。通过利用ChatGPT输出被标记为不正确的用户反馈作为主要数据源,我们已经改进了GPT-4的事实准确性。GPT-4比GPT-3.5更有可能产生真实的内容。
( GPT-4与Plugin和Browsing的结合,进一步提升了保障内容真实性的能力 )
持续研究和参与
我们认为,解决AI安全问题的实际方法是将更多的时间和资源投入到研究有效的安全和合规技术,并测试它们对真实世界中各种滥用行为的承受力。
重要的是,我们也认为,提高AI的安全性和能力应该相辅相成。迄今为止,我们最好的安全工作是通过我们能力最强的模型合作完成的,因为它们更擅长按照用户的指示行事,并且更容易指引。
我们将越来越谨慎地创建和部署更有能力的模型,并将在不断发展我们的AI系统的同时,继续改进安全预防措施。
尽管我们等待了超过6个月的时间才部署GPT-4,以更好地了解其能力、好处和风险,但有时需要更长时间来改进AI系统的安全性。
因此,政策制定者和AI技术提供商需要在全球范围内,有效地治理AI的开发和部署,以免有人为了走在前面而偷工减料。
这是一个艰巨的挑战,需要技术和制度创新的结合,但这也是我们热切希望做出贡献的重要领域。
解决安全问题还需要广泛的辩论、实践和参与,包括对AI系统行为边界的讨论。我们一直在促进各方利益相关者之间的合作和开放对话,以创建一个安全的AI生态系统。
标签:
- 世界百事通!初音未来的男朋友叫什么名字_初音未来的男朋友
- 世界观天下!一杯“荷塘咖啡”撬动文旅融合产业链 村民享受文旅发展红利
- 从缅甸逃回男子自述:水牢满地是血,女子遭囚禁虐打,好看的被卖至娱乐场所|看点
- 全球今年恐迎来厄尔尼诺“大烤”_热门看点
- 一张图:2023/07/03黄金原油外汇股指"枢纽点+多空占比"一览
- 黄酒怎么泡红枣?
- 定海浮生录·叁-每日关注
- 午评:两市放量上行沪指涨1.29% 汽车与保险行业领涨 世界即时看
- 【天天速看料】新田:李祥佐走访慰问困难党员和老党员
- 微头条丨服务不间断 持续助力高校毕业生就业
- 同情他们!第一批“吃螃蟹”的那些人,正提心吊胆开电动车
- 焦点简讯:成都东软学院学费多少_成都东软学院学费
- 呼和浩特强降雨引发山洪,致1人死亡2人失联
- 小暑吃黄的好处及方法
- 安控科技7月3日快速上涨
- 十年寒窗无人问一举成名天下知雪怕太阳草怕霜人怕没钱情怕伤_十年寒窗无人问
- 实时焦点:我恨狮子座人数_我恨狮子座
- 株洲桂娟餐饮服务有限责任公司_关于株洲桂娟餐饮服务有限责任公司概略-热推荐
- 毕业生报到证去哪里报到(毕业生报到证)|焦点精选
- 全球热消息:英国脱欧的原因及事件经过(英国脱欧的原因)
- 今日热议:津城天气:雷阵雨“灭火”!别想得美!
- 环球要闻:对虚开骗税等涉税违法行为亮剑出击广州市税务局释放税务稽查执法刚威
- 汕尾陆丰警方通报一加油站发生火灾:涉嫌放火者已被刑拘 全球播报
- 罗马诺:切尔西将继续与布莱顿谈凯塞多转会;球员已同意加盟-当前信息
- 全球今亮点!重庆启动水旱灾害防御Ⅳ级应急响应
- 9月上市/定位高于深蓝SL03 启源A07更多消息露出 全球最资讯
- 十个人电梯超重的问题_十人电梯超重官方答案 天天动态
- 红米手机参数配置对比(红米x40手机参数)
- 今日观点!《红楼梦》《小美人鱼》,“国家队”以芭蕾“明珠”点亮申城夏夜
- 世界最大跨径公轨两用悬索桥进入主塔施工阶段|世界百事通
- 世界观速讯丨喜报!我校7门课程新入选国家级一流本科课程
- 当前信息:蜗牛移动怎么查话费?_蜗牛移动怎么查话费
- 中金岭南韶关冶炼厂新增12万吨锌基新材建设项目(一期)工程开工_通讯
- 注意,发票作废的时代或将结束!
- 每日速看!秦静温乔舜辰最新章节1350章
- 局长信箱怎么查询回信西安医疗保障局(局长信箱怎么查询回信)
- 丹佛斯变频器面板按键说明图_变频器面板按键说明书
- 美国今年已发生186起儿童意外枪击事件 当前简讯
- 温网开赛前迎坏消息!郑钦文的运气太差了,网友:又要白忙活? 环球要闻
- 上财校友会无锡讲座分享会-环球快消息
- 【独家焦点】路面更平整,通行更顺畅!他们积极探索社区治理新模式
- 高校该不该开放?有商家将高校参观做成“付费生意”
- 世界即时看!视点|又见卖菜“小过重罚”11万,执法公平不能只靠法院兜底
- 麦博m111电路图(麦博m-111)_环球观点
- 中东土豪百亿补贴,高合汽车“续”上了?
- “第三支箭”落地 上市房企定增连续获批背后的市场脉搏 头条焦点
- 基督教歌曲耶稣爱你_天主教耶稣爱你网
- 儿童新冠二阳了怎么办 二阳会不会出现新冠后遗症 基本情况讲解
- 雅虎记者:阿努诺比希望在进攻端扮演更重要角色&想要多持球
- 高温催生避暑旅游热 :中信证券及外资扎堆买入加仓长白山,涨停还有几个
- 新资讯:在马赛遇袭中国游客已前往瑞士并提前回国
- 赵鹏获任中国人保党委副书记
- 惠来县发布暴雨橙色预警
- 《夏目友人帐》将制作第七季 ,15周年庆祝影片公开
- 当时明月在——怀念林文月教授丨人来人往
- 王源被人民文娱点评,言辞犀利,句句说到观众的心坎里 世界微头条
- 阿根廷首次使用人民币偿付到期外债 天天速递
- 2022~2023年内蒙古养老金调整新消息和养老金上调细则最新消息(全文)_天天快看点
- 甘肃省中级职称评审需要哪些资料_甘肃省中级职称评审
- 又一家科创型生物医药企业落地宝山!
- 台退役少将于北辰言论被台海军前舰长打脸:我同学真的不知道_全球快看
- 超长约!格兰特5年1.6亿回归开拓者 环球速讯
- 赛尔号格尔顿(查尔顿 赛尔号精灵) 全球聚看点
- 每日速递:党建引领“五共”善治 ——创新基层治理的“大冶样本”
- 焦点简讯:苹果成为首家收盘市值达到3万亿美元的公司 iPhone 15换机周期要来了
- 雄县属于哪个市哪个省(雄县属于哪个市)
- 曝汪姓男艺人性侵19岁女子 具体是什么情况? 当前观察
- 掘金夜经济
- 邢台巨鹿:“红色驿站”里学习忙 世界球精选
- 神十六航天员是哪三位简介(董志川讲天文科普:航天员拍到月亮羞答答溜走)
- 360的老板_360老板是谁
- 世界即时看!张韶涵买的小岛图片(张韶涵买下太平洋小岛)
- AMD R5 5600X3D 处理器海外上架:6 核 12 线程,96MB 三级缓存
- 高考放分了,这些防骗“判断题”要答好-今日精选
- 全球热头条丨金银河:子公司碳酸锂产品中试生产线已投入生产运行并已实现产品销售
- 世界微头条丨word转jpg格式图片怎么弄手机_word转jpg
- 歌尔股份:上半年净利润同比预减76%-84% 全球微速讯
- 台湾黑社会老大(关于台湾黑社会老大的基本详情介绍)
- 播报:集泰股份:与武汉大学共建先进材料研究中心
- 国家外汇管理局公布2023年5月我国国际收支货物和服务贸易数据
- 东风不与周郎便 铜雀春深锁二乔原文 赤壁原文及翻译 世界热资讯
- 每日播报!温暖2023 | 十大最具影响力短视频火热征集中
- 果然是油画大师,丹麦油画之父画的美女,色彩明艳!
- 来自虞美人之坡结局 来自虞美人之坡简介
- 世界微资讯!什么叫开脸观音_什么叫开脸
- 莱音珠宝黄金价格今天多少一克(2023年06月30日)
- 每日观点:演员这首歌的歌词(演员的歌词是什么)
- 曾红娟(关于曾红娟介绍)
- 一天拆除14座桥 湖北交投集团打造“映山红”改扩建特种兵
- you suck翻译(you suck)-全球速讯
- 中航电测6月30日快速上涨 环球精选
- 今日热门!宗地镇戈岜小学志愿服务队
- 全球快资讯丨醉酒后故意伤害怎么判
- 27.77万亿元!公募基金规模再创历史新高
- 【天天报资讯】6.30盘前策略 今天继续实盘实时分享抓涨停
- 雅戈尔(600177):6月29日北向资金减持61.27万股
- 全球微速讯:国乒女单2人出局,钱天一爆冷不敌日本小将,何卓佳完败于孙颖莎
- 贵州和广西,主打一个双向奔赴!
- 装修建材板块6月29日跌1.63%,坚朗五金领跌,主力资金净流出2138.97万元 天天快播
- 世界今热点:一周数读
广告
广告
- 如何验证翡翠的真假?只需要简单8步 天天短讯
- DJI RS 3 Mini发布:2千克负载仅795克,支持快速竖拍 天天新消息
- 形容法律威严的句子(精选187句)
- 《宝可梦》满血情况下受到的伤害减半,能带来多少对战机会?
- 世界热推荐:活力中国丨在忙碌的生产线感知中国经济活力
- 全球消息!海南航空回应男子在航班上喊飞机要出事:该名旅客已移交机场公安
- 陆金贷(小额应急)网贷逾期3年多久上征信|全球百事通
- 比亚迪继续减持比亚迪股份,半年已减持超30%
- 胎压监测板块1月9日涨0.91%,通达电气领涨,主力资金净流出2377.78万元_环球快消息
- 世界速看:陆金贷(小额应急)贷款逾期八天延迟还款会影响征信吗
- 記者觀察|封關壬寅末終落幕 港深雙城記開新篇 世界微动态
- 南开区16岁小孩抚养费一般多少钱
- 世界微头条丨十来万的车,我选卡罗拉
- 新华视点|商圈火、景区旺 各地消费市场显活力|聚焦
- 每日热门:光猫和路由器怎么连接 光猫和路由器的正确连接方法
- 蔬菜生吃还是熟吃?你是哪一派?|天天观点
- 天天消息!九典制药(300705.SZ):非洛地平片获批上市
- 热水泡脚脚痒是怎么回事?-环球时快讯
- 面试时,最可怕的就是背调?-世界视点
- 环球短讯![快讯]广联航空:关于特定股东减持数量过半的进展






