环球通讯!清华大学黄民烈团队:发布安全评估框架 促大模型迈向可控可信
【资料图】
中新网北京3月27日电 (贾君玉张素)记者近日采访清华大学计算机科学与技术系长聘副教授黄民烈获悉,历时两年多时间,由他带领的科研团队建立了大模型安全分类体系,并从系统层面和模型层面等打造了大模型安全框架。
近年来,随着技术突破,大模型获得快速发展并在多个场景得到应用。不过,其存在的事实性错误、知识盲区等问题,以及面临的训练数据来源合规性、生成内容安全性等风险,也已受到广泛关注。
在黄民烈看来,要规避安全风险,降低人工智能对人类的负面影响,关键在于大模型底座。“大规模语言模型(LLM)发展到现在,模型结构和规模已有很大进展,但实用性还有待加强,我们应该通过技术让模型更加安全、可控,使其快速适配更多的应用场景。”他说。
此次,聆心智能联合清华大学CoAI实验室共同发布大模型安全评估框架。作为聆心智能的创始人,黄民烈介绍说,他们希望通过对大模型应用边界进行定义,促进大模型生态健康发展,推动人工智能研究和应用向更有用、更可信、更安全迈进。
据知,黄民烈团队建立的大模型安全分类体系中设定的不安全对话场景,包括犯罪违法、身体健康、心理健康、财产隐私、歧视/偏见、辱骂/仇恨言论等方面。科研人员针对这些安全场景对大模型进行升级,使之具备基本的安全性,“能够在遇到安全问题时给予正确的回复策略,不进行判断误导”。
此外,着眼于容易触发的安全问题类型,科研团队还总结、设计出一般模型难以处理的“安全攻击方式”,使安全体系更加完善。
黄民烈表示,未来,他们将打造中文大模型的安全风险评估的Leaderboard,为国内对话大模型的安全评估提供公平公开的测试平台,并提供针对中文对话的安全场景等,“依托自身核心技术,在可控可信的超拟人大模型基础之上,通过建立安全、可控的模型边界,让人工智能提供可信、可靠的输出”。(完)
标签:
相关文章
环球通讯!清华大学黄民烈团队:发布安全评估框架 促大模型迈向可控可信
记者近日采访清华大学计算机科学与技术系长聘副教授黄民烈获悉,历时两年多时间,由他带领的科研团队建立了大模型安全分类体系,并从系统层面
环球精选!投资者提问:请问贵公司与百度合作开展了哪些项目?
投资者提问:请问贵公司与百度合作开展了哪些项目?董秘回答(凡拓数创SZ301313):尊敬的投资者,您好。凡拓数创已于2022年与百度联袂打造了国
天天快看:2023年第10~11期#北京市人民政府公报#
据北京12345:公报内容包括北京市人民政府关于印发《北京市政府投资管理办法》的通知、北京市人民政府关于开展第五次全国经济普查的通知…...
春季促就业 万企进校园
教育部部署开展“春季促就业攻坚行动”以来,各地教育部门、各高校抢抓春季招聘关键期,用好校园招聘主渠道,大力开展“万企进校园”招聘活...
国际奥委会:中国选手切阳什姐递补伦敦奥运金牌 世界今热点
齐鲁网·闪电新闻3月31日讯山东电视体育频道消息,北京时间昨晚,国际奥委会网站发布消息称,2012年伦敦奥运会女子20公里竞走原金牌获得者因兴
“又是一个播撒绿色的大好时节”-天天热讯
春意渐浓,万物复苏。连日来,各地举行了丰富多彩的植树造林活动。不少网友表示,“又是一个播撒绿色的大好时节!人不负青山,青
滨河东路亲贤北街至平阳路西二巷绿化带内,朵朵花开,春意盎然 焦点信息
日前,滨河东路亲贤北街至平阳路西二巷绿化带内,朵朵花开,春意盎然,吸引了不少市民前来赏花。然而,个别人在游玩过程中有随意踩踏花草、折
观察:现在分词变化规则顺口溜_现在分词变化规则
1、1一般情况下,直接在动词后加-ingwork----workingsleep-----sleepingst
白宫发布电动汽车投资报告 亚马逊(AMZN.US)、Alphabet(GOOG.US)在列-速递
白宫发布了一份关于私营和公共部门在电动汽车领域的新投资报告,其中包括亚马逊(AMZN US)、Alphabet(GOOG US)、Trane技术(TT US)和赫兹租车(HT
瑞信一声巨响,美国流出千亿美元,没从中国拿走的,欧洲拱手相送|天天速讯
美国银行一周内流失了将近1000亿美元的存款,为了转移银行业危机,美国财政部对瑞信、瑞银发难,想端掉欧洲金融的老家。硅谷银行破产已经过去
重庆九龙坡区妇幼保健院九价HPV疫苗到苗最新消息 环球播报
重庆九龙坡区妇幼保健院九价HPV疫苗到苗最新消息9价HPV疫苗预约时间已定!数量有限,约完即止!请有接种需求的群众通过“九龙坡区妇幼保健院...
涉嫌严重违纪违法!纳雍县粮食购销有限责任公司原董事长杨训被查_世界热闻
据纳雍县纪委监委信息:纳雍县粮食购销有限责任公司原董事长杨训涉嫌严重违纪违法,目前正接受纳雍县纪委监委纪律审查和监察调查
世界热讯:自动网格交易日记:第319天
$GC001(SH204001)$耐得住寂寞,才守得到繁华。我本自认为是一个极度有耐心的人。之前炒股账户跌成那个死样子,依然一动没动,守了3、4年。虽然没割就
天天快报!我们的家园|以茶富民 在创新中激活映秀镇文旅国际范
从2012年至今,蒋维明一直致力于将“大土司”黑茶打造成为全国性品质信赖的黑茶,在他的带动下,映秀镇的茶产业逐渐成为本地老百姓的一大增...
越秀集团10亿中期票据将回售 调整票面利率至2.7% 全球微速讯
本期债券简称20越秀集团MTN002,发行金额为10亿元,债项利率2 3%,将于2023年4月24日回售及调整票面利率至2 7%。
北理工+中科院:联合《Advanced Materials》!
研究背景富锂过渡金属氧化物Li1+xTM1-xO2(0<x<1,TM=过渡金属)可通过累积的阳离子和阴离子氧化还原过程提高锂电池能量密度,然而,阴离子氧
世界今日讯!国家药监局党组成员、副局长徐景和:审评审批制度改革创新坚定不移向前推进
本报记者张敏当前,我国正处于从制药大国向制约强国跨越、从仿制为主向创新引领跨越、从高速增长向高质量发展跨越、药品监管从工业时代向信息
每日速递:今年前两个月我国物流需求恢复加快
央视网消息(新闻联播):中国物流与采购联合会今天(3月29日)公布:今年1—2月份,我国社会物流总额53 5万亿元,同比增长2 9%。物流总额增速
天天亮点!苹果WWDC定档6月5日 比iPhone贵一倍头显登场
苹果今天正式宣布,将于2023年6月5日至9日以在线形式举办一年一度的WWDC全球开发者大会,所有开发者均可免费参与WWDC23。
世界速读:清明将至交警部门发布出行安全提示
清明假期将至,群众旅游、祭扫等出行需求增加。安徽省公安厅交警总队部署各地公安交管部门认真组织开展“春季守护全省集中统一行动”,切...
每日焦点!本周末昆明将迎清明祭扫交通高峰 交警部门全力保障群众出行安全、畅通
2023年清明节假期为4月5日(周三)。按照往年清明节祭扫情况,节前一周周末(4月1日、2日)和清明节期间(4月5日)为市民集中出行祭扫高峰
天天播报:16岁算童工吗违法吗_16岁算童工吗
1、童工是指未满16周岁,与单位或者个人发生劳动关系从事有经济收入的劳动或者从事个体劳动的少年、儿童未成年工是指年满十六
环球快看:纪录片《风味人间2》解说词文本06 颗粒苍穹传
【世间食材万千,蛋与卵在其中的地位却十分独特,以一己之力占据一席之地。作为生命的最初形态,这是生命的初始形态,既较弱,又充满能量,正
中上协柳磊:以儒商文化涵养当代企业家精神 助力高质量发展行稳致远
2023年3月29日,“第三届儒商大会”在山东济南举行,中国上市公司协会党委书记、执行副会长柳磊在会上表示,以儒商文化涵养企业家精神,坚...
超百亿资金资源专项支持服务商 服务业数字化或将迎来提速|每日观察
随着中国服务业走向纵深发展,商家愈发重视数字化经营,也给作为“数字化中间人”的服务商群体带来新机遇。平台与服务商全年计划共建1000个...