新研究:新技术助力人工智能减少“胡诌”

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。(辛华)

来源: 新华网

【来源:经济界】凡本网注明“来源:经济界” 的所有作品,版权均属于经济界。如转载,须注明“来源:经济界”。违反上述声明者,本网将追究其相关法律责任。
上一篇 2024-06-26
下一篇 2024-06-26

相关推荐

  • 国际城市设计产业中心1周年庆启幕仪式暨“1路相伴 1月同辉”游园会圆满举行

    国际城市设计产业中心1周年庆启幕仪式暨 “1路相伴 1月同辉”游园会圆满举行 在这金风送爽、丹桂飘香的九月,国际城市设计产业中心迎来了它的一周年庆典。值此特殊时刻,园区特别策划了以“1路相伴 1起向未来”为主题的系列活动,旨在增进人才、企业、机构之间的沟通交流,共同展望美好的未来。 近日,国际城市设计产业中心1周年庆启幕仪式暨“1路相伴 1月同辉”游园会在园…

    1天前
    0
  • 油茶产业弄潮儿,记湖南省十佳农民刘武斌

    习近平总书记在2019年3月11日参加全国人大十三届二次全会河南代表团审议结束时,亲切会见熊维政代表时指示:“茶油是个好东西,我在福建时就推广过,要大力发展好油茶产业”。——作者题记 初冬十月。幕阜山下,汨水之畔。百万亩油茶林散发着醉人的幽香。微白透红的山茶花与金色晶莹的油茶果,同枝共茂,交相辉映。暖暖的阳光下,一群群蜜蜂从四面八方扑翅飞来,在这无垠的花海里…

    1天前
    0
  • 厨电行业的“新商业理念”火种,正在被万和电气点燃

    在过去,传统商业时代以企业自身为中心,其核心宗旨在于追求长期利润的最大化以及确保股东利益优先。而今,在科技推动下,我们迎来了一个全新的商业纪元——这个时代的核心是以用户为中心,企业的发展逻辑转变为创造用户的终身价值。如果将传统商业模式比作在跑步机上盲目奔跑,只关注产品品质和利润增长,对用户需求则视而不见;那么,在新的商业理念指导下,企业不仅需要识别每一位用户…

    3天前
    0
  • 容声品质盛宴来袭,补贴上不封顶,这波福利,你抓住了吗?

    9月23日,在容声冰箱与新华每日电讯联合举办的探厂直播活动中,容声国内营销总经理韩栋针对新一轮以旧换新政策表示,当消费者购买容声冰箱并可享受最高20%补贴时,若补贴金额超出2000元上限标准,超出部分将由容声冰箱承担。此外,容声还推出了品质极速服务等专属优惠,旨在为消费者带来前所未有的购物优惠与高品质生活享受。 韩栋称,以售价为14000元的容声冰箱为例,根…

    4天前
    0
  • 走进工厂,零距离探访容声冰箱品质之谜

    9月23日,容声冰箱联合新华每日电讯举办了一场以“冰箱换新,‘值’选容声”为主题的直播活动,走进车间近距离了解一台品质冰箱的制造过程。此次活动,结合当前国家“以旧换新”政策,聚焦消费者冰箱换新所关心的具体话题,开启一场“养鲜”体验之旅,揭秘容声冰箱的品质之谜。 “大变活鱼”展现创新实力 一条被冻得硬邦邦的鱼,在经历几分钟的极速解冻后,竟然奇迹般地“复活”了。…

    4天前
    0