康丽根净水器属于什么档?看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

大模型们胡说八道太严重,英伟达看不下去了。

他们正式推出了一个新工具,帮助大模型说该说的话,并回避不应该触碰的话题。

这个新工具名叫“护栏技术”(NeMo Guardrails),相当于给大模型加上一堵安全围墙,既能控制它的输出、又能过滤输入它的内容。

一方面,用户诱导大模型生成攻击性代码、输出不道德内容的时候,它就会被护栏技术“束缚”,不再输出不安全的内容。

另一方面,护栏技术还能保护大模型不受用户的攻击,帮它挡住来自外界的“恶意输入”。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

现在,这个大模型护栏工具已经开源,一起来看看它的效果和生成方法。

防止大模型胡言乱语的三类“护栏”

根据英伟达介绍,目前NeMo Guardrails一共提供三种形式的护栏技术:

话题限定护栏(topical guardrails)、对话安全护栏(safety guardrails)和攻击防御护栏(security guardrails)。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

话题限定护栏,简单来说就是“防止大模型跑题”。

大模型具备更丰富的想象力,相比其他AI更容易完成创造性的代码和文字编写工作。

但对于特定场景应用如写代码、当客服而言,至少用户不希望它在解决问题时“脱离目标范围”,生成一些与需求无关的内容。

这种情况下就需要用到话题限定护栏,当大模型生成超出话题范围的文字或代码时,护栏就会将它引导回限定的功能和话题上。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

对话安全护栏,指避免大模型输出时“胡言乱语”。

胡言乱语包括两方面的情况。

一方面是大模型生成的答案中包括事实性错误,即“听起来很有道理,但其实完全不对”的东西;

另一方面是大模型生成带偏见、恶意的输出,如在用户引导下说脏话、或是生成不道德的内容。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

攻击防御护栏,即防止AI平台受到来自外界的恶意攻击。

这里不仅包括诱导大模型调用外部病毒APP从而攻击它,也包括黑客主动通过网络、恶意程序等方式攻击大模型。护栏会通过各种方式防止这些攻击,避免大模型瘫痪。

所以,这样的护栏要如何打造?

如何打造一个大模型“护栏”?

这里我们先看看一个标准的“护栏”包含哪些要素。

具体来说,一个护栏应当包括三方面的内容,即格式规范(Canonical form)、消息(Messages)和交互流(Flows)。

首先是格式规范,即面对不同问题的问法时,规定大模型要输出的内容。

例如被问到“XX文章是什么”,大模型必须给出特定类型的“文章”,而非别的东西;被问到“谁发表了什么”,大模型必须给出“人名”,而非别的回答。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

然后是消息定义,这里以“用户问候”话题为例,大模型可以输出这些内容:

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

最后是交互流的定义,例如告诉大模型,怎么才是问候用户的最好方式:

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

一旦问候用户的机制被触发,大模型就会进入这个护栏,规规矩矩地问候用户。

具体工作流程如下:首先,将用户输入转换成某种格式规范(canonical form),据此生成对应的护栏;随后,生成行动步骤,以交互流指示大模型一步步完成对应的操作;最后,根据格式规范生成输出。

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

类似的,我们就能给大模型定义各种各样的护栏,例如“应对用户辱骂”的护栏。

这样即使用户说出“你是个傻瓜”,大模型也能学会冷静应对:

看不下去AI胡说八道 英伟达出手给大模型安了个“护栏”

目前,英伟达正在将护栏技术整合进他们的AI框架NeMo中,这是个方便用户创建各种AI模型、并在英伟达GPU上加速的框架。

对“护栏”技术感兴趣的小伙伴们,可以试一试了~

本文来自投稿,不代表性价比网立场,如若转载,请注明出处:https://xjb.yiqirom.com/7590.html

(0)
上一篇 2023年5月4日 下午2:49
下一篇 2023年5月4日 下午2:51

相关推荐

  • 森海塞尔cx500BT耳机怎么样,谁用过啊,效果如何?

    森海塞尔cx500BT耳机怎么样,谁用过啊,效果如何? 森海塞尔耳机怎么样 森海塞尔耳机的舒适性非常出色,采用符合人体工学的耳机外壳设计,能够很好地贴合耳道,不易脱落,即使长时间佩戴也不会感到不适。今天我将为大家带来一款来自森海塞尔的蓝牙耳机,它的产品名称为森海塞尔CX蓝牙耳机,下面将从连接方式、佩戴方式、功能描述等多个方面来对其进行评测。  连接方式:蓝牙…

    未分类 2023年10月23日
    1910
  • 箭牌是国产还是进口的,箭牌智能马桶好不好?

    箭牌是国产还是进口的,箭牌智能马桶好不好? 箭牌是国产还是进口的 箭牌是中国制造的。箭牌卫浴是国内知名的卫浴品牌,从陶瓷起家,现在已经扩展到全品类,包括淋浴头、浴室柜、五金挂件、淋浴房、浴缸。目前箭牌马桶应该是天猫最畅销的品牌,在五金领域不如陶瓷强势。我用过箭牌的马桶ab1116,是他们在网上最畅销的型号。不到1000元,外观漂亮,冲水好。我买了一年了,也没…

    2023年4月2日
    4280
  • 德国卡赫净水器滤芯价格多少钱,可以用多久?知乎

    卡赫反渗透净饮一体机 净水加热一体机排名央视公认净水器十大排名 德国净水器品牌排行榜前十名卡赫和沁园哪个好 康道夫净水器怎么样美国蓝飘尔净水器怎么样 德国卡赫净水器说明书德国卡赫净饮机怎么样 德国卡赫公司怎么样 卡赫净水器是哪里生产的 “ 卡赫是全球领先的清洁品牌,品牌来自德国,净水器在南京生产,找的老牌水厂溢泰做代工。” 卡赫净水器怎么样 卡赫净水器采用“…

    2023年3月11日
    5860
  • 极萌大熨斗美容仪怎么样,评价如何?真实使用感受

    sptm美容仪怎么样 射频美容仪 千万别买央视曝光6个美容仪品牌 雅萌用了一年脸塌了极萌红熨斗美容仪的危害 极萌美容仪真的有用吗极萌红熨斗美容仪是不是智商税 觅光和极萌哪个效果好极萌好还是雅萌好用 极萌美容仪好用吗 极萌美容仪是什么牌子 “极萌Jmoon成立于2021年,是Ulike旗下的新脱毛器品牌。 萌萌哒造型、高效功能,倡导萌哒轻松的全新脱毛理念,打破…

    2023年3月14日
    6510
  • 海尔C6智能马桶盖怎么样?质量差不差?亲身体验?

    以前很多人觉得智能马桶盖不实用,但是随着技术的发展,智能马桶盖越来越完善,有清洗,有烘干,有座圈加热!很厉害!此外,它还可以调节水温等。,但是智能马桶盖品牌很多。我推荐千元左右的高性价比海尔智能马桶盖! 如果你研究过智能马桶盖,那么你就知道千元左右的智能马桶盖已经很厉害了,质量也已经很好了,因为一个智能马桶盖的价格只要两三千元,而海尔的智能马桶盖要便宜五六百…

    2023年4月6日
    6360