site logo: www.epochtimes.com

如何评估生成式人工智能提供的信息

随着生成式人工智能创作的内容越来越多,如何评估生成式人工智能提供的信息,是大家要面临的重要问题。(shutterstock)
人气: 146
【字号】    
   标签: tags: , ,

【大纪元2025年10月24日讯】随着生成式人工智能创作的内容越来越多,如何评估生成式人工智能提供的信息,就成为大家要面临的重要问题。

什么是生成式人工智能?

生成式人工智能是一种可以根据使用者的提示生成新文字、图像、音频和视频的人工智能。包括ChatGPT、谷歌(Google)的Bard和必应(Bing)的聊天机器人Chatbot等工具。

生成式人工智能可以创造模仿人类的写作。它是一种基于海量资料集的机器学习,其遵循的语言模式是通过预测可能一起出现的单字组合而来。虽然生成式人工智能具备遵循模式的能力,这并不等于它也具备辨别事实的能力。实际上,生成式人工智能并不能理解其所创建文本的上下文或含义。

评估生成式人工智能提供的信息

评估资讯来源的原则也适用于生成式人工智能。诸如SIFT和RADAR之类的检测步骤有助于评估资讯是否可靠。

然而,在咨询生成式人工智能时,我们通常会问自己的一些关于资讯来源可靠性的问题可能更难获得回答,因为生成式人工智能得出答案的过程并不是公开的。

那么,应该如何评估生成式人工智能提供的资讯呢?

1. 比较:

寻找其它可靠来源来验证人工智能的说法。试着找出涵盖同一主题的其它来源,甚至是该说法的原始出处。

2. 检查引用的文献是否是虚构的:

我们可以要求生成式人工智能工具提供信息来源,但众所周知,生成式人工智能会提供非常令人信服的虚假来源。

它甚至可以创建包含研究所询问主题的真实研究人员姓名的引文。然而,引用的文章可能并不存在,或并非来自其引用的期刊。这些虚构的引文被称为“幻觉”。

你需要搜索这些引文,确认这些文章确实存在,并且引述的内容是正确的。

3. 确认:

查证原始文章来源,并核实生成式人工智能工具所声称的在该文章中找到的资讯。人工智能并非专门为真实准确地引用而设计,因此它可能会引用一篇实际上并不包含该资讯的文章。

4. 检查时效性:

时效性——文件的建立、编辑、更新或修订时间——是评估任何资讯来源的重要因素。如果您需要有关世界事件或新研究进展的最新信息,生成式人工智能的资料集中可能不包含这些资讯。截至 2023年10月,如果你问ChatGPT(GPT-3.5)它所训练的资料有多新,它会告诉你它的资讯来自2021年,而且它无法从网路上取得最新资讯。

巡回的诅咒

随着生成式人工智能创作的内容越来越多,最终这些内容将进入下一代人工智能的训练资料集。这可能会导致数据品质下降,因为人工智能产生的错误信息可能会随着时间的推移而不断累积。

Shumailov 等人在其2023年发表的论文《巡回的诅咒:基于生成资料的训练使模型遗忘》(The Curse of Recursion: Training on Generated Data Makes Models Forget)中提出并测试了这个想法。他们发现,在训练资料集中加入人工智能生成的内容会导致模型崩溃——“这是一种退化过程,随着时间的推移,模型会忘记真正的底层资料分布,即使分布没有随时间变化”。

责任编辑:瑞木悦

 

 

评论