首页
搜索 搜索
当前位置:快讯 > 正文

ChatGPT真的“善解人意”吗?<br />访发展中世界工程技术科学院院士钟义信

2023-03-28 10:01:18 人民邮电报

简单易用的“聊天”式交互界面、更加贴近人类的“思维模式”、能写诗会编程的强大综合能力……让大规模预训练语言模型ChatGPT 一经发布便受到各行各业的关注。


(资料图)

ChatGPT的参数规模已达千亿级别,但模型越大就越能“理解”人类语义吗?AI大模型的本质是什么?针对以上问题,《人民邮电》报记者采访了发展中世界工程技术科学院院士钟义信。

GPT系列模型以统计认知为基础

ChatGPT是由美国OpenAI公司训练的对话式大规模语言模型,能够以对话方式与人交互。值得一提的是,ChatGPT不仅能在短时间内响应人们的提问,完成论文整理、小说创作、代码编写等任务,它还通过了美国部分高校的法律、医学考试,顺利通过了谷歌公司软件工程师岗位的入职测试。

可以看到,ChatGPT在众多行业领域有着广泛的应用潜力,但就此认为其具备理解能力、GPT类AI大模型就是通用人工智能未免太过草率。

ChatGPT 最大的问题是它的“理解能力”。钟义信指出,其所利用的信息都是只有形式因素而丢弃了价值因素和内容因素的信息,这是形式化的必然结果。按道理,这种纯粹形式化的信息是难以实现理解的,因为所谓理解某件事情,就是要知道这件事情的价值和内容,进而在理解的基础上做出正确的决策。

然而,ChatGPT的任务迫使它一定要对这些纯粹形式化的信息实现理解,否则便不可能完成对话的任务。钟义信表示,解决这个矛盾(即难以理解又要理解)的一种可行方法就是求助于“统计”,也就是说,在规模足够大、满足遍历性要求的此类任务案例中,应当存在与当前任务最为贴近或者说相关性最大的先验案例,进而选用这个最相关的先验案例作为当前任务的解答。

ChatGPT目前表现出来的“理解”实际上只是“统计相关性”。它能找到或提供与问题具有最大相关性的答复,但它并不理解自己所提供的答复是什么意思。

钟义信表示,人类大体存在三类认知方法:一是幼儿时期的“盲从认知”,也称“灌输式认知”,父母说什么就接受什么,但并不理解为什么。二是青少年时期的“从众认知”,多数人认可什么就认可什么。这是社会生活的“大数定律”现象,即“统计式认知”。这种认知方法的特点是“人云亦云”,未必理解。三是成人时期的“自主认知”,也称“理解式认知”,只有自己理解了的东西才会认可。人们的自主创新主要建立在理解的基础上。

统计认知必须以“大量样本”为前提,但这样的认知不一定是真正的理解。ChatGPT以“统计认知”为基础,这只是一种中等水平的认知,而真正高级的认知是在理解基础上的认知。

加强基础研究从源头促进AI高质量发展

近日,OpenAI发布了其大型语言模型的最新版本——GPT-4。GPT-4增加了多模态功能,支持图像和文本输入,再输出文本回复。但是,在AI模型的“理解能力”上并没有实质性突破,仍然建立在统计认知的基础上。

GPT-4的聊天表现确实让人吃惊,但问题是,它在同你聊天的时候并不知道它自己说的是什么,换句话说,它有说话的能力,却并没有理解能力。

GPT系列模型的背后是统计理论、大数据和大算力的支持。钟义信指出,模型背后有一个超大规模的预训练语料库,里面几乎什么样的话语都有,同时又有一个超高速的计算机,当人们向它问话的时候,它能够快速地在库里找到与“问话”之间“统计相关性”最大的“答案”,作为它的“回答”。

“惊人的统计相关性计算能力并不是真正的语义理解能力,也正因为这样,它也常常会严肃认真地胡说八道。”钟义信说,没有理解能力,就表示没有真正的智能,也就表示它和人类的能力差得很远。

大模型的根本是统计理论,而统计就要求样本遍历(最好是样本数量无穷大)。钟义信指出,这就导致物耗、能耗、成本、环境污染的急剧上升,违反“可持续发展”理念。这种“巨无霸”式的系统在技术上具有高度的垄断性,使竞争对手很难与它竞争。而且,发布API给大家用,实际上是要收集更多的训练样本,同时收集更多的隐私,成为隐私安全的陷阱。

钟义信强调,真正的通用人工智能绝不是这样的“巨无霸”,而是“以不变的通用智能生成机制”成功应对千变万化的应用场景。

“以不变应万变”或“万变不离其宗”,这正是通用人工智能研究领域的辩证法,也是机制主义通用人工智能理论的奥秘。钟义信说,为了实现这个奥秘,需要人工智能系统具备将输入信息转换为“语法、语义、语用三位一体(即全信息)”的能力,以此为基础从而实现理解。

钟义信表示,追求统计认知的“大样本大模型”和追求理解认知的“以不变应万变”,代表了人工智能研究领域的两种不同的范式(科学观和方法论)。我们常说要用理论指导实践,最重要的理论就是指导学科研究的最高力量——范式理论。对于AI高质量发展也是一样,我们需要用人工智能基础理论指导技术和应用发展。

* * *

看似“善解人意”的ChatGPT正在点燃全网的热情,但是业界更需要理性看待、冷静思考,更加注重基础理论研究,从源头促进人工智能高质量健康有序发展。

划重点!

人类认知方法

♦ 幼儿时期的“盲从认知”,也称“灌输式认知”,父母说什么就接受什么,但并不理解为什么。

♦ 青少年时期的“从众认知”,多数人认可什么就认可什么。这是社会生活的“大数定律”现象,即“统计式认知”。这种认知方法的特点是“人云亦云”,未必理解。

♦ 成人时期的“自主认知”,也称“理解式认知”,只有自己理解了的东西才会认可。人们的自主创新主要建立在理解的基础上。

GPT系列模型的本质

GPT系列模型的背后是统计理论、大数据和大算力的支持。

ChatGPT目前表现出来的“理解”实际上只是“统计相关性”。它能找到或提供与问题具有“最大相关性”的答复,但它并不理解自己所提供的答复是什么意思。

通用人工智能

要求人工智能系统具备将输入信息转换为“语法、语义、语用三位一体(即全信息)”的能力,以此为基础从而实现理解。“以不变应万变”或“万变不离其宗”,这正是通用人工智能研究领域的辩证法,也是机制主义通用人工智能理论的奥秘。

AI研究领域的两种不同范式

♦ 追求统计认知的“大样本大模型”。

♦ 追求理解认知的“以不变应万变”。