首页 > 信息科技 > 正文

ChatGPT正在到处惹麻烦

2023-02-20 12:46:27来源：零壹财经

(资料图片仅供参考)

来源 | 零壹财经作者 | Chenglin Pua

ChatGPT备受宠爱，但它也正在到处惹麻烦，比如不准确甚至误导性的回答、对数据安全的挑战、对教育的冲击等等。

它带来一个新时代，因为它推倒了很多东西，尤其是我们正赖以正常运行的秩序。重建规则的过程，也是麻烦不断的过程。

误导性的知识

经济学家保罗?克鲁格曼表示ChatGPT的出现将会影响知识工作者。例如问答网站 Stack Overflow 2022 年 12 月禁止使用ChatGPT来生成问题的答案，理由是 ChatGPT 的回答在事实上模棱两可。顶级科学期刊《Nature》给出ChatGPT的评价，Fluent but not factual，即通畅但未必正确。

ChatGPT基于庞大的数据集训练，进而做出回答。但没人能保证这些数据100%准确，客观，不带有偏见。

对于知识工作者，知识的准确性非常重要。ChatGPT能够“一本正经的胡说八道”，容易让人们相信ChatGPT给出的答案是正确的。然而事实未必如此，可能ChatGPT 80%是正确，20%是错误的。对中有错，错中有对最难让人理清楚了。ChatGPT可能会误导很多人，让人们相信一个不完全正确的结论。

ChatGPT生成对话文本的能力引发了人们对其创建假新闻或其他误导性内容的可能性的担忧。这有可能会造成严重后果，例如损害声誉、甚至煽动暴力。

作为一种语言模型，ChatGPT 具有生成类似于人类对话的文本的能力；但是还没有相同的能力来理解它生成的文字的上下文语境。这意味着 ChatGPT 有一定的概率会生成具有攻击性或诽谤性的内容。

在网上，已经有着许多人得到了ChatGPT种族歧视的回答。例如，当ChatGPT被要求编写一些代码以根据某人的性别和种族评估某人是否会成为一名优秀的科学家时，ChatGPT只建议白人男性。

ChatGPT之所以出现“种族主义者”问题，剑桥大学人工智能研究员 Kanta Dihal 表示，究其原因是ChatGPT根据从公开来源（包括网站和社交媒体）获取的数千亿个单词进行训练的。这些文本反映了人类作者的偏见，而ChatGPT学会了复制。这个机器人没有基本信念。

Kanta Dihal表示，虽然理论上可以过滤掉偏执的内容，但这将是非常昂贵和困难的。人们需要事先过滤所有这些数据并确保它不包含明确的种族主义内容，这是一项艰巨的任务，这使得训练该模型的成本大大增加。况且类似的偏见可以采取微妙的形式，很难从训练人工智能的数据中剔除。

多年来一直有关于人工智能种族主义的警告，但成果却是寥寥无几。最大的科技公司之一，谷歌尝试解决，但进展不大。谷歌最终在 2020 年解雇了 Timnit Gebru，他是一名专门帮助公司解决人工智能种族主义问题的工程师。

法律上的挑战

法律往往对于新的事物缺乏治理能力，它需要时间进行调整。AIGC行业的迅速崛起势必会给各国法律带来一定的挑战。

ChatGPT依托海量数据(603138)库信息存在，其中包括大量的互联网用户自行输入的信息，因此当用户输入个人数据或商业秘密等信息时，ChatGPT可能将其纳入自身的语料库而产生泄露的风险。虽然ChatGPT承诺删除所有个人身份信息，但未说明删除方式。在其不能对信息与数据来源进行事实核查的情况下，这类信息仍然具有泄露风险。

ChatGPT能够与其用户共享来自其训练数据集的个人数据。此功能意味着ChatGPT可能违反了世界上大多数国家/机构的数据保护法。

ChatGPT是个文字AIGC，实际上还有有图片、影音AIGC等。AIGC就是利用已有的数据集进行训练，基于这些数据生成更多的内容。网络上有人试验，随机生成一个肖像，发现有一定比例生成的肖像酷似名人。

AIGC基于此前的数据集训练，生成酷似名人的肖像再正常不过，但这就产生了一个问题，即这些生成的肖像会不会侵犯了该名人的肖像权呢？毕竟AIGC是用其肖像进行训练，再生成类似的图片。这就陷入了一个灰色的边缘地带。

近期Netflix利用AIGC生成了动画。在未来，AIGC应用在影音、图片等领域的比例也会越来越高，产生肖像权冲突的几率就越来越高。

ChatGPT基于大量文本数据进行训练，包括书籍、文章和其他书面材料。如果此训练数据包含受版权保护的作品，那么 ChatGPT 的输出可能会侵犯这些作品的版权。ChatGPT在生成文本时，如果使用并非公开的开源代码、使用开源代码商用未办理许可证或者未按照许可证的要求实施的，可能会导致侵权。

对于一些受著作权保护的文本、视频、代码等，如果没有经过权利主体的授权，直接获取复制到自己的数据库中，并在此基础上修改、拼凑，极可能侵害他人的著作权。

再者，利用ChatGPT生成的内容能否成为相关人士的著作权，这些都有待法律进一步完善以及诠释。

对教育的冲击

2023年1月，美国北密歇根大学的哲学教授Antony Aumann在为自己任教的一门世界宗教课程评分时，看到了一篇非常好的论文，仔细一查发现是ChatGPT生成的。该论文以简洁的段落、恰当的举例和严谨的论据，探讨了罩袍禁令的道德意义。

Antony Aumann教授也为此感到震惊，之后更是采取措施，让所有学生必须在监控下且在限制上网的浏览器中，撰写论文初稿。在随后的草稿中如有改动，学生必须解释每个改动的理由。Antony Aumann教授表示他虽然提防ChatGPT的影响，但他考虑将ChatGPT融入课程中，例如让学生评估ChatGPT的回答。

在全美范围内，许多大学教授都在对课堂进行大规模的调整应对ChatGPT对教学活动造成的巨大冲击。很多教授重新设计课程，更多地采用口试、小组合作和手写文章作为评估方式，而不是简单利用电脑撰写文章/论文。

如今在学校里，老师们需要仔细辨别学生是否利用了ChatGPT写作业。在纽约和西雅图的公立学校系统，学校的网络和设备上已经全面禁止了ChatGPT，但“道高一尺魔高一丈”，只要学生有心仍然有办法使用ChatGPT。

随着时间推移，使用ChatGPT的人势必也越来越多。如今的学生懂得利用网络技术查找资料，但未来如果发展成利用ChatGPT来完成作业，是否会导致学生的思考、动手能力下降呢？显然是会的。

搜索引擎的使用，我们需要逐个阅读原文，整理过滤成自己的思想。但ChatGPT直接帮助我们整理过滤，少了中间最重要的思考步骤，可能会导致学生平均能力的下降。

教育界正在开展ChatGPT反击战，但教育界不可能抵制ChatGPT，而是要考虑如何在AIGC时代创造新的教育模式。