【资料图】
AI 制 AI
现在不咋行
在「犯罪」的道路上,人类可能是无师自通的。
ChatGPT 火了,下一秒就有学生拿它来做作业、写论文,你很难说这到底是作弊还是剽窃。
老师很难确定学生的作业都出自自己之手,而人类也无法确定工具的最终形态到底是什么。
面对成本低、效率高的 AI 文字生成工具,仅靠人类的智慧已经很难进行分辨。最顶尖的人工智能公司从「师夷长技以制夷」中学到的经验也用在了这里——它们要用 AI 识别 AI。
以 AI 治 AI,它们出手了
OpenAI 是近年风头最劲的人工智能研究室。过去一年你看到的文字生成视频、文字生成图像都有它的身影,ChatGPT 也是它的得意之作。
基本每个月都会发布震惊业界成果的 OpenAI,刚发布的新产品却是一个 AI 内容检测器。
这个检测器目前只能应用于文字内容,争议和批评更多的图像则不在此列。检测器唯一的功能就是从人工智能的角度替你进行判断,看看这段文字是不是人工智能生成的。
目前,只有美国地区的用户可以体验这个检测器的功能,检测器本身也对检测文本进行了一定的限制:
英文文本,检测器和 ChatGPT 在英文外其他语言表现不佳。
需要 1000 个字符,大约 150-250 个左右的单词才能生成更可信的结果。
检测器在儿童撰写的文本内容上同样表现不佳,检测器主要针对成人英文文本进行训练。
最终检测器会在完成判断后给出「很可能、可能、不清楚、不可能、非常不可能」5 种答案。
这个检测器从目前来看也不太聪明。在测试中,有文章末尾显示「本文全文由 ChatGPT 撰写」的内容,检测器仍表示「不清楚」这篇文章是否由人工智能撰写。
这也是检测器目前尚无法从理解文本上进行判别的「证据」之一。
检测器的出现象征意义比实际意义更大,这说明知名的人工智能实验室们依旧在乎内容的真实。
毕竟从 ChatGPT 诞生开始,学校的老师就开始担心学生的作业不再被认真对待,世界上最大的学术出版商声明 ChatGPT 不能被记为作者,还有人担心新技术变为欺诈的工具。
而现在,人工智能实验室想努力辨别内容的创作来源,这本身就是好事。
即便你是创造者,安能辨我是 AI
好事之外,多的是坏消息。
因为这个检测器的成功率有点惨不忍睹——26% 的准确率放在医学领域属于谋财害命一般的存在,就算放在运动领域预估运动员下一个动作能否得分的成功率都没这么低。
OpenAI 在发布这个工具时也承认了这一点。
它有时会「错误但自信地」将人类书写的文本标记为人工智能创造的文本,尤其是当文本与训练数据中的内容有较大差别时。
目前这个检测器还很初级,甚至可以说这是一个「半成品」。
除了 OpenAI 自己提到的儿童内容和非英文内容,有点年头的英文内容也很容易被误判。
已经逝世的知名作家们的作品几乎无一幸免,带有时代特色的表达方式很容易被判定为 AI 作品。莎士比亚就惨遭毒手,他最短的悲剧《麦克白》就被判定为「该文本很可能是人工智能生成的。」
莎士比亚的作品很可能是 AI 生成的
连创造者 OpenAI 都有点束手无策,辨别 AI 生成内容的道路依旧任重道远。
当然这也很好理解,画作相对文字还要更高门槛一些,通过笔触、风格、水印,大家还能看出 AI 模仿学习的痕迹。
但文字没有「水印」,大家用创作出的文字也非常多样,因为创作者受教育的高低程度和表达风格,在最终文本上有较大差别也是可以理解的。
AI 创造的内容越来越接近人 图片来源:Midjourney
甚至可以这么说,等 ChatGPT 再进一步,可能人类都无法判定这是否是人工智能生成的文本了。因为它就像身边你我会写出来的内容——没有陌生的自创词汇,不会前言不搭后语,内容言之有物。
如果人已经分辨不出内容的源头了,那 AI 就成了未来的希望了。不管是用 AI 生成的内容自动加「水印」,还是检测器经过多次迭代后正确率无限提高,AI 都是更好完成辨别的特殊角色。
除了创造者 OpenAI 在行动,还有不少学者、实验室、大公司都在努力辨别 AI 内容。
一个叫做 Edward Tian 的学生创建了一个网站,想要「检测 AI 剽窃」;Google 为了不在人工智能发展中掉队,据称将上架 6 个 AI 相关应用,其中就有检测应用;抄袭检测器Turnitin正在开发自己的 AI 生成文本检测器。
当然,这都属于未来,我们面临的现状是 AI 可以轻松制造大量内容,最终模糊信息源,而身为普通消费者的我们将很难辨别它的生产源头。
AI 文本生成,轻易污染信息的模糊未来
还记得我们曾在《她在中文维基百科上胡编了上百万字的古罗斯历史,把俄罗斯人都骗了》写的故事吗?
一个高中毕业生靠着「一腔热情」在维基百科上写了几百万字的历史内容,这些内容甚至流传到了外网,被很多外网内容引用为来源。
如果将这个高中毕业生看作 AI,你就能懂 ChatGPT 的存在对信息可能造成怎样的污染了。
这位高中生 3 年编了百万字历史,AI 的效率只会比他更高。
他用三年生成的内容,随着 AI 的进步可能三天甚至三小时不到即可生成。更低的内容制作成本,AI 只会做得更好,毕竟它本身就是在模仿学习,继续模仿真实的历史生成一段「历史」并不难。
当然,AI 还没有进化到《流浪地球 2》Moss 那样的地步。它还没有意识要去做这件事,有意识也不一定有意愿去做这件事。但 AI 本身就是一种工具,就像用人用刀切菜做佳肴一样,也可能有人持刀伤人。
千万别说没人这么无聊,既然有人一字字都能编出百万历史,那门槛更低的 AI 内容会生成什么故事、用于哪里都是正常的。人类的多样性总是超乎想象,当这种多样碰上了 AI 的高效,信息被污染的情况只会越来越多。
这还只是 ChatGPT 刚出现几个月后人们的想象。
在 ChatGPT 爆火的两个月内,学生就已经自发用这种工具做作业、写论文偷懒,编剧会用它编故事试试出乎人意料的故事走向;文案编辑用它来给自己打工。
在用工具给自己省事这件事上,人连教都不用教。
工具一旦离开工坊,被如何使用就不能由造工匠控制了。
要想影响工具的使用,要么修改工具,要么制造新的工具。
AI制AI现在不咋行在「犯罪」的道路上,人类可能是无师自通的。ChatGPT火了,下一秒就有学生拿它来做作业、写论2023-02-04
学生及家长做好自我健康监测迎接健康新学期2023-02-04
1、中山市青年国际旅行社有限公司(简称中山青旅)是一家以旅游业为龙头,集旅游观光、旅游运输、会议接待、广告策划、置业2023-02-04
1、《中西医结合痴呆诊疗备要》是2013年天津科技翻译出版社出版的图书。2、作者是韩景献。文章到此就分享结束,希望对2023-02-04
1、李银河,女,1952年2月4日出生于北京,中国社会科学院社会学所研究员、教授、博士生导师。2、中国第一位研究性的女社2023-02-04
春节过后,广东宏远的集训已经到了第4天,球队训练在有条不紊的进行着,积极备战常规赛第三阶段,特别是季后赛。昨天,据媒体报道,杜锋把全队2023-02-04
记者1月30日从兰州铁路局获悉,自2022年12月29日开通运营以来,银兰高铁一个月累计安全运送旅客30万人次。“过去从白银平川到兰州,开车走高速2023-02-03
1、五峰铺镇位于邵阳、衡阳、永州三市经济走廊交汇处。2、镇区面积5平方公里,全镇常住人口107040人,镇区常住人口52023-02-03
刘晓庆是我们妈妈辈,甚至奶奶辈有名的女明星,她是内地家喻户晓的演员,她饰演的电视剧很多都走进了千家万户,比如刘晓庆饰演的武则天,真的2023-02-03
2月4日和2月5日将分别迎来立春节气和正月十五元宵节,这两个节令紧相连,可谓喜上加喜。据了解,这种有趣的巧合,在21世纪这100年中仅有6次。22023-02-03
河北省食品检验研究院:全力保障双节期间“舌尖上的安全”2023-02-03
重庆丰都县委书记张国忠:答好“乡村两问”激发乡村振兴新动能2023-02-03
162亿元,中交、中建、中铁、中国化学等中标安徽公路项目2023-02-03
点击蓝字·关注我们传统固态白酒酿造体系是天然的微生物育种平台,其独特的多压力胁迫(高酸、高渗、高乙醇、高温等)微环境为菌株自然定性进2023-02-03
一、声的笔顺笔画顺序的近义词1、韵[yùn]二、声的笔顺笔画顺序的反义词2、暂无本文关于声的笔顺笔画顺序的近义词,2023-02-03
全面注册制改革是落实我国创新驱动发展战略、实现经济高质量发展的必然选择。完善以注册制为核心的资本市场基础制度,有利于要素资源向科创等2023-02-03
1、创元驾校全称为苏州创元驾驶培训有限公司,为创元投资集团所属企业。2、从事驾驶员培训工作已有三十余年,累计培训了近万名2023-02-03
全球认证公司SGS和TUV已授予SamsungDisplayOLED面板EyeCareDisplayCertificat2023-02-03
智通财经APP讯,大地教育(08417)发布公告,与截至2021年12月31日止9个月取得亏损净额约530万港元相比,该集团预期截至2022年12月31日止9个2023-02-02
1、幼儿园安全会议记录内容篇参考: 会议时间20xx年x月x日 会议地点办公室中心议题 会议主持人 朱华杰2023-02-02
“放心吧,货基本备齐了,办完手续,直接从和田走专列发过去。”如则麦麦提·努日向电话那头的客户说。如则麦麦提是新疆维吾尔自治区和田县客2023-02-02
如今,各种数字设备几乎无处不在。我们通常使用的手机、IP、电脑等都是数字设备。那么这些数字设备中就会有很多功能。当然,我2023-02-02
2023年2月4日(周六)晚上20:00,开启二价、四价、九价HPV疫苗预约,先到先得,约完为止。①疫苗种类国产二价(玉溪泽润)HPV疫苗(50人份)国2023-02-02
Yourbrowserisnotsupported 来源:央视新闻实习记者陈歆铃 流程编辑:TF0222023-02-02
一、盘面回顾大盘全天探底回升震荡走高,创业板指领涨。盘面上,有色等周期股开盘走强,章源钨业、东方锆业涨停。人工智能概念股继续活跃,Cha2023-02-02