(相关资料图)
【新智元导读】天下苦GPT检测器久矣!用AI的怕被揪出来,没用AI的怕被冤枉。最近,又发生了一起被AI误判的冤假错案。
离了个大谱!
辛辛苦苦码出的毕业论文,居然被教授拿去放在ChatGPT里检测,然后就被判定为抄袭?
教授因此挂掉了全班一半的人,然后学校还因此拒发毕业证?
01 教授:被ChatGPT认领的,都得0分
最近,在得克萨斯农工大学(Texas A&M),发生了这样一件令人哭笑不得的事。
为了检测学生提交的论文是否作弊,一位名叫Jared Mumm的教授把他们的论文提交给了ChatGPT。
他对学生们说:我会把你们的论文复制粘贴到ChatGPT中,它会告诉我,你们的论文是不是它生成的。
「我会在两个不同的时间段里,把每个人的最后三篇论文放进去,如果这两次它们都被ChatGTP认领了,我就会给你0分。」
显然,没有任何计算机相关背景知识的Mumm教授,对ChatGPT的原理一窍不通。
实际上,ChatGPT并不能识别由AI创建的内容,即使是它自己写的都不行。
甚至,他连ChatGPT都没拼对——直接写成了「Chat GPT」以及「chat GPT」。
结果,全班有一多半人的论文被ChatGPT不负责任地「认领」,因而挂了这一科。
更倒霉的是,大多数已毕业学生的文凭,因此直接被学校拒发了。
当然,Mumm教授也不是毫不留情,他为全班同学提供了重做作业的机会。
02 如何证明自己没用ChatGPT?
收到上面这封邮件后,几名学生写信给Mumm力证自己的清白。他们提供了带有时间戳的Google Docs,来证明自己并没有使用ChatGPT。
但Mumm教授直接无视了这些电子邮件,只在几个学生的评分软件中留下了这样的回应——我不给AI生成的狗屎评分。
不过,还是有学生「平反」了,据说,已经有一名学生被「无罪释放」,并且得到了Mumm的道歉。
然而,让情况更复杂的事,有两名学生「挺身而出」,承认自己的确在本学期使用过ChatGPT。
这一下子就让其他没有用ChatGPT写论文的学生,更难自证清白了……
对此,得克萨斯农工大学商学院表示正在调查这一事件,但并没有学生不及格,也没有人因为这个问题被延毕。
学校表示,Mum教授正在一对一地与学生谈话,了解他们写作业的过程中是否使用了AI,使用到了什么程度。个别学生的文凭将被扣留,直到调查完成。
而学生们表示,自己并没有获得文凭。
目前,事件还在调查中。
03 用ChatGPT检测ChatGPT?
那么问题来了,ChatGPT能证明一篇文章是不是自己写的吗?
来源:B站UP主「子羡nike」
对此,我们基于教授这封邮件的内容,问了问ChatGPT的观点:
ChatGPT一上来就表示,自己并没有能力验证内容的原创性,以及是不是由AI生成的。
「这位老师似乎误解了像我这样的AI是如何工作的。虽然AI可以根据提示生成文本,但它不能确定另一篇文本是否由人工智能生成。」
话虽如此,但这并不能拦住爱整活的网友。
他们来了一出「以其人之道还治其人之身」,在线教Mumm教授做人。
首先,ChatGPT表示,教授写的这封邮件,正是出自自己之手。
上下滑动查看全部
紧接着,网友又复刻了Mumm教授的做法——
拿一段看起来像是某篇论文的节选,来问ChatGPT是不是它写的。
这次,ChatGPT虽然没说是自己写的,但基本上确定内容就是来自AI。
其中,有几个特征与Al生成的内容一致:
1. 文本是连贯的,遵循一个清晰的结构,从一般到具体。
2. 准确地引用了来源和数字数据。
3. 正确地使用了术语,这是典型的Al模型的特点。比如GPT-4,就是在包括科学文献在内的各种文本中训练出来的。
上下滑动查看全部
那么实际上,这段内容的出处是哪里呢?
有意思的地方来了,没想到竟然是Mumm教授自己写的博士论文!
04 AI检测器并不灵?
既然ChatGPT无法检验一段内容是不是AI生成的,那什么可以呢?
自然是为此专门诞生的「AI检测器」,号称是用魔法打败魔法。
众多AI检测器中,最出名的一个便是由普林斯顿华人本科生Edward Tian创建的GPTZero——它不仅免费,而且效果拔群。
只需把文字复制粘贴进去,GPTZero就可以明确地指出一段文字中,哪段是AI生成的,哪段是人类写的。
原理上,GPTZero主要靠「困惑度」(文本的随机性)和「突发性」(困惑度的变化)作为指标进行判断。
在每次测试中,GPTZero还会挑选出困惑度最高的那个句子,也就是最像人话的句子。
但这个方法其实并不完全可靠,虽然GPTZero声称产品的假阳性率<2%,但这个数据更多是基于对新闻类内容的评判。
在实测中,有人曾把美国宪法输入GPTZero,结果被判定是AI写的。
而刚刚那段ChatGPT的回复,GPTZero则认为很可能完全是由人类写的。
这导致的后果就是,不了解其中原理、太固执的老师,就会无意中冤枉很多学生,比如Mumm教授。
所以,如果遇到这种情况,我们该怎么自证清白?
有网友提议,类似「美国宪法实验」,把ChatGPT出现之前的文章丢进AI检测器,看看结果如何。
然而,从逻辑上讲,即使能证明AI检测器确实不靠谱,学生也无法直接证明自己的论文不是由AI生成的。
问一下ChatGPT怎么破,它是这么说的。
「让老师理解AI的工作方式和局限性」,嗯,ChatGPT发现了华点。
目前小编唯一想到的答案是,如果不在教授眼皮底下直接写,那就每次写论文都录屏,或者干脆给教授开直播。
连OpenAI对于自己的官方ChatGPT检测器,也只能保证26%的「真阳性」正确率。
他们还特地发了官方声明给大家打预防针:「我们真的不建议孤立地使用这个工具,因为我们知道它可能出错,使用AI进行任何种类的评估都是如此」。
05 AI内容检测为何如此困难?
目前市面上已有的检测器已经数不胜数——GPTZero、Turnitin、GPT-2 Output、Writer AI 、Content at Scale AI等等,但准确率都差强人意。
那么,为什么我们想检测一段内容是不是AI生成的,就这么困难?
Turnitin的AI副总裁Eric Wang称,用软件检测AI写作的原理,是基于统计学。从统计学的角度来看,AI与人类的区别在于,它极其稳定地处于平均水平。
「像ChatGPT这样的系统就像是自动补全的高级版本,寻找下一个最可能要写的单词。这实际上就是它为什么读起来如此自然的原因。AI写作是人类写作中最可能的子集。」
Turnitin的检测器便会「识别出书写过于一致的平均情况」。然而,有时人类的写作看起来也会处于平均水平。
在经济学、数学和实验室报告中,学生倾向于遵循固定的写作风格,这意味着他们更有可能被误认为是AI写作。
更好笑的是,前不久的一篇论文中,来自斯坦福大学的研究团队发现:对于非母语者的论文,GPT检测器更容易判为AI写的。其中,中国人写的英文论文被判为AI生成的概率,高达61%。
论文地址:https://arxiv.org/pdf/2304.02819.pdf
研究人员从中国的教育论坛上获取了91篇托福作文,又从美国Hewlett基金会的数据集中摘取了88篇美国八年级学生写的作文,输进了7大GPT检测器。
图中百分比即「误判」比例,也就是明明由人写的,却被判为AI生成的
可以看到,美国学生的作文被误判的概率最高才12%,而中国学生的作文,概率基本过半,甚至高达76%。
研究者的结论是,因为非母语者写的东西不地道,复杂度低,容易被错判。
可见,以复杂度来判定作者是人类还是AI,并不合理。
抑或,背后还有其他原因?
对此,英伟达科学家Jim Fan称,检测器在很长一段时间内都是不可靠的。毕竟AI会变得越变越强,并且会以越来越像人类的方式写作。
可以肯定地说,随着时间的推移,这些语言模型的小怪癖会越变越少。
不知这对学生们,会是福音还是噩耗。
关键词:
推荐内容
- 焦点!离谱!美国教授用ChatGPT“证实”
- 九王一后在线全文阅读_九王一后 世界新
- 理念领先20年!巩汉林戏言3241 瓜迪奥拉
- 魏镜_关于魏镜简述|世界百事通
- 溢价离谱?暗藏费用?上海消保委点名票务
- 协鑫集成:预计2023年底实现组件自主产能
- 这杯咖啡便宜了 静态体验魏牌新摩卡DHT-
- 朗诗苏州狮山地块规划公示 拟建3幢高层
- 历时三年建设,长三角示范区元荡湖第三期
- 全球观察:英国伦敦举办“国际中文日”(
- 赋能千行百业 中国北斗系统进入规模应用
- 世界速讯:早报|工信部:超前谋划量子信
- 环球微速讯:美股三大股指17日均涨超1%
- 天天快讯:【警方视点】交管设施再升级
- 近13年首次!本赛季没有法国籍球员晋级欧
- 小男孩发型图片男短发_小男孩发型
- 世界热点评!危?小蜜蜂本赛季英超54球,
- 天天新动态:dnf解封方法_dnf解封方法是什么
- 焦点热议:纸戒指的折法爱情公寓5(纸戒指
- 美记:波波不会执教文班太久 科尔能够成
- 国产十佳suv_2020国产suv口碑排行榜前十名
- 天天实时:擦亮一往无前的“精神利刃”—
- 许你一个山水清远的江南小城|当前聚焦
- 通用技术沈阳机床亮相第25届大连国际工业
- 《重返未来1999》百夫长心相推荐 百夫长
- 邵武市生活垃圾焚烧发电厂PPP项目炉渣综
- 通讯!2023中国旅游日敦煌玉门关景区免门票
- 世界新动态:买二手iPhone更贵了?闲鱼突
- 离岸人民币暴跌超500点,即将破7,注意股
- 报道:高校学生比拼“可重复使用航天运载
- 焦点速讯:游戏王决斗链接如何提升世界等
- 移动硬盘电脑读不出来怎么弄_移动硬盘电
- 宝城期货:预计原油期货维持震荡偏弱走势
- 前沿资讯!崇州市国土规划高清图
- 哈姆:我们在转换防守中要做得更好 需要
- 2023长春环卫工人购房补贴申请指南-每日
- 总装机超136万千瓦!广东深圳在役最大容
- 天天快看点丨SensorTower:王者荣耀4月吸
- 每日精选:华中地区首次实现变电站无人机
- 天天最新:2000多年前的“公演现场”究竟
- 两市融资余额减少14.36亿元 环球热文
- lol英雄联盟怎么观战 英雄联盟怎么才能
- 请问500毫升等于多少克_500毫升等于多少
- 欧冠早报:国米赛季四杀米兰 时隔13年再
- 今日鸡犬不宁打一生肖_鸡犬不宁打一生肖
- 孙准浩跑路失败!出逃细节曝光:在上海机
- 探访绿色引擎 | 污水变碧波 湖北联投
- 曾剑_对于曾剑简单介绍 天天观热点
- 今日不发火砂浆厂家_不发火砂浆_全球独家
- 天天要闻:中日防务部门海空联络机制直通
- 五年内禁燃油车,这次是专家还是砖家?|
- 虎牙(HUYA.US)Q1营收同比降27% 同比扭亏
- 指导价17.99-23.99万元 全新一代别克君
- 预算2000万 深南电路股份有限公司废气系
- 新疆中级会计什么时候报名2023年
- 全球最资讯丨滨江房产:2022年杭州拿地住
- 港澳通行证要几寸照片?港澳通行证相片底
- iphone录音软件怎么用(iphone录音软件)
- 澳网入围名单公布!三巨头领衔冲冠,中国
- 环球精选!黑龙江2023年中级会计在哪儿报名
- 国产十佳suv_2020国产suv口碑排行榜前十名
- 天天实时:擦亮一往无前的“精神利刃”—
- 许你一个山水清远的江南小城|当前聚焦
- 通用技术沈阳机床亮相第25届大连国际工业
- 《重返未来1999》百夫长心相推荐 百夫长
- 邵武市生活垃圾焚烧发电厂PPP项目炉渣综
- 通讯!2023中国旅游日敦煌玉门关景区免门票
- 世界新动态:买二手iPhone更贵了?闲鱼突
- 离岸人民币暴跌超500点,即将破7,注意股
- 报道:高校学生比拼“可重复使用航天运载
- 焦点速讯:游戏王决斗链接如何提升世界等
- 移动硬盘电脑读不出来怎么弄_移动硬盘电
- 宝城期货:预计原油期货维持震荡偏弱走势
- 前沿资讯!崇州市国土规划高清图
- 哈姆:我们在转换防守中要做得更好 需要
- 2023长春环卫工人购房补贴申请指南-每日
- 总装机超136万千瓦!广东深圳在役最大容
- 天天快看点丨SensorTower:王者荣耀4月吸
- 每日精选:华中地区首次实现变电站无人机
- 天天最新:2000多年前的“公演现场”究竟
- 两市融资余额减少14.36亿元 环球热文
- lol英雄联盟怎么观战 英雄联盟怎么才能
- 请问500毫升等于多少克_500毫升等于多少
- 欧冠早报:国米赛季四杀米兰 时隔13年再
- 今日鸡犬不宁打一生肖_鸡犬不宁打一生肖
- 孙准浩跑路失败!出逃细节曝光:在上海机
- 探访绿色引擎 | 污水变碧波 湖北联投
- 曾剑_对于曾剑简单介绍 天天观热点
- 今日不发火砂浆厂家_不发火砂浆_全球独家
- 天天要闻:中日防务部门海空联络机制直通
- 五年内禁燃油车,这次是专家还是砖家?|
- 虎牙(HUYA.US)Q1营收同比降27% 同比扭亏
- 指导价17.99-23.99万元 全新一代别克君
- 预算2000万 深南电路股份有限公司废气系
- 新疆中级会计什么时候报名2023年
- 全球最资讯丨滨江房产:2022年杭州拿地住
- 港澳通行证要几寸照片?港澳通行证相片底
- iphone录音软件怎么用(iphone录音软件)
- 澳网入围名单公布!三巨头领衔冲冠,中国
- 环球精选!黑龙江2023年中级会计在哪儿报名
- 排列三和值速查表(和值速查表)-全球头条
- Failed to connect to zw.gozuowen.c
- 国安新工体首胜,斯坦利下课危机暂缓 全
- 全球聚焦:干蚯蚓价格多少钱一公斤(干蚯
- 乳腺纤维瘤手术后饮食注意_乳腺纤维瘤术
- 安徽省淮北市计量所积极开展“5.20世界计
- 商务渠道是销售吗_商务渠道bd是什么意思
- 环球讯息:美媒:美国应对枪支暴力陷入困
- 人民银行今日开展20亿元逆回购操作 公开
- 国内首个!洛阳文旅公益图库上线 精选
- 地中海气候主要分布在哪_地中海气候主要
- 速讯:[不饱和树脂]:不饱和树脂市场早间
- 海富通基金管理有限公司关于开展海富通上
- 快资讯丨古林街道香逸园社区开展“雏鹰计
- 环球观察:应急管理分为哪两类类型_应急
- 开启屏幕共享后,50万元被转走 甘肃省公
- 沙河高教园区建设发展理事会秘书处会议召
- 新季国产大豆生产前景乐观
- 宜都:特殊群体有“医”靠 环球快报
- 再见吉他谱张震岳_再见 吉他谱|今日观点