高考臨近,又到高考作文押題的賽點(diǎn)了!
最近,B站UPphp主“圖靈的貓”用AI預(yù)測(cè)出了2023年高考作文的七大命題方向,對(duì)應(yīng)高考的七套考卷。
(資料圖)
用AI押題,聽(tīng)上去不太靠譜,但這已經(jīng)不是這位UP主第一次用AI預(yù)測(cè)高考作文題了。
?
去年5月,他用AI預(yù)測(cè)2022年高考作文題,命中了全國(guó)乙卷、新高考II卷、北京卷II和浙江卷!
在他上個(gè)月發(fā)起的投票中,有超7成的參與者支持他繼續(xù)預(yù)測(cè)2023年的高考作文。
當(dāng)然,押中與否是個(gè)概率問(wèn)題,不見(jiàn)得百發(fā)百中。不過(guò),用AI押題這件事是怎么實(shí)現(xiàn)的?需要花費(fèi)多少時(shí)間和成本?帶著這些問(wèn)題,我們和“圖靈的貓”聊了聊。
AI是如何預(yù)測(cè)高考作文題的?
作為擁有90萬(wàn)粉絲的B站科技區(qū)UP主,“圖靈的貓”很擅長(zhǎng)用技術(shù)“整活”,做一些有趣的開(kāi)發(fā)實(shí)踐。
比如讓AI預(yù)測(cè)高eFWHEPuVe考作文題、訓(xùn)練一個(gè)反詐AI跟騙子聊天、開(kāi)發(fā)一個(gè)自動(dòng)寫(xiě)小說(shuō)的免費(fèi)網(wǎng)站等等,這些視頻都收錄在他名為“圖靈計(jì)劃”的合集里。
截至發(fā)稿前,他讓AI預(yù)測(cè)2022年和2023年高考作文題的兩條視頻,分別獲得了275萬(wàn)和36.3萬(wàn)的播放量。
以今年這條題為《爬遍全網(wǎng)數(shù)據(jù),我又用AI預(yù)測(cè)了2023年高考作文題》的視頻為例,“圖靈的貓”在視頻中介紹了讓AI預(yù)測(cè)高考作文題的原理和過(guò)程,并給出了AI的預(yù)測(cè)結(jié)果。
一共七大命題方向,每個(gè)命題方向包括三部分:核心詞、預(yù)測(cè)主題、模型表征。
對(duì)應(yīng)到高考作文,可以理解為中心思想、文章主題、與主題相關(guān)的描述或關(guān)鍵詞。
話不多說(shuō),我們先來(lái)點(diǎn)擊這里看看今年他用AI押題的最終結(jié)果。
那讓AI預(yù)測(cè)高考作文題的原理是什么呢?
首先要從高考作文的本質(zhì)出發(fā)。在“圖靈的貓”看來(lái),高考作文本質(zhì)上是對(duì)考生價(jià)值觀、人生觀和家國(guó)意識(shí)的引導(dǎo)。
深諳此道的高考作文命題組,會(huì)從官媒文章、國(guó)家政策、政府指導(dǎo)意見(jiàn)和工作報(bào)告中,尋找規(guī)律和命題靈感。
而規(guī)律挖掘和數(shù)據(jù)分析,正是AI所擅長(zhǎng)的。獲取的數(shù)據(jù)越多,分布越合理,AI就越能夠準(zhǔn)確地預(yù)測(cè)。過(guò)程沒(méi)有感情,全是技巧。
基于以上原理和思考,“圖靈的貓”專門(mén)寫(xiě)了一套爬蟲(chóng),爬取了近一年上千篇人民日?qǐng)?bào)、央視新聞等官媒發(fā)表的文章,政府指導(dǎo)意見(jiàn)和工作報(bào)告。
然后把它們保存到本地,形成一個(gè)個(gè)文檔,再通過(guò)自然語(yǔ)言處理中的預(yù)訓(xùn)練模型和主題建模,對(duì)這些文檔進(jìn)行理解和歸納,分為文化、教育、科研、國(guó)防、外交等主題,每個(gè)主題提取出一些具有代表性的關(guān)鍵詞,比如說(shuō)科研主題下的“神十三”。
考慮到近來(lái)AI技術(shù)的迭代,相比于去年的預(yù)測(cè),今年略有不同的是,他引入了ChatGPT作為輔助,更加智能地給出選題建議。
但由于ChatGPT的訓(xùn)練數(shù)據(jù),絕大多數(shù)來(lái)自英文互聯(lián)網(wǎng),對(duì)中文語(yǔ)境下的文本理解存在一些偏差。再加上聯(lián)網(wǎng)版的GPT模型,比如NewBing、GPT-4的插件等,都有調(diào)用接口限制,一般只能記住幾javascript千個(gè)token或漢字。
如果直接用它們進(jìn)行預(yù)測(cè),得出的預(yù)測(cè)結(jié)果,往往都是基android于搜索引擎前幾條的人為預(yù)測(cè)結(jié)果,而不是真的基于大數(shù)據(jù)的AI預(yù)測(cè)。
想要分析上千篇人民日?qǐng)?bào),如此大量的文本,需要一個(gè)不限制文本輸入長(zhǎng)度的模型,因此往往只能部署在本地,但這與ChatGPT并不沖突。
他的做法是,使用本地模型完成第一輪主題歸納,然后將簡(jiǎn)化的信息輸入ChatGPT,基于ChatGPT強(qiáng)大的泛化能力,判斷和預(yù)估不同主題和關(guān)鍵詞被選中的概率,起到類(lèi)似命題指導(dǎo)組的作用。
而在花費(fèi)的時(shí)間和成本上,圖靈的貓表示,去年由于是從0到1開(kāi)發(fā)預(yù)測(cè)模型、爬數(shù)據(jù),所以耗時(shí)很久,但今年用時(shí)縮短很多。每個(gè)環(huán)節(jié)的耗時(shí)比例大概是:60%的時(shí)間抓取數(shù)據(jù),30%的時(shí)間用AI進(jìn)行主題建模,然后剩下10%的時(shí)間人工對(duì)內(nèi)容進(jìn)行規(guī)整。
他告訴我們:“目前ChatGPT二十多萬(wàn)次的API調(diào)用,大概只要十幾美元,再加上已經(jīng)在本地對(duì)信息進(jìn)行了處理和壓縮,所以總體消耗的token數(shù)量少很多,最終花費(fèi)的成本并不高?!?/p>
AI押題,水平如何?
2023年高考作文預(yù)測(cè)結(jié)果的準(zhǔn)確性,要等到幾天后才能見(jiàn)分曉。
“圖靈的貓”還發(fā)動(dòng)態(tài)提醒大家:“高考完別忘了來(lái)看看準(zhǔn)確率”。
我們回顧了UP主2022年的預(yù)測(cè)與高考真題,兩者雖然并不完全一致,但AI確實(shí)踩中不少要點(diǎn)。
比如,在2022年全國(guó)新高考II卷中,要求以“選擇創(chuàng)造未來(lái)”為題寫(xiě)作,參考材料中提到了科學(xué)攻關(guān)、北斗導(dǎo)航系統(tǒng),并傳達(dá)出民族自主自強(qiáng)的精神。
2022年全國(guó)新高考II卷 作文題
而在AI給出的命題方向中,有一個(gè)以“探索、夢(mèng)想”為核心詞,預(yù)測(cè)主題正是“科技發(fā)展、探索精神、自主自強(qiáng)”。真題材料中提到的“北斗”,也出現(xiàn)在模型表征中。
除此之外,全國(guó)乙卷、北京卷II和浙江卷的作文真題,也與AI預(yù)測(cè)的命題方向不謀而合。
一部分網(wǎng)友驚嘆:“高考命題組可以考慮一下反預(yù)測(cè)命題算法了”,還有人希望UP主預(yù)測(cè)一下中考題、四六級(jí)、考研題、考公題。
但由于這些考試的出題標(biāo)準(zhǔn)過(guò)于離散,沒(méi)有統(tǒng)一的命題規(guī)律和命題流程,各省市乃至學(xué)校之間都有很大不同,“圖靈的貓”認(rèn)為預(yù)測(cè)意義不大。
也有一部分網(wǎng)友表示質(zhì)疑:
還有網(wǎng)友從教育公平的原則出發(fā),認(rèn)為很多地方的考生不了解互聯(lián)網(wǎng)及其衍生的文化,AI預(yù)測(cè)的“流浪地球”“孔乙己”“互聯(lián)網(wǎng)文學(xué)”等,高考作文顯然不會(huì)考。
還有考生表示,這些預(yù)測(cè)結(jié)果基本都在自己的語(yǔ)文老師押題范圍之內(nèi),有些甚至已經(jīng)在模擬考中遇到過(guò)了??碅I預(yù)測(cè),頗有“聽(tīng)君一席話,如聽(tīng)一席話”的意味。
再加上命題組不按常理出牌也是常有的事,所以AI預(yù)測(cè)的意義或許并沒(méi)有eFWHEPuVe想象中大。
對(duì)此,圖靈的貓認(rèn)為,AI預(yù)測(cè)和人類(lèi)預(yù)測(cè)在本質(zhì)上并無(wú)差別,都是基于經(jīng)驗(yàn)?zāi)P瓦M(jìn)行的,只能說(shuō)是給學(xué)生備考提供一些方向。而圍繞主題進(jìn)行擴(kuò)展寫(xiě)作,依然是對(duì)寫(xiě)作能力、文字功底、價(jià)值觀等的考驗(yàn),押題并沒(méi)有多少短時(shí)間提分的奇效。
不過(guò),如果真的能再次精準(zhǔn)押中,那么高考命題組的老師們未來(lái)可能要進(jìn)一步大開(kāi)腦洞了。
標(biāo)簽:
高考臨近,又到高考作文押題的賽點(diǎn)了!最近,B站UPphp主“圖靈的貓”...
1、在排面上陳列好商品,加貨。2、有時(shí)候應(yīng)該是要幫忙收貨的。3、看...
百萬(wàn)醫(yī)療險(xiǎn)可以報(bào)銷(xiāo)ICU費(fèi)用,但是僅限于其保障范圍內(nèi)的相關(guān)費(fèi)用。一...
近日,甘肅省兩當(dāng)縣市場(chǎng)監(jiān)督管理局開(kāi)展了“隨機(jī)查餐廳”專項(xiàng)行動(dòng)。...
第三家退市房企出現(xiàn)了。6月2日,ST泰禾(000732 SZ,泰禾集團(tuán))發(fā)布...
原標(biāo)題:首大眼耳鼻喉醫(yī)院因存在隱患被臨時(shí)查封北京全市大排查大整...
黃河新聞網(wǎng)呂梁訊為進(jìn)一步增強(qiáng)少年兒童交通文明意識(shí)、安全意識(shí)、法...
1、《名人傳》是由法國(guó)作家羅曼·羅蘭寫(xiě)的。2、書(shū)中寫(xiě)了三個(gè)世界上...
我和隔壁的美少婦捅破窗戶紙,彼此心照不宣:這是我們的小秘密,現(xiàn)代文
中國(guó)大陸人民非屬“中華民國(guó)國(guó)民”?,大陸,行政院,中華民國(guó),中國(guó)國(guó)民黨
此次規(guī)劃原來(lái)的商業(yè)用地+二類(lèi)居住用地調(diào)整為二類(lèi)居住用地,容積率6...
6月1日上午,合肥市瑤海實(shí)驗(yàn)小學(xué)開(kāi)展“誦讀紅色經(jīng)典,書(shū)香浸潤(rùn)心靈...
記者從工信部了解到,《區(qū)塊鏈和分布式記賬技術(shù)參考架構(gòu)》(GB T42...
吳承恩老先生寫(xiě)得唐僧其實(shí)還是有很多缺點(diǎn)的,他犯過(guò)很多的錯(cuò),如果...
黃金上個(gè)交易日走出震蕩上行日線報(bào)收一根略帶上下小影線的中等實(shí)體...
想必現(xiàn)在有很多小伙伴對(duì)于水仙花的含義方面的知識(shí)都比較想要了解,...
【高質(zhì)量發(fā)展調(diào)研行】安徽:因水而生,依水而興
中工網(wǎng)訊(工人日?qǐng)?bào)-中工網(wǎng)記者黃榆)5月29日,中建二局云南分公司...
不管您是富得流油的收藏控,還是想從中賺一筆的中間商,只要有機(jī)會(huì)...
今日上午9:00-11:00本人在中金路演,希望平時(shí)關(guān)注并支持我的投資者...
1、你下載的軟件一定不是APPSTORE里下載的。2、設(shè)置-通用-設(shè)備管理-...
1、安裝電子教室軟件就可以。2、像塞思多媒體教學(xué)軟件、紅蜘蛛等都...
想必現(xiàn)在有很多小伙伴對(duì)于九江斗地主怎么下方面的知識(shí)都比較想要了...
中西醫(yī)結(jié)合肝病雜志小程序,中西醫(yī)結(jié)合肝病雜志這個(gè)很多人還不知道,...
少年志|那些“全國(guó)統(tǒng)一”的童年回憶---還記得,在沒(méi)有手機(jī)的年代里...
個(gè)人養(yǎng)老金制度是我國(guó)養(yǎng)老保險(xiǎn)體系第三支柱的重要組成部分,去年11...
近日,杭州通用人工智能論壇暨AIIA人工智能產(chǎn)業(yè)發(fā)展大會(huì)召開(kāi),大會(huì)...
國(guó)家郵政局今天(1日)發(fā)布數(shù)據(jù),截至5月31日,今年以來(lái)我國(guó)快遞業(yè)...
想必現(xiàn)在有很多于微信面容支付選項(xiàng)沒(méi)了方面的知識(shí)都比較想要了解,...
廣告
X 關(guān)閉
廣告
X 關(guān)閉