亚洲v欧美v另类v综合v日韩v,好看的黄色片,这里只有精品免费视频,特级做a爱片久久久久久

百度、訊飛、阿里大模型高考作文挑戰:都不及格,還有的讀不懂題
作者 | 雷科技2023-06-08

又到了一年一度的高考時間,作為6月份關注度最高的事情,每年的高考總是能夠引來各路大神關注,不少自認文采出眾的網友,還會挑戰現場寫一篇高考作文,然后讓大家進行評分。

不過,今年的高考作文整活,似乎因為某些東西的出現而有了不一樣的結果。

是的,就是登上熱搜的AI高考作文,AI寫高考作文在去年其實就已經有公司在嘗試,寫出來的文章從架構到立意都相當不錯,即使是有著多年教學經驗的老教師,看了都直接打個高分。

看到這里,或許你已經知道小雷想要整什么活了。沒錯,作為AI測試大師的小雷(ID:leitech),決定拿今年的高考作文命題去考考國內的各大AI,看看大家寫的作文水平到底如何?

當然,除了國內的AI,小雷也找來了一些海外的AI,看看這些“洋和尚”遇到中國高考,能不能整出一些新的花樣。

廢話不多說,讓我們直接來看看各家的作文都寫得怎么樣吧。

題目就一句話,能難倒AI嗎?

在今年的高考作文命題中,上海卷可能是最讓學生蒙圈的,上海卷的出題老師非常徹底的貫徹了“惜字如金”四個字,整個作文命題的描述加起來只有21個字:“一個人樂意去探索陌生世界,僅僅是因為好奇心嗎? ”,作為曾經的高考生,小雷我是最怕遇到這種命題作文的,從網絡上的聲音來看,大家也是如此。

面對這種只有一句話描述的作文題目,AI又會如何去解讀并回答呢?

先來看看訊飛的星火大模型。

圖源:雷科技

一篇標準的討論文,作為曾經的文科生,小雷表示:“這個我熟”,從個人角度而言,訊飛星火給的這篇文章質量是很高的,AI首先肯定了“好奇心”是人類探索陌生世界的一大原因,并且對“好奇心”如何驅動我們去探索未知做出了解釋。

然后訊飛星火以此進一步擴展,提出了探索陌生世界并非僅僅是因為好奇心,并且從個人的成長、情感以及精神追求等方面進行解讀,最后再用總結點題,我的評價就四個字:“有理有據,令人信服”。

唯一的問題是,文章的字數似乎不到800字,從WPS給出的字數統計來看是762個字(加上標點符號),按照審稿規范,估計會扣掉一些分數 。

接下來,我們有請通義千問來作答。

圖源:雷科技

與訊飛星火不同,通義千問用了另一個角度來解答命題,在開頭同樣先對“好奇心”驅使我們探索未知世界這段話進行了解析,然后再從社交需要、求知欲和探索欲等方面進行解讀。

不過,在文章的倒數第二段,或許是出于對提問者的建議,通義千問加入了一段“安全提示”。雖然從內容來說是沒有問題的,但是,如果將其作為高考作文來看,倒數第二段就看起來有點突兀了,審稿老師估計也會一臉懵逼,所以,即使前面寫得不錯,也會因此而扣掉一些分數。

下一個“作者”是百度的文心一言,看看它又會怎樣回答這個問題?

圖源:雷科技

文心一言同樣選擇以討論文的形式來撰寫作文,當然,這也是目前AI最擅長的文章類型。從內容角度來說,文心一言的回答也是十分不錯的,但是過多的段落和轉折詞,使得文章有點像“流水賬”。

不過在最后的立意點題上,文心一言給出的回答則更好一些,沒有局限于個人層面,而是擴大到對其他個體的思考與包容中,給出了更宏大的立意。

接下來讓我們看看“洋和尚”的表現,首先是谷歌投資的Claude。

圖源:雷科技

首先從字數上看,Claude恐怕就沒有合格,WPS的檢測結果顯示這篇文章的字數為646,離800字還有一些距離。不過,從內容上看,Claude確實是給出了不同于國產AI的解答,它從人類本身出發,以冒險基因和進取精神為核心,解讀了人類為什么要探索陌生世界。

從立意上來說,Claude或許是目前出場的AI中最高的,不僅僅是講到人類,更是將話題拓展到了文明的發展與延續、人類的未來等方面,讓人不禁有種“不明覺厲”的感覺。

不過,考慮到命題更多的是對個體想法的探索,雖然文章內容不錯,但是恐怕也拿不到滿分或是特別高的分數。

最后,就讓我們來看看ChatGPT的回答吧,鑒于時間關系,小雷最終是在New Bing上得到的答復。

圖源:雷科技

不得不說,New Bing給出的文章是所有回答中最長的,字數高達1144個,考慮到文科答卷的作文答題區大小,恐怕會超出限制,卷面分和文章本身的分數都會因此大打折扣。

至于文章本身,New Bing選擇從人類本身去探討這個問題,然后分別從求知欲、創造欲、競爭欲、自我實現等方面來討論人類為什么要探索陌生世界,立意方面也是與Claude相似,喜歡從人類角度來思考這個問題。

從這里其實就可以看出海內外生成式AI在邏輯上的區別,在面對相同的問題時,海外的AI有時候會傾向于從一個更大的層面上去進行解讀,而國內的AI則更加扣題,選擇從個人角度出發進行解讀。

我認為兩者存在差異的原因主要有兩點:一是海外的訓練數據與國內的訓練數據不同;二是對中文問題的理解不同,國內的中文互聯網有著過去歷年的高考題目,所以AI在看到類似的題目時,會優先與相近的數據進行匹配,最終寫出一篇類似于高考作文的成品,而海外的AI則是將其看做對“人類探索陌生世界”問題的解讀,所以選擇從一個更廣泛的角度進行回答。

至于哪個AI的文章更好,或許就因人而異了,喜歡科幻、喜歡宏大敘事的讀者,或許會更喜歡“洋和尚”的文章,從個人角度來說的話,國內的AI則表現得更好一些。

作文命題二選一,AI能理解嗎?

在本次的高考作文中,北京卷是給出了兩個命題,考生可以二選一進行作答,那么對于AI來說,它們遇到“選擇題”時,又會給出怎樣的回答呢?

首先是訊飛星火。

圖源:雷科技

內容來說是沒什么問題的,但是訊飛星火卻同時給出了兩篇文章,顯然是沒有意識到題目中的“任選一題”四個字的含義,而且從字數上看,兩篇均為500字左右,加起來是滿足700字以上的要求了,但是單獨算得話,全都不及格。

那么通義千問呢?

圖源:雷科技

問題同樣存在,一樣是寫了兩篇文章,一樣是五百字左右,基本上與訊飛星火犯了一樣的錯誤。

圖源:雷科技

國內三巨頭里,目前來看只有文心一言正確理解了題意,從中選擇了“續航”為題目并撰寫了一篇文章,單就這一點來說,已經是贏了。但是,具體到文章本身來說,過于簡單且字數僅400+,甚至比訊飛星火和通義千問還少,放到高考里基本上就是不合格的了。

再來看看兩個“洋和尚”表現如何,首先是Claude。

圖源:雷科技

Claude也成功理解了題意,并且給出了自己的見解,從字數上來看,居然是目前所有AI中最接近的,足足有625個字,而且文章也從“續航”本身的詞義,到人生、社會、科技等方面進行了不同的解讀,總體而言更具有可讀性和連貫性,表現十分不錯。

另一方面,New Bing則是給了我一個“驚喜”。

圖源:雷科技

是的,New Bing也理解了題意,但是它反過來問我想讓它選擇回答哪個問題,說實話挺樂的,而在我做出了選擇后,New Bing又給了我一篇900+字數的文章。從文章內容,結構以及字數要求來說,New Bing是在這個環節中表現最好的(如果忽略掉反問我如何選擇的話)。

而且,在測試過程中,New Bing還會提示“正在思考,請等待”的回答,然后我足足等了五分鐘都沒有下文(偷懶是吧?),最終在我的催促下,New Bing的文章才姍姍來遲,活脫脫上班想摸魚卻被老板抓現行的員工。

最后

AI寫高考作文,雖然本質上是整活,但是也可以側面反映目前的各個平臺的AI技術能力如何。從以上兩個測試的表現來看,目前國內理解能力最強的應該是文心一言,畢竟是唯一能夠理解北京卷題意的AI,而在文章結構和內容來說,訊飛、文心、通義都差不多,不過訊飛的更像一篇普通作文。

至于海外的“洋和尚”,從表現來看確實是領先國內AI平臺不少的,至少在提問的理解能力上要高出不少,但是因為缺乏國內中文互聯網的訓練數據的原因,所有在遇到這些帶有“中國特色”的提問時,會選擇從普通提問的角度去解答。

總的來說,目前生成式AI還在快速發展,各家都有著獨特的優點,同樣也存在一些問題,比如對文章的字數要求總是誤發 正確理解等。但是,考慮到它們誕生的時間,已經是相當恐怖的學習效率了。

熱門文章
時間的鐘表在2023年的日歷上已經劃走了一半。對于很多科技行業從業者而言,卻有種恍如隔世的錯覺。OpenAI憑一己之力給時代劃了一個鮮明的分界線——ChatGPT出現之前是AI 1.0,之后是AI2.
2023-06-08
X
主站蜘蛛池模板: 嗯啊噗嗤| 一级香蕉视频在线观看| 91久久青青青国产免费| 又粗又爽又猛高潮的在线视频| 女人下面被添全过程A片小说| 国产视频久久久| 日本三级三级三级免费看| 成人免费看黄| 麻豆中国做受xxx实指| 性夜黄A片爽爽免费武则天| bl顶弄巨大哭叫双性生子 | 久久夜色精品国产噜噜噜| 亚洲欧美字幕| 99精品久久久久久久免费看蜜月| 少妇被猛烈挺进爽爽A片漫画视频| 美女脱个精光露出奶胸网站| 毒枭奴性奶牛男宠H| 夜夜躁日日躁狠狠躁天气预报| 荒淫艳史在线播放| 和搜子一起同居日子2| 慕时陈南嘉全文免费阅读| 国产99色| 四川少妇特级真人毛片免费| 91精品福利| 禁室培欲之爱的俘虏电影| 我把护士日出水了90分钟视频| 亚洲美女精品| 自拍偷区亚洲综合第五月色| 岳好紧好紧我要进了| 国产日韩欧美精品一区二区三区| 日本乱论| 熟女人妻久久久一区二区蜜桃老牛 | 两峰夹小溪地湿又无泥诗| 学生爽?好多水?好舒服视频| 国产精品久久久久久久久久乐趣播 | 夏天偷窥女邻居洗澡| 我在语文课上c了语文课代表| 17c在线精品无码秘?入口| 内衣办公室动漫1~3卷资源| 久操视频网| 国产欧美又粗又猛又爽视频 |