天堂在线中文_国产免费又黄又爽又色毛_粉嫩虎白扒开小泬_午夜无码免费福利视频网址_一个人看的www免费视频在线观看_狼色精品人妻在线视频_国产激情电影综合在线看_日本三级在线播放线观看免_成人综合网站导航_

您的位置：首頁 >觀察 > 正文

焦點快播：五大模型解高考數學：阿里通義千問、360智腦10題全錯得0分；訊飛星火答對一半

來源：搜狐科技時間：2023-06-08 19:14:40

一年一度高考季，高考試題是大眾關注的焦點，也成為了AI能力的試金石。AI大模型數學功底到底如何？比人類“聰明”嗎？搜狐科技使用五款AI大模型對2023高考上海數學試卷進行了同題測試。

【資料圖】

在測試中，搜狐科技選取了高考試卷前10道填空題，讓百度文心一言、阿里通義千問、科大訊飛星火認知大模型、360智腦、ChatGPT進行回答。

測試結果顯示，這五款大模型在答數學題的能力上差異顯著。

最“聰明”的訊飛星火答對了5題，正確率50％。百度文心一言和ChatGPT“緊跟其后”，答對了4題，正確率為40％。

360智腦和通義千問則“全軍覆沒”，一道題也沒答對，交了白卷。

值得一提的是，昨天搜狐科技也用五款大語言模型產品，對高考作文全國卷（甲）進行了測試，并邀請了5位語文名師打分。

打分結果顯示，ChatGPT高考作文得分最高，文心一言、訊飛星火得分稍低，但跟ChatGPT處于同一水平。360智腦和通義千問得分最低。

雖然語文作文題和數學計算題，對大模型能力考察的維度并不盡相同。但巧合的是，不擅長寫作文的360智腦和通義千問，似乎也不擅長做數學題。

通過這兩次高考題測試，也能從側面反應出各家大模型的能力確實是“參差不齊”。如果ChatGPT、文心一言、訊飛星火是“學霸”，那么360智腦和通義千問則是妥妥的“學渣”。

附測試中使用的高考數學題題目：

1.不等式|x-2|<1的解集為__

2.a=(2,3)，b=(-1,2)，則a·b=__

3.首項為3，公比為2的等比數列的前六項和S6=__

4.tanA=3，tan2A=__

5.f(x)={2^xx>0;1，x≤0}的值域為__

6.復數z=1-i，則|1+iz|=__

7.圓的方程x^2+y^2-4y-m=0的面積為π，則m=__

8.三角形的三邊長為a=4，b=5，c=6，則sinA=__

9.某地一年四個季度的GDP(億元)，第一季度GDP為232，第四季度GDP為241，且四個季度的GDP逐季度增長，中位數、平均數相等。則該地一年的GDP為__

10.(1+2023x)^100+(2023-x)^100=a0+a1x+a2x^2+…+a100x^100。若ak<0，正數k的最大值為__

責任編輯：

熱門資訊

日方對中俄聯合空中戰(zhàn)略巡航表示擔憂中方回應當前熱訊 中國外交部發(fā)言人汪文斌6月8日主持...
彭斯開啟首場總統(tǒng)競選集會公開與特朗普決裂 6月7日，美國前副總統(tǒng)彭斯正式開啟...
烏密謀炸北溪?澤連斯基喊冤“真不是我們干的”|世界新資訊 據法新社報道，當地時間7日，烏克...
世界滾動:罕見！美歐警告科索沃讓步否則面臨“后果” 6月7日，美國和歐盟罕見要求科索沃...

文章排行

圖片新聞

62%受訪者對新能源汽車基本了解汽車“里程焦慮”較為突出 近日，重慶市萬州區(qū)、開州區(qū)、城口...
聚焦！2022年全國“綠色產品認證與標識宣傳周”正式啟動 9月26日，由市場監(jiān)管總局主辦的202...
昆明市體育中心足球錦標賽落幕組委會已經在為新賽季做準備 9月18日，全民健身·2021昆明市體...
中安街道種植了100畝萬壽菊每畝產值是種植包谷的兩倍多 時下，正是萬壽菊收獲的季節(jié)。走進...