學(xué)習(xí)機(jī)開卷大模型,AI還需要更可靠

陳奇杰2024-06-26 21:31

經(jīng)濟(jì)觀察網(wǎng) 記者 陳奇杰 自去年5月科大訊飛首次在學(xué)習(xí)機(jī)中搭載大模型以來,小度、小猿、學(xué)而思和作業(yè)幫等主流學(xué)習(xí)機(jī)品牌紛紛將自家的大模型與學(xué)習(xí)機(jī)產(chǎn)品結(jié)合。近日,松鼠AI和讀書郎兩家學(xué)習(xí)機(jī)品牌,也相繼推出結(jié)合了大模型技術(shù)的學(xué)習(xí)機(jī)新品。

“大模型將成為未來AI學(xué)習(xí)機(jī)競爭的主戰(zhàn)場,也將成為學(xué)習(xí)機(jī)發(fā)展的分水嶺。”科大訊飛副總裁章繼東接受經(jīng)濟(jì)觀察網(wǎng)采訪時(shí)直言。

章繼東的這一判斷或許可以解釋為什么各家的學(xué)習(xí)機(jī)開卷大模型。不過,受大模型能力的限制,目前的AI學(xué)習(xí)機(jī)產(chǎn)品表現(xiàn)仍有不足,例如在語文、英語這類語言學(xué)科上表現(xiàn)較好,在數(shù)學(xué)方面,大模型相關(guān)功能的產(chǎn)品化還需要時(shí)間。

大模型帶來了什么

洛圖科技數(shù)據(jù)顯示,中國學(xué)習(xí)機(jī)市場2023年全渠道銷量為472.1萬臺(tái),同比增長8.1%。

學(xué)習(xí)機(jī)主要解決學(xué)習(xí)資源、預(yù)習(xí)和復(fù)習(xí),以及個(gè)性化學(xué)習(xí)等方面的需求。與普通的平板電腦相比,學(xué)習(xí)機(jī)廠商通常還會(huì)使用更護(hù)眼的屏幕。

2019年,科大訊飛推出面向C端(個(gè)人用戶端)的人工智能學(xué)習(xí)機(jī),探索AI技術(shù)在學(xué)生個(gè)性化精準(zhǔn)學(xué)習(xí)、英語口語練習(xí)、作文批改等場景的應(yīng)用。

科大訊飛學(xué)習(xí)機(jī)產(chǎn)品線總經(jīng)理翟吉博介紹,科大訊飛會(huì)和相關(guān)教育部門合作,采用機(jī)器學(xué)習(xí)技術(shù),記錄一些大規(guī)??荚嚨淖魑脑u分標(biāo)準(zhǔn)以及閱卷老師的批改評分。因此,模型可以通過分析過往數(shù)據(jù),進(jìn)行評分質(zhì)量檢測,識別出教師評分中的異常情況。

這類沉淀下來的底層技術(shù)被科大訊飛復(fù)用在AI學(xué)習(xí)機(jī)上,只是因?yàn)槭鼙姴煌诮换シ绞胶蛻?yīng)用形態(tài)與面向B端(企業(yè)用戶端)的產(chǎn)品有差異。

2023年5月,科大訊飛將大模型技術(shù)與學(xué)習(xí)機(jī)結(jié)合,這為產(chǎn)品帶來了新的變化:學(xué)習(xí)機(jī)不再僅給出做題的過程和答案,還會(huì)通過詢問孩子在解題過程中的思路和疑惑,給予一定的輔導(dǎo)支持;在作文批改方面,之前學(xué)習(xí)機(jī)一般只能做到批改字、詞、句的錯(cuò)誤,現(xiàn)在還能根據(jù)章節(jié)寫作要求,給出針對性的寫作建議和優(yōu)化參考。

各有賣點(diǎn)的廠商

目前,國內(nèi)的學(xué)習(xí)機(jī)廠商大致分為三個(gè)陣營:以讀書郎、步步高等為代表的傳統(tǒng)教育硬件企業(yè);以學(xué)而思、作業(yè)幫、猿輔導(dǎo)等為代表的轉(zhuǎn)型期教培企業(yè);以小度、科大訊飛為代表的科技型企業(yè)。

頭部學(xué)習(xí)機(jī)廠商的競爭較為激烈,市場份額差距并不大。根據(jù)洛圖科技數(shù)據(jù),2024年一季度,國內(nèi)學(xué)習(xí)平板線上銷量前五的品牌分別是學(xué)而思、小度、小猿、作業(yè)幫和科大訊飛,份額分別為14.2%、13.5%、12.2%、10%和10%。

這些學(xué)習(xí)機(jī)廠商基本都有對應(yīng)的AI大模型,如學(xué)而思的九章大模型、小度的文心大模型、作業(yè)幫的銀河大模型、小猿的看云大模型和科大訊飛的訊飛星火大模型等。學(xué)習(xí)機(jī)AI功能的落地場景也相似,主要包括AI精準(zhǔn)學(xué)、口語陪練、作業(yè)批改、作文批改、數(shù)學(xué)互動(dòng)輔導(dǎo)等。

經(jīng)濟(jì)觀察網(wǎng)記者走訪多家學(xué)習(xí)機(jī)門店發(fā)現(xiàn),銷售人員不一定了解大模型技術(shù),但大多會(huì)主動(dòng)向客人介紹學(xué)習(xí)機(jī)的精準(zhǔn)學(xué)、作文批改和英語口語互動(dòng)練習(xí)等AI功能。其中,AI精準(zhǔn)學(xué)可以讓孩子做題測出知識薄弱項(xiàng),并推送相應(yīng)的學(xué)習(xí)內(nèi)容、舉一反三給出練習(xí)題,讓孩子針對性地訓(xùn)練,較受到家長青睞。

在具體的產(chǎn)品選擇上,不同的家長關(guān)注點(diǎn)相差較大。

一位初中生家長說,她發(fā)現(xiàn)網(wǎng)易有道的英語口語AI練習(xí)功能相對較優(yōu),可以天馬行空隨意聊,科大訊飛的口語練習(xí)需要分情景板塊,不過,科大訊飛學(xué)習(xí)機(jī)可以在線答題,自動(dòng)批改,系統(tǒng)還會(huì)根據(jù)錯(cuò)題舉一反三給出題目。

一位三年級孩子的家長覺得孩子學(xué)習(xí)數(shù)學(xué)比較吃力,她更注重刷題和護(hù)眼。

AI還需要更可靠

日前,上海人工智能實(shí)驗(yàn)室發(fā)布了GPT-4o(美國人工智能研究公司OpenAI旗下的AI模型)和國內(nèi)幾款開源大模型的高考全卷評測結(jié)果,與語文、英語兩科動(dòng)輒上100分相比(滿分150),幾款大模型在數(shù)學(xué)考試的得分最高只有75分。

大模型偏弱的數(shù)學(xué)能力也限制了它在學(xué)習(xí)機(jī)的落地。

翟吉博說,大模型全稱是大語言模型,天生文本和語言理解能力較強(qiáng),落地比較快;但數(shù)學(xué)需要邏輯思維,且屬于天花板比較高的學(xué)科,應(yīng)用落地的速度相對慢一點(diǎn)。目前,大模型相關(guān)的數(shù)學(xué)功能的產(chǎn)品化還在嘗試中。

除此之外,有家長向經(jīng)濟(jì)觀察網(wǎng)反饋,在使用學(xué)習(xí)機(jī)的過程中,機(jī)器偶爾會(huì)出現(xiàn)錯(cuò)題重復(fù)收集的問題。在作業(yè)批改方面,學(xué)習(xí)機(jī)也時(shí)而會(huì)批改不精準(zhǔn),例如題目要求豎式計(jì)算,但孩子用豎式解答后,批改卻出現(xiàn)了問題。

學(xué)習(xí)機(jī)的作業(yè)批改功能可以通過采集孩子手寫答題的軌跡,對他們練習(xí)過程中的學(xué)習(xí)情況,在后臺(tái)進(jìn)行大數(shù)據(jù)分析和診斷。有用戶在出現(xiàn)批改錯(cuò)誤后詢問客服,客服回應(yīng)稱,這是因?yàn)闀鴮懖灰?guī)范而出現(xiàn)的小概率情況。

在洛圖科技分析師劉倩看來,當(dāng)前學(xué)習(xí)機(jī)用戶最主要的需求還是內(nèi)容資源,大模型的應(yīng)用是錦上添花。在學(xué)習(xí)機(jī)產(chǎn)品的后續(xù)發(fā)展中,AI技術(shù)的精準(zhǔn)度和可靠性還需要升級。

正如科大訊飛學(xué)習(xí)機(jī)在AI語伴功能中的提示一樣,“AI語伴偶爾會(huì)有天馬行空的想法,如果和你知道的不一樣,請不必當(dāng)真”。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電:【010-60910566-1260】。
TMT新聞部記者
長期關(guān)注并報(bào)道TMT(科技、游戲等)領(lǐng)域重大事件,擅長人物專訪、行業(yè)分析報(bào)道。
郵箱:chenqijie@eeo.com.cn 微信號:Q1191278317

熱新聞