學(xué)習(xí)機(jī)開卷大模型，AI還需要更可靠

陳奇杰2024-06-26 21:31

經(jīng)濟(jì)觀察網(wǎng) 記者陳奇杰 自去年5月科大訊飛首次在學(xué)習(xí)機(jī)中搭載大模型以來，小度、小猿、學(xué)而思和作業(yè)幫等主流學(xué)習(xí)機(jī)品牌紛紛將自家的大模型與學(xué)習(xí)機(jī)產(chǎn)品結(jié)合。近日，松鼠AI和讀書郎兩家學(xué)習(xí)機(jī)品牌，也相繼推出結(jié)合了大模型技術(shù)的學(xué)習(xí)機(jī)新品。

“大模型將成為未來AI學(xué)習(xí)機(jī)競爭的主戰(zhàn)場，也將成為學(xué)習(xí)機(jī)發(fā)展的分水嶺。”科大訊飛副總裁章繼東接受經(jīng)濟(jì)觀察網(wǎng)采訪時(shí)直言。

章繼東的這一判斷或許可以解釋為什么各家的學(xué)習(xí)機(jī)開卷大模型。不過，受大模型能力的限制，目前的AI學(xué)習(xí)機(jī)產(chǎn)品表現(xiàn)仍有不足，例如在語文、英語這類語言學(xué)科上表現(xiàn)較好，在數(shù)學(xué)方面，大模型相關(guān)功能的產(chǎn)品化還需要時(shí)間。

大模型帶來了什么

洛圖科技數(shù)據(jù)顯示，中國學(xué)習(xí)機(jī)市場2023年全渠道銷量為472.1萬臺(tái)，同比增長8.1%。

學(xué)習(xí)機(jī)主要解決學(xué)習(xí)資源、預(yù)習(xí)和復(fù)習(xí)，以及個(gè)性化學(xué)習(xí)等方面的需求。與普通的平板電腦相比，學(xué)習(xí)機(jī)廠商通常還會(huì)使用更護(hù)眼的屏幕。

2019年，科大訊飛推出面向C端（個(gè)人用戶端）的人工智能學(xué)習(xí)機(jī)，探索AI技術(shù)在學(xué)生個(gè)性化精準(zhǔn)學(xué)習(xí)、英語口語練習(xí)、作文批改等場景的應(yīng)用。

科大訊飛學(xué)習(xí)機(jī)產(chǎn)品線總經(jīng)理翟吉博介紹，科大訊飛會(huì)和相關(guān)教育部門合作，采用機(jī)器學(xué)習(xí)技術(shù)，記錄一些大規(guī)?？荚嚨淖魑脑u分標(biāo)準(zhǔn)以及閱卷老師的批改評分。因此，模型可以通過分析過往數(shù)據(jù)，進(jìn)行評分質(zhì)量檢測，識別出教師評分中的異常情況。

這類沉淀下來的底層技術(shù)被科大訊飛復(fù)用在AI學(xué)習(xí)機(jī)上，只是因?yàn)槭鼙姴煌诮换シ绞胶蛻?yīng)用形態(tài)與面向B端（企業(yè)用戶端）的產(chǎn)品有差異。

2023年5月，科大訊飛將大模型技術(shù)與學(xué)習(xí)機(jī)結(jié)合，這為產(chǎn)品帶來了新的變化：學(xué)習(xí)機(jī)不再僅給出做題的過程和答案，還會(huì)通過詢問孩子在解題過程中的思路和疑惑，給予一定的輔導(dǎo)支持；在作文批改方面，之前學(xué)習(xí)機(jī)一般只能做到批改字、詞、句的錯(cuò)誤，現(xiàn)在還能根據(jù)章節(jié)寫作要求，給出針對性的寫作建議和優(yōu)化參考。

各有賣點(diǎn)的廠商

目前，國內(nèi)的學(xué)習(xí)機(jī)廠商大致分為三個(gè)陣營：以讀書郎、步步高等為代表的傳統(tǒng)教育硬件企業(yè)；以學(xué)而思、作業(yè)幫、猿輔導(dǎo)等為代表的轉(zhuǎn)型期教培企業(yè)；以小度、科大訊飛為代表的科技型企業(yè)。

頭部學(xué)習(xí)機(jī)廠商的競爭較為激烈，市場份額差距并不大。根據(jù)洛圖科技數(shù)據(jù)，2024年一季度，國內(nèi)學(xué)習(xí)平板線上銷量前五的品牌分別是學(xué)而思、小度、小猿、作業(yè)幫和科大訊飛，份額分別為14.2%、13.5%、12.2%、10%和10%。

這些學(xué)習(xí)機(jī)廠商基本都有對應(yīng)的AI大模型，如學(xué)而思的九章大模型、小度的文心大模型、作業(yè)幫的銀河大模型、小猿的看云大模型和科大訊飛的訊飛星火大模型等。學(xué)習(xí)機(jī)AI功能的落地場景也相似，主要包括AI精準(zhǔn)學(xué)、口語陪練、作業(yè)批改、作文批改、數(shù)學(xué)互動(dòng)輔導(dǎo)等。

經(jīng)濟(jì)觀察網(wǎng)記者走訪多家學(xué)習(xí)機(jī)門店發(fā)現(xiàn)，銷售人員不一定了解大模型技術(shù)，但大多會(huì)主動(dòng)向客人介紹學(xué)習(xí)機(jī)的精準(zhǔn)學(xué)、作文批改和英語口語互動(dòng)練習(xí)等AI功能。其中，AI精準(zhǔn)學(xué)可以讓孩子做題測出知識薄弱項(xiàng)，并推送相應(yīng)的學(xué)習(xí)內(nèi)容、舉一反三給出練習(xí)題，讓孩子針對性地訓(xùn)練，較受到家長青睞。

在具體的產(chǎn)品選擇上，不同的家長關(guān)注點(diǎn)相差較大。

一位初中生家長說，她發(fā)現(xiàn)網(wǎng)易有道的英語口語AI練習(xí)功能相對較優(yōu)，可以天馬行空隨意聊，科大訊飛的口語練習(xí)需要分情景板塊，不過，科大訊飛學(xué)習(xí)機(jī)可以在線答題，自動(dòng)批改，系統(tǒng)還會(huì)根據(jù)錯(cuò)題舉一反三給出題目。

一位三年級孩子的家長覺得孩子學(xué)習(xí)數(shù)學(xué)比較吃力，她更注重刷題和護(hù)眼。

AI還需要更可靠

日前，上海人工智能實(shí)驗(yàn)室發(fā)布了GPT-4o（美國人工智能研究公司OpenAI旗下的AI模型）和國內(nèi)幾款開源大模型的高考全卷評測結(jié)果，與語文、英語兩科動(dòng)輒上100分相比（滿分150），幾款大模型在數(shù)學(xué)考試的得分最高只有75分。

大模型偏弱的數(shù)學(xué)能力也限制了它在學(xué)習(xí)機(jī)的落地。

翟吉博說，大模型全稱是大語言模型，天生文本和語言理解能力較強(qiáng)，落地比較快；但數(shù)學(xué)需要邏輯思維，且屬于天花板比較高的學(xué)科，應(yīng)用落地的速度相對慢一點(diǎn)。目前，大模型相關(guān)的數(shù)學(xué)功能的產(chǎn)品化還在嘗試中。

除此之外，有家長向經(jīng)濟(jì)觀察網(wǎng)反饋，在使用學(xué)習(xí)機(jī)的過程中，機(jī)器偶爾會(huì)出現(xiàn)錯(cuò)題重復(fù)收集的問題。在作業(yè)批改方面，學(xué)習(xí)機(jī)也時(shí)而會(huì)批改不精準(zhǔn)，例如題目要求豎式計(jì)算，但孩子用豎式解答后，批改卻出現(xiàn)了問題。

學(xué)習(xí)機(jī)的作業(yè)批改功能可以通過采集孩子手寫答題的軌跡，對他們練習(xí)過程中的學(xué)習(xí)情況，在后臺(tái)進(jìn)行大數(shù)據(jù)分析和診斷。有用戶在出現(xiàn)批改錯(cuò)誤后詢問客服，客服回應(yīng)稱，這是因?yàn)闀鴮懖灰?guī)范而出現(xiàn)的小概率情況。

在洛圖科技分析師劉倩看來，當(dāng)前學(xué)習(xí)機(jī)用戶最主要的需求還是內(nèi)容資源，大模型的應(yīng)用是錦上添花。在學(xué)習(xí)機(jī)產(chǎn)品的后續(xù)發(fā)展中，AI技術(shù)的精準(zhǔn)度和可靠性還需要升級。

正如科大訊飛學(xué)習(xí)機(jī)在AI語伴功能中的提示一樣，“AI語伴偶爾會(huì)有天馬行空的想法，如果和你知道的不一樣，請不必當(dāng)真”。

版權(quán)聲明：以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品，版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請致電：【010-60910566-1260】。