對(duì)話新加坡科研局黃佳:如何寫出一本AI技術(shù)暢銷書

陳奇杰2024-06-08 21:24

經(jīng)濟(jì)觀察網(wǎng) 記者 陳奇杰 截至2024年6月7日,黃佳寫的新書《大模型應(yīng)用開發(fā) 動(dòng)手做AI Agent》(下稱《動(dòng)手做AI Agent》)已經(jīng)連續(xù)18天位列京東人工智能圖書榜第一名,在發(fā)行不到三周的時(shí)間里印刷了三次,累計(jì)發(fā)行超過(guò)8000冊(cè)。

黃佳在新加坡科技研究局(Agency for Science, Technology and Reseach,下稱“新加坡科研局”)擔(dān)任主任科研工程師,這是新加坡最大的科研機(jī)構(gòu)。黃佳的主攻方向?yàn)樽匀徽Z(yǔ)言處理(NLP)預(yù)訓(xùn)練大模型應(yīng)用、機(jī)器持續(xù)學(xué)習(xí)技術(shù)等。

在《動(dòng)手做AI Agent》之前,黃佳已經(jīng)寫過(guò)多本技術(shù)圖書,其中,《零基礎(chǔ)學(xué)機(jī)器學(xué)習(xí)》《GPT圖解 大模型是怎樣構(gòu)建的》兩本AI領(lǐng)域的書籍發(fā)行量都超過(guò)13000冊(cè)。

黃佳這一次選擇AI Agent(人工智能智能體,下稱“Agent”)作為寫書題材。目前,Agent被視為大模型應(yīng)用落地的重要途徑,OpenAI(美國(guó)人工智能研究公司)、微軟、字節(jié)跳動(dòng)和百度等眾多公司都在這方面做了布局和探索。

在黃佳看來(lái),Agent以大模型為大腦,擁有思維能力,且通過(guò)工具和函數(shù)接口擁有執(zhí)行能力。未來(lái)隨著大語(yǔ)言模型、多模態(tài)學(xué)習(xí)等AI技術(shù)的進(jìn)一步突破,Agent的能力將大幅躍升。它有望勝任更加復(fù)雜的認(rèn)知和交互任務(wù),為用戶提供更加智能、個(gè)性化、沉浸式的服務(wù)。

但Agent的應(yīng)用還處于起步階段,在通用性、準(zhǔn)確性、交互體驗(yàn)等方面還有很大提升空間。黃佳希望,《動(dòng)手做AI Agent》能成為讀者了解和探討Agent技術(shù)的起點(diǎn)。

寫書也是學(xué)習(xí)

2001年,黃佳從北京師范大學(xué)本科畢業(yè),隨后赴新加坡南洋理工大學(xué)就讀碩士,從此在新加坡定居。碩士畢業(yè)后,黃佳有十幾年的時(shí)間都在知名咨詢公司埃森哲從事SAP(企業(yè)管理系列軟件)系統(tǒng)的設(shè)計(jì)、二次開發(fā)和實(shí)施。

后來(lái)黃佳發(fā)現(xiàn),很多企業(yè)客戶慢慢地不滿足于傳統(tǒng)的供銷存、財(cái)務(wù)、人力資源管理系統(tǒng),而是希望在他們的系統(tǒng)中加入一些AI相關(guān)技術(shù),以增加附加價(jià)值。這使得他的目光逐漸轉(zhuǎn)向AI領(lǐng)域。

大約六年前,黃佳開始進(jìn)入機(jī)器學(xué)習(xí)和AI領(lǐng)域,通過(guò)自學(xué)和參加課程積累到足夠知識(shí)后,他離開埃森哲,加入了新加坡科研局,致力于研究如何將AI科技應(yīng)用于企業(yè)和日常生活。

黃佳崇尚費(fèi)曼學(xué)習(xí)法,在學(xué)習(xí)過(guò)程中,不僅想著自己學(xué),還想著如何輸出,這對(duì)內(nèi)化知識(shí)非常有好處。

黃佳會(huì)詳細(xì)記錄下學(xué)習(xí)過(guò)程和遇到的難點(diǎn)、坑點(diǎn),以及問(wèn)題的解決方式。這為他的寫作積累了素材。

除此之外,有讀者告訴黃佳,從他的書里學(xué)習(xí)到了更系統(tǒng)性的知識(shí),可以說(shuō)是“既見樹木,也見森林”,這些反饋都給了黃佳寫書的動(dòng)力。

從事SAP領(lǐng)域時(shí),黃佳就有寫書的愛好。投身AI行業(yè)后,這一堅(jiān)持仍未改變。他的效率也不慢,雖然只在工作之余寫作,但通常一本新書半年到一年就能夠?qū)懲辍4竽P蜁r(shí)代,黃佳也會(huì)使用AI協(xié)助處理文字工作,這提高了他的效率。

創(chuàng)作思路

《動(dòng)手做AI Agent》在眾多技術(shù)圖書中表現(xiàn)優(yōu)秀,目前市面上還沒(méi)有同類型書籍。負(fù)責(zé)出版這本書的人民郵電出版社編輯秦健說(shuō),從實(shí)際銷量、技術(shù)的先進(jìn)性、渠道流量和作者知名度等多個(gè)方面評(píng)判,這本書已經(jīng)達(dá)到暢銷書標(biāo)準(zhǔn)。

從結(jié)構(gòu)看,《動(dòng)手做AI Agent》主要包含三部分:第一是從技術(shù)和工具層面闡釋Agent設(shè)計(jì)的框架、功能和方法;第二是通過(guò)自動(dòng)化辦公的實(shí)現(xiàn)、推理與行動(dòng)的協(xié)同、知識(shí)的提取與整合等7個(gè)實(shí)操項(xiàng)目,帶領(lǐng)讀者學(xué)習(xí)前沿的Agent實(shí)現(xiàn)技術(shù);第三是介紹科研論文中Agent技術(shù)的進(jìn)展,提供技術(shù)發(fā)展的全面視角。

在埃森哲做咨詢服務(wù)和在新加坡科研局工作期間,黃佳接觸了能源、物流、金融等各行業(yè)的公司,也了解許多企業(yè)的共性需求,這讓他能選取更通用的實(shí)操項(xiàng)目。

例如,由于有大量文檔和資料分布在各個(gè)網(wǎng)站、HR的抽屜等不同區(qū)域,許多企業(yè)都需要文件檢索系統(tǒng)。對(duì)此,黃佳在《動(dòng)手做AI Agent》中加入了使用Llama Index數(shù)據(jù)框架,實(shí)現(xiàn)檢索增強(qiáng)生成Agent的實(shí)操案例。

過(guò)去,黃佳寫的一系列SAP技術(shù)著作只是講解技術(shù),顯得很干癟。2020年,在寫《零基礎(chǔ)學(xué)機(jī)器學(xué)習(xí)》時(shí),黃佳受到了一本以漫畫風(fēng)形式呈現(xiàn)的技術(shù)圖書的啟發(fā),開始在創(chuàng)作中引入采用圖畫和對(duì)話等形式,以求兼顧技術(shù)性和可讀性。

具體而言,黃佳在書里會(huì)添加一位老師咖哥和兩位學(xué)生小冰、小雪。通過(guò)對(duì)話和答疑解惑的方式,咖哥會(huì)講解機(jī)器學(xué)習(xí)、GPT(生成式預(yù)訓(xùn)練模型)和Agent等概念。在黃佳看來(lái),這種形式能讓讀者更輕松地了解書中的知識(shí)。

本碩畢業(yè)于北京大學(xué)的汪楊,正在籌備設(shè)立一家智能體產(chǎn)品公司腦仁智能,是Agent領(lǐng)域的創(chuàng)業(yè)者。在看完《動(dòng)手做AI Agent》后,他覺得這本書深入淺出地講解了Agent技術(shù),可以算是目前市面上把相關(guān)技術(shù)理論和框架講得最清楚的書。不過(guò),由于篇幅所限,有的地方還不夠豐富,例如書中提到的幾個(gè)工具都只是講了一些框架和案例,讀者真正要自行開發(fā)的時(shí)候,還需要閱讀一些文檔和參考資料才可以。

還稍顯不足的是,有讀者指出,調(diào)用OpenAI的API(應(yīng)用程序編程接口)有難度,《動(dòng)手做AI Agent》作為面向國(guó)內(nèi)的書籍,應(yīng)該以國(guó)內(nèi)大模型來(lái)完善一些示例。黃佳說(shuō),這是很好的建議,目前國(guó)內(nèi)大模型行業(yè)風(fēng)起云涌,廠商的大模型能力也越來(lái)越強(qiáng),未來(lái)會(huì)補(bǔ)充加入這部分內(nèi)容。

Agent還在起步階段

新加坡科研局一直倡導(dǎo)在純科研項(xiàng)目的同時(shí),加強(qiáng)與企業(yè)的合作項(xiàng)目。近兩年,由于大模型的爆火,越來(lái)越多的企業(yè)與新加坡科研局溝通,希望能將大模型能力嵌入到企業(yè)工作和產(chǎn)品的各方面。由此,新加坡科研局和企業(yè)合作的AI應(yīng)用落地項(xiàng)目比重增加了不少。

在受邀回中國(guó)參加一些論壇和會(huì)議的過(guò)程中,黃佳也觀察到,因?yàn)橛凶銐虻娜瞬?、市?chǎng)和體量去進(jìn)行各種探索,國(guó)內(nèi)AI應(yīng)用落地的進(jìn)展較快。

Agent被中金研究認(rèn)為是連接大模型和現(xiàn)實(shí)世界的“最后一公里”。根據(jù)黃佳講解的Agent構(gòu)建流程,開發(fā)者需要先為Agent設(shè)計(jì)提示詞,使Agent能夠擁有這樣一種“思維方式”:在執(zhí)行任務(wù)時(shí),先分成幾個(gè)子任務(wù),然后按部就班地執(zhí)行每個(gè)子任務(wù)。這種系統(tǒng)化的提示詞配置,使得用戶可以通過(guò)Agent更清晰明確地調(diào)用大模型能力。接著開發(fā)者需要為Agent配備一系列的工具和函數(shù),這將使Agent不僅能說(shuō)話、輸出文字,也能幫助用戶執(zhí)行具體操作。

目前,Agent已經(jīng)開始在客服、助手、問(wèn)答、任務(wù)引導(dǎo)等領(lǐng)域得到應(yīng)用,例如OpenAI的Assistants(助手)、微軟的AI助手MicroSoft Copliot和字節(jié)的Coze助手等。一些企業(yè)也開發(fā)了行業(yè)定制的Agent,服務(wù)于特定場(chǎng)景。

5月30日,在2024百度移動(dòng)生態(tài)萬(wàn)象大會(huì)上,百度集團(tuán)資深副總裁、百度移動(dòng)生態(tài)事業(yè)群組總經(jīng)理何俊杰曾說(shuō),基于強(qiáng)大的基礎(chǔ)模型,智能體可以批量生成,應(yīng)用在各種各樣的場(chǎng)景。文心智能體平臺(tái)已有超16萬(wàn)名開發(fā)者和超5萬(wàn)家企業(yè)入駐,上面既有文案專家、讀書專家、企業(yè)培訓(xùn)執(zhí)行專員這樣由個(gè)人開發(fā)的小而美的智能體,也有OPPO公司、新加坡旅游局這類企業(yè)、機(jī)構(gòu)開發(fā)的智能體。

不過(guò),總體而言,Agent技術(shù)還處于起步階段。

黃佳稱,Agent開發(fā)目前還沒(méi)有統(tǒng)一的規(guī)范和開發(fā)生態(tài),不像開發(fā)APP(應(yīng)用程序)那樣簡(jiǎn)單,APP開發(fā)有統(tǒng)一的平臺(tái),比如蘋果操作系統(tǒng)iOS和安卓操作系統(tǒng)Android,開發(fā)者可以在這些平臺(tái)上構(gòu)建和發(fā)布應(yīng)用。另外,Agent需要嵌入到每一個(gè)具體的場(chǎng)景中解決實(shí)際問(wèn)題,這些問(wèn)題通常具有獨(dú)特的上下文和需求。不同的應(yīng)用場(chǎng)景下,用戶的需求和期望是不同的。

商業(yè)模式方面,黃佳說(shuō),Agent技術(shù)尚未帶來(lái)公認(rèn)已經(jīng)落地的、顛覆性的商業(yè)應(yīng)用模式。國(guó)家也還需要發(fā)布一系列規(guī)范,不能讓Agent可以隨便做任何事。這種結(jié)構(gòu)性的變化會(huì)更進(jìn)一步方便我們的生活,但需要漫長(zhǎng)的過(guò)程。

在技術(shù)上,大模型仍存在準(zhǔn)確性的問(wèn)題。黃佳說(shuō),大模型本質(zhì)上是一個(gè)智能體,而不是我們熟知的邏輯計(jì)算。因此,我們只能參考它返回的結(jié)果,而不能將其作為最終決策的依據(jù)。他舉例,銀行、醫(yī)療等領(lǐng)域都需要零出錯(cuò),即使準(zhǔn)確率高達(dá)99.9%也不行,這是目前大模型落地應(yīng)用的一個(gè)致命問(wèn)題。

版權(quán)聲明:以上內(nèi)容為《經(jīng)濟(jì)觀察報(bào)》社原創(chuàng)作品,版權(quán)歸《經(jīng)濟(jì)觀察報(bào)》社所有。未經(jīng)《經(jīng)濟(jì)觀察報(bào)》社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,否則將依法追究相關(guān)行為主體的法律責(zé)任。版權(quán)合作請(qǐng)致電:【010-60910566-1260】。
TMT新聞部記者
長(zhǎng)期關(guān)注并報(bào)道TMT(科技、游戲等)領(lǐng)域重大事件,擅長(zhǎng)人物專訪、行業(yè)分析報(bào)道。
郵箱:chenqijie@eeo.com.cn 微信號(hào):Q1191278317

熱新聞