AI幫我“復(fù)活”了家人

趙一帆ZYF2024-03-11 07:46

在商湯科技2024年的年會(huì)上,一場特別的“重逢”觸動(dòng)了無數(shù)人的心弦。

這家公司的已故創(chuàng)始人湯曉鷗,以數(shù)字人的形式變身為“脫口秀大師”。在近十分鐘的表演中,他能說能笑,能喝水,還能和觀眾互動(dòng)打趣。不僅是他的神情樣貌,連他獨(dú)有的“湯氏”喜劇風(fēng)格也盡數(shù)還原。

這位在人工智能領(lǐng)域有著深遠(yuǎn)影響的科學(xué)家,以如此栩栩如生的形象再次回到公眾視野,不僅和員工們來了一場跨越時(shí)空的重逢,也引發(fā)了外界對AI“復(fù)活”這項(xiàng)技術(shù)的關(guān)注。

湯曉鷗的數(shù)字人。圖源:商湯

用AI“復(fù)活”逝者并非新話題,早在去年海外已有相關(guān)網(wǎng)站提供類似功能。只要填寫逝者的姓名、年齡等個(gè)人信息,以及生活片段描述,就能和AI模擬出的逝者對話。

近日,知名音樂人包小柏也用AI“復(fù)活”了他的女兒,實(shí)現(xiàn)了一家三口一起唱生日歌。

還有很多人也希望依靠迅速進(jìn)化的AI技術(shù)讓家人短暫“復(fù)活”。

“我的兒子因?yàn)橐馔馊ナ懒?,最近我愛人的生日快到了,能不能用AI讓他給他媽媽再過一次生日?”

“家里的老人年前走了,能不能用AI技術(shù)復(fù)活她,讓她給孩子們說上一段春節(jié)祝福語?”

這是阿亮最近經(jīng)常會(huì)接到的來自客戶的需求,他在一些社交媒體平臺出售AI“復(fù)活”親屬的服務(wù)。

生成式AI的爆發(fā),不僅開啟了全球新一輪科技創(chuàng)新周期,也讓“AI數(shù)字永生”這門小生意找到了生存空間。

實(shí)現(xiàn)“AI數(shù)字永生”,主要在于三項(xiàng)關(guān)鍵技術(shù):文生圖軟件、語音合成系統(tǒng)、數(shù)字人生成技術(shù)。

頭像制作是第一步。商家一般使用Midjourney等主流AI繪畫軟件生成逝者的虛擬頭像,并不斷輸入提示詞以細(xì)化五官甚至皺紋等面部特征。接著將經(jīng)過降噪、人聲增強(qiáng)等處理的錄音放入語音合成系統(tǒng)中,軟件便可任意輸出想要的語音內(nèi)容。

最關(guān)鍵的一步則是生成數(shù)字人。只需在D-ID等擬真人視頻生成軟件上傳制作好的語音和頭像,便可和與真人性格、樣貌等極為相似的逝者展開面對面般的對話。

“有定制需求的人太多太多了,每一個(gè)需求的背后都是一個(gè)悲傷或感人的故事。”“超級頭腦”團(tuán)隊(duì)創(chuàng)始人張澤偉表示?!俺夘^腦”是國內(nèi)最早一批推出這類產(chǎn)品的小型團(tuán)隊(duì)。

“復(fù)活”訂單有很多種,目前已從“數(shù)字人形象”“定制音色”等較為常見的產(chǎn)品,發(fā)展到了“數(shù)字遺照”“AI療愈”等更專業(yè)的個(gè)性化定制服務(wù)。

其中,“數(shù)字遺照”指的是基于AI技術(shù)制作的真人數(shù)字照片,除了克隆相關(guān)人物的形象和聲音,底層還搭載大語言模型,可進(jìn)行實(shí)時(shí)交流。而“AI療愈”則是在完成人物克隆后,由真人或?qū)I(yè)心理咨詢師“換”上該形象,與客戶進(jìn)行視頻聊天。

產(chǎn)品可按機(jī)器驅(qū)動(dòng)和人為驅(qū)動(dòng)來分類。機(jī)器驅(qū)動(dòng)的純文字回復(fù)價(jià)格多為每兩周100元,成交量最高的AI數(shù)字分身視頻要價(jià)298元。而需要真人支持的“AI療愈”類產(chǎn)品售價(jià)每次也要幾百元,高達(dá)上萬元的產(chǎn)品則會(huì)完整克隆人的樣貌、聲音、思維三個(gè)部分。 定價(jià)高低主要取決于用戶對數(shù)字人呈現(xiàn)效果的要求。

張澤偉最初免費(fèi)幫別人提供類似服務(wù),但之后找上門的需求越來越多,為了讓團(tuán)隊(duì)活下去才開始推出收費(fèi)產(chǎn)品。

圖源:公眾號“福心云”

與其他AI應(yīng)用一樣,用AI來完成“復(fù)活”也需要承擔(dān)算力、硬件、人力和營銷等等高額成本。這當(dāng)中,人力和算力成本是最大的。

“前期一直都在虧本?!睆垵蓚フf。

據(jù)界面新聞了解,“超級頭腦”團(tuán)隊(duì)花了至少半年才扭虧為盈。為了節(jié)省高額的人力成本,5名核心成員都同意不拿工資。但即便如此,每月僅算力成本至少也要10萬元。

從大廠離職創(chuàng)業(yè)的阿亮也遇到了同樣的問題,拋開人力成本,自去年11月以來,他已經(jīng)投入了近10萬元,直到現(xiàn)在仍在虧本運(yùn)營。

除了算力成本,用戶所付的費(fèi)用中還包括制作數(shù)字人的時(shí)間成本。

通常委托人需要向商家提供一張高清照片、30s左右的聲音或視頻文件,素材越豐富,數(shù)字人和真人的樣貌、聲音的相似度就越高。如果算上前期溝通加后期制作,平均一單需要7到10天才能完成。

據(jù)張澤偉透露,目前其所在團(tuán)隊(duì)已經(jīng)做了600多單,有上千名客戶來咨詢過相關(guān)情況。

但他們并非“來者不拒”。由于很多老人或突然離世的人并未留下符合條件的視頻資料,又或者是數(shù)據(jù)不全、照片模糊等,很難復(fù)刻出讓人滿意的數(shù)字親屬。

與用戶溝通需要占據(jù)相當(dāng)多的精力,這背后有防范委托人拿數(shù)字人去做一些不法之事的考量。目前多數(shù)商家的做法是,明確了解委托人的訴求、與克隆人的關(guān)系,以及后續(xù)如何使用,避免產(chǎn)品被用于任何違法違規(guī)的途徑。

以聲音克隆為例,商家會(huì)要求委托人先發(fā)送一段文字,再從聲音克隆模型中輸出一段語音文件。這也意味著,商家可以提前對文字內(nèi)容進(jìn)行甄別。

受制于法律風(fēng)險(xiǎn)、心理障礙等多重因素,目前“AI復(fù)活親屬”仍面臨諸多爭議,業(yè)界也多是處于謹(jǐn)慎探索階段。

天元律師事務(wù)所合伙人李昀鍇表示,“相較于數(shù)字人,AI復(fù)活逝者這一領(lǐng)域的問題更為復(fù)雜?!?/p>

他解釋稱,在法律上“復(fù)活”逝者的權(quán)利由近親屬共同所有,這也意味著缺少近親屬的共同決定,這種“復(fù)活”是未經(jīng)許可并且有較大侵權(quán)嫌疑的。一旦將逝者形象用于詐騙等非法目的或因管理不當(dāng)造成其他損害事件,還可能觸犯刑事責(zé)任。

盡管數(shù)字復(fù)活在技術(shù)上具有可行性,但心理和倫理上還存在多重障礙。這也在考驗(yàn)著從業(yè)者,如何在遵從親屬意愿和維護(hù)逝者尊嚴(yán)的前提下,提供一種既能慰藉人心又能被廣泛接受的產(chǎn)品形式。

“據(jù)我所知,過去一年國內(nèi)買過相關(guān)付費(fèi)服務(wù)的不超過一萬人。”阿亮認(rèn)為,盡管“復(fù)活”親人實(shí)現(xiàn)了不同空間生命的延續(xù),但現(xiàn)階段大部分人在心理上很難立刻接受這項(xiàng)技術(shù)。

這一行業(yè)目前仍處于早期萌芽階段,既無相關(guān)監(jiān)管條例,也缺少行業(yè)標(biāo)準(zhǔn)?!皬?fù)活”逝者在給親屬提供情感慰藉的同時(shí),還面臨著數(shù)據(jù)收集和處理的挑戰(zhàn)。如何在技術(shù)進(jìn)步和用戶隱私保護(hù)之間找到平衡,將成為該商業(yè)模式能否進(jìn)一步壯大的關(guān)鍵課題。

不過,這項(xiàng)技術(shù)所帶來的社會(huì)價(jià)值和意義值得被重視,它不僅實(shí)現(xiàn)了人類數(shù)字意義上的“永生”,也讓人們有了更多向逝者認(rèn)真道別的機(jī)會(huì)。

再見,不再意味著“永不相見”。

轉(zhuǎn)載來源:界面新聞 作者:趙一帆ZYF

版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【趙一帆ZYF】所有。本App為發(fā)布者提供信息發(fā)布平臺服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞