劇情介紹
已故的科幻作家,寫出《2001太空漫游》的亞瑟·克拉克曾說過,任何足夠先進(jìn)的技術(shù),都極其類似于魔術(shù)。今天凌晨1點(diǎn),隨著gpt-4發(fā)布,人工智能又一次在人類面前變起了眼花繚亂的魔術(shù)。
對(duì)于gpt-4的發(fā)布,獵豹移動(dòng)董事長(zhǎng)兼ceo、獵戶星空董事長(zhǎng)傅盛第一時(shí)間分享了體驗(yàn)視頻,他表示:“gpt-4發(fā)布 世界要變了!每個(gè)人都要關(guān)心。”
上午,#gpt4做一個(gè)網(wǎng)站只要十秒#一度登上熱搜。有網(wǎng)友看完片段就感慨,首先干掉了程序員...也有網(wǎng)友精辟總結(jié),之前的gpt-3.5像個(gè)大學(xué)生,gpt-4活脫脫一個(gè)研究生。
下面,就用10個(gè)小片段,見證奇跡的發(fā)生。
1. 看圖說話,10秒生成一個(gè)網(wǎng)站
發(fā)布會(huì)上,openai總裁兼聯(lián)合創(chuàng)始人greg brockman在紙上畫了個(gè)粗糙的網(wǎng)站框架——真的只是用純手畫的方式,然后把草稿扔給gpt-4,告訴它我要做這么個(gè)網(wǎng)站,幫忙生成代碼。
10秒之后,代碼生成。
gpt-4看圖說話本領(lǐng)不止于此,它還具備一定的邏輯推理能力。
蹺蹺板一端放著球,一端吊著一雙拳擊手套,問手套掉下去會(huì)發(fā)生什么?
gpt-4:它會(huì)掉到木板上,并且球會(huì)被彈飛。
這張圖片有什么不尋常之處?
gpt-4:這張照片的不同尋常之處在于,一名男子正在行駛中的出租車車頂上的熨衣板上熨燙衣服。
我可以用這些原料做些什么?
gpt-4:華夫餅、松餅……
2. 考試能手,數(shù)學(xué)相當(dāng)于高二好學(xué)生水平
基于gpt-3.5的chatgpt,因?yàn)椴粫?huì)算術(shù)被小朋友笑話了好久。這次gpt-4在美國(guó)sat數(shù)學(xué)試題測(cè)試?yán)锬昧?00分,滿分是800分,排名前11%左右——sat的數(shù)學(xué)相當(dāng)于國(guó)內(nèi)高一、二水平,在閱讀寫作中拿下了710分的高分,排名前7%左右。
openai認(rèn)為,在各種專業(yè)和學(xué)術(shù)基準(zhǔn)上,gpt-4已經(jīng)和人類相當(dāng)! 比如,當(dāng)初gpt-3.5參加模擬律師考試,拿到的成績(jī)是倒數(shù)10%,gpt-4拿到了前10%的好成績(jī)。
為什么又是律師?
早在今年1月30日,美國(guó)哥倫比亞法院就使用chatgpt作為輔助工具,讓它幫忙檢索法庭文件,判斷“自閉癥未成年人是否可以免除為其治療支付費(fèi)用?”——大量律師實(shí)際上做的是閱讀卷宗、搜集證據(jù)、研究法律條款等案頭工作,這部分ai已經(jīng)有了壓倒性的優(yōu)勢(shì)。
3. 語(yǔ)言高手,中文準(zhǔn)確性進(jìn)一步提升
不僅是英語(yǔ),該模型在多種語(yǔ)言方面均表現(xiàn)出優(yōu)越性。openai稱,在測(cè)試的26種語(yǔ)言中,gpt-4在24種語(yǔ)言方面的表現(xiàn)均優(yōu)于gpt-3.5等其他大語(yǔ)言模型的英語(yǔ)語(yǔ)言性能。其中g(shù)pt-4的中文能夠達(dá)到80.1%的準(zhǔn)確性,而gpt-3.5的英文準(zhǔn)確性僅為70.1%,gpt-4英文準(zhǔn)確性提高到了85.5%。
4. 看得更多,能給代碼修bug
升級(jí)之后,gpt-4可接受的文字輸入長(zhǎng)度也增加約2.5萬(wàn)單詞,進(jìn)一步拓展了它的日常應(yīng)用場(chǎng)景。發(fā)布會(huì)上,gregman現(xiàn)場(chǎng)表演了一波用gpt-4修正代碼bug。只要小手一抖,把1萬(wàn)字的程序文檔扔給gpt-4。
又會(huì)寫代碼,又會(huì)抓bug,程序員也在瑟瑟發(fā)抖。
也因?yàn)槟堋翱吹酶唷?,基本上把大部分鏈接給到它都能讓它“劃重點(diǎn)”,對(duì)比只能分析一小段的gpt-3.5已經(jīng)是明顯進(jìn)步。
5. 看得更深,人類玩梗它也懂
請(qǐng)聽題:“大舅去二舅家找三舅說四舅被五舅騙去六舅家偷七舅放在八舅柜子里的九舅借十舅的發(fā)給十一舅的一千元。問:誰(shuí)是小偷,誰(shuí)是受害者?”
對(duì)于這種彎彎繞的題目,chatgpt并不擅長(zhǎng),但gpt-4具備了高級(jí)的推理能力。
這似乎也意味著,ai可以慢慢讀懂人類的冷幽默了。
比如,提問這張圖哪里好笑?
gpt-4會(huì)先講出每一格的內(nèi)容,然后總結(jié)出笑點(diǎn):用巨大的、過時(shí)的vga接口給小巧的現(xiàn)代智能手機(jī)充電。
呵呵。
6. 戲精上身,蘇格拉底和莎士比亞信手拈來(lái)
這次openai直接開放了gpt-4的api接口,還開放了一個(gè)小功能,允許修改“系統(tǒng)提示”。什么意思呢?之前chatgpt經(jīng)常會(huì)強(qiáng)調(diào),自己只是個(gè)語(yǔ)言模型,了解的知識(shí)截止于2021年9月?,F(xiàn)在,用戶可以賦予它性格,讓它扮演不同的角色。
比如,你告訴gpt-4它是一位總是以蘇格拉底風(fēng)格回應(yīng)的導(dǎo)師,它就會(huì)一路循循善誘,靈活使用“沒錯(cuò)”“好想法”“接近了”“非常棒”等態(tài)度積極的詞,讓你找到問題的答案。
它也可以扮演莎士比亞筆下的海盜,畫風(fēng)秒變?cè)缒甑摹白g制片”:做海盜還是不做海盜,這是個(gè)問題,但是,唉,親愛的,這是我目前的性格……在波濤洶涌的人生大海上,我永遠(yuǎn)不會(huì)放棄。
7. 從生產(chǎn)力到生產(chǎn)工具
gpt是個(gè)語(yǔ)言模型,英文全稱是generative pre-training,這個(gè)generative意思是“有生產(chǎn)力的”。這次配合gpt-4發(fā)布,openai也給出了一些將生產(chǎn)力轉(zhuǎn)化為生產(chǎn)工具的案例。
比如,在金融領(lǐng)域的摩根士丹利,旗下有個(gè)內(nèi)容庫(kù),包含數(shù)十萬(wàn)頁(yè)知識(shí),涵蓋投資策略、市場(chǎng)研究和評(píng)論以及分析師見解。大量的信息藏在網(wǎng)站和pdf里,借助gpt-4可以簡(jiǎn)化搜索,直達(dá)內(nèi)容。
比如,一款語(yǔ)言學(xué)習(xí)類的app duolingo,接入gpt-4后可進(jìn)行角色扮演,讓ai跟用戶對(duì)話,糾正語(yǔ)法錯(cuò)誤。
8. 繼續(xù)大力出奇跡
第一代gpt訓(xùn)練涉及的參數(shù)量為1.17億,到了gpt-3這個(gè)數(shù)字變成了1750億,擴(kuò)容了近1500倍。對(duì)應(yīng)的訓(xùn)練數(shù)據(jù)量,從5gb擴(kuò)到了45tb,近萬(wàn)倍的增長(zhǎng)。升級(jí)后的gpt-4參數(shù)量可能達(dá)到了100萬(wàn)億。
對(duì)應(yīng)的,微軟在3年前就為openai打造了一臺(tái)超級(jí)計(jì)算機(jī),據(jù)說里面有上萬(wàn)張英偉達(dá)a100芯片。另外,他們?cè)谧约?0多個(gè)云計(jì)算數(shù)據(jù)中心,部署了幾十萬(wàn)張gpu,用于chatgpt的推理。
9. 依然存在局限性,最好輔以人工審查
openai也坦言,gpt-4并不完全可靠,“gpt-4缺乏對(duì)2021年9月以后發(fā)生事件的了解,并且無(wú)法從中吸取經(jīng)驗(yàn)教訓(xùn)……它有時(shí)會(huì)出現(xiàn)簡(jiǎn)單的推理錯(cuò)誤,會(huì)輕信用戶明顯的虛假陳述,會(huì)像人類一樣在難題上失敗,例如在它生成的代碼中引入安全漏洞。”
程序員,“死緩”。
即便如此,他們?cè)诠緝?nèi)部的對(duì)抗性真實(shí)性評(píng)估中,gpt-4的得分比最新的gpt-3.5高40%,gpt-4回應(yīng)不允許的內(nèi)容的可能性降低了82%,更有可能產(chǎn)生事實(shí)性回應(yīng)的內(nèi)容,提高了40%。
openai提醒,用戶在使用語(yǔ)言模型時(shí)應(yīng)格外小心,最好輔助以人工審查、附加上下文、或完全避免在高風(fēng)險(xiǎn)情況下使用它。
既然給出了明確提醒,也就說明,已經(jīng)有大量人和行業(yè)都在將chatgpt用到具體的場(chǎng)景中去了。
10. 更加封閉的openai
在介紹gpt-4的98頁(yè)論文里,openai沒有披露他們的訓(xùn)練集內(nèi)容。
對(duì)此,作為聯(lián)合創(chuàng)始人之一,馬斯克多次表達(dá)了不滿:“openai最初是作為一家開源(這就是為什么我把它命名為「open」ai)的非營(yíng)利性公司而創(chuàng)建的,為了抗衡谷歌,但現(xiàn)在它已經(jīng)成一家閉源的營(yíng)利性公司,由微軟有效控制……這完全不是我的本意?!?/p> "
橙柿互動(dòng)記者 梁應(yīng)杰 編輯 童蔚