“我知道(大模型)未來一定會興起,要早一點做準(zhǔn)備,否則就來不及了。”
圖片來源|受訪者
創(chuàng)業(yè)之前,瀾舟科技創(chuàng)始人兼CEO周明在微軟亞洲研究院已經(jīng)領(lǐng)導(dǎo)團隊做了3年多的大模型。“微軟跟OpenAI有合作,我們團隊也跟他們有一些接觸,拿他們的GPT-2做一些實驗。”2020年,周明辭去了微軟亞洲研究院副院長的職位,離開了工作21年的微軟,準(zhǔn)備創(chuàng)業(yè)。“我知道(大模型)未來一定會興起,要早一點做準(zhǔn)備,否則就來不及了!這個決定并沒有獲得所有人的認(rèn)同,有人勸周明,“你折騰這干什么?”很多朋友也被他的堅持所打動,選擇“能幫就幫一下”。“要不看起來我苦哈哈的!敝苊餍ΨQ。有了創(chuàng)業(yè)的打算后,周明第一時間找到了李開復(fù)。1999年,李開復(fù)把周明從清華招聘到微軟亞洲研究院。李開復(fù)對周明的創(chuàng)業(yè)想法表示大力支持。他首先聘請周明加入創(chuàng)新工場擔(dān)任首席科學(xué)家,熟悉創(chuàng)業(yè)環(huán)境,一點點開始孵化一個NLP(自然語言處理)團隊。“開復(fù)給我提供了很多幫助,包括團隊方向、找人和融資等方面都給予了大力幫助。我們創(chuàng)業(yè)到今天還算走得順利,在很多關(guān)鍵節(jié)點上開復(fù)和創(chuàng)新工場都給予了支持!2021年6月,周明創(chuàng)辦了瀾舟科技,沿著AI的NLP方向創(chuàng)業(yè)。他領(lǐng)導(dǎo)團隊研發(fā)的“孟子預(yù)訓(xùn)練模型”,打造了搜索、生成、翻譯、對話等一系列功能引擎和垂直場景應(yīng)用。2021年,“孟子”模型以10億參數(shù),登頂中文語言理解權(quán)威評測基準(zhǔn)CLUE;孟子新一代認(rèn)知服務(wù)引擎在HICOOL 2021全球創(chuàng)業(yè)大賽中榮獲一等獎暨人工智能和金融賽道第一名。4月底在接受《中國企業(yè)家》專訪時,周明表示,他們最近又新推出了孟子GPT大模型,面向To B領(lǐng)域,服務(wù)企業(yè)典型場景,幫助企業(yè)降本提效。
2022年11月30日,ChatGPT的公布讓我眼前一亮。過去,我覺得大模型是未來,但沒有想到它這么快進入普通人的視線。大家都可以用(ChatGPT),而且效果如此之好,這令我非常吃驚。于是,從去年12月起,我們開始行動。為了“搶跑”,我們克服困難,馬上準(zhǔn)備算力、搜集和清洗數(shù)據(jù)等工作,然后開始訓(xùn)練模型。在花費巨大努力后,我們終于訓(xùn)練出一個有多輪對話問答能力的模型 (孟子GPT模型)。現(xiàn)在回看,我們算國內(nèi)最早動起來的團隊之一,因為我們過去兩年來通過孟子模型積累了算法、工程、數(shù)據(jù)等各方面的能力,所以動起來相對比較快。從1985年開始,我就一直從事自然語言的研究,經(jīng)歷過NLP的規(guī)則系統(tǒng)、統(tǒng)計模型、深度學(xué)習(xí)模型等各個時代。2017年谷歌推出Transformer的時候,我們在微軟亞洲研究院也馬上做了一些大模型的嘗試,包括融合了BERT和GPT的優(yōu)點的統(tǒng)一的預(yù)訓(xùn)練模型(UNILM)。在這過程中,我逐漸覺得大模型將是自然語言和人工智能的未來。到了2020年,我有了創(chuàng)業(yè)的打算,我的設(shè)想是做一個特別好用的大模型,各行各業(yè)都可以即插即用,從而提高生產(chǎn)能力,所以孵化了瀾舟團隊。此后兩年里,我們的團隊就一直在做大模型。但過程并不是一帆風(fēng)順的。一開始,我們想著煉一個大模型,但是發(fā)現(xiàn)代價很大。我后來仔細(xì)研究To B和To C的細(xì)分,認(rèn)真分析了在這兩條賽道上發(fā)展的優(yōu)劣,發(fā)現(xiàn)創(chuàng)業(yè)公司在To C業(yè)務(wù)上,跟大公司相比沒有競爭優(yōu)勢,所以我決定優(yōu)先發(fā)展to B業(yè)務(wù)。后來我走訪了很多客戶,客戶考慮到成本因素,建議我盡可能把模型輕量化。我們當(dāng)時考慮的是做To B業(yè)務(wù),一旦拿到單子,企業(yè)就有了現(xiàn)金流,對增強團隊信心有很大幫助。所以我決定應(yīng)該先在B端煉輕量化模型。發(fā)展起來后,可考慮用To C的方式來獲客。瀾舟現(xiàn)在的發(fā)展路線也是如此,主要做To B企業(yè)服務(wù),將模型嘗試應(yīng)用在很多領(lǐng)域,如金融行業(yè)、網(wǎng)文娛樂、營銷廣告等。企業(yè)服務(wù)做好之后我們就有現(xiàn)金流回來,從而將技術(shù)打磨得更好,實現(xiàn)滾動式發(fā)展。此外,我們也做了像翻譯、文本生成、小說生成等To C業(yè)務(wù)借以獲客。雖然用戶付費意愿比較低,但如果有用戶喜歡,能夠幫助推廣產(chǎn)品品牌或轉(zhuǎn)換付費,形成傳播/流量效應(yīng)后,帶來To B的合作客戶。在過去兩年工作基礎(chǔ)上,我們今年主要任務(wù)是,抓緊研究ChatGPT代表的新范式,用更多的數(shù)據(jù)、更大的模型,做出類ChatGPT模型(孟子GPT大模型),它不僅可以進行多輪對話、回答問題,也能把AI1.0的單功能引擎如翻譯、搜索、信息抽取等無縫連接起來。我們有充足的儲備去支持這些工作。今年2月份,新一輪的融資已經(jīng)到賬,我們會把大部分資金用在算力、數(shù)據(jù)以及人才上,將To B模型做好,并獲得收入,從而實現(xiàn)正循環(huán)。我向往“兩條腿走路”,一方面煉模型,一方面用模型,兩者構(gòu)成反饋鏈,加速各自能力的提升,打造一個創(chuàng)新閉環(huán)。
2.做好“人”的功課
創(chuàng)立瀾舟科技,是一個實現(xiàn)團隊突破的過程。成功的要素很多,但是就像英偉達老板黃仁勛說的,“成功最重要的是韌性”,我對此深有同感。
從微軟離開時,我沒有帶走團隊任何一個人。這意味著起步非常困難。我當(dāng)時甚至覺得人應(yīng)該給自己制造一點困難,你一旦克服了困難,就能達到勇氣和能力上的更高境界。剛開始創(chuàng)業(yè)時,整個團隊只有我自己。不久,創(chuàng)新工場其他團隊的幾位伙伴被我吸引,覺得瀾舟好像有“前途”,就主動加入進來。他們并沒有NLP的背景,但是在我的鼓勵下,努力開始在NLP領(lǐng)域?qū)W習(xí),隨后我又招了兩名實習(xí)生,我們5個人就慢慢開始訓(xùn)練模型。招聘是我們的“老大難”。畢竟當(dāng)時我們只是一個看不到明顯前景的小型創(chuàng)業(yè)團隊,也許唯一打動人的辦法就是,跟面試者講未來的機會和情懷。我也通過我的一些學(xué)生、我的老朋友等熟人的信任關(guān)系招進來第一批人,包括實習(xí)生,好不容易到了10個人。我們這樣一個“輕量化”的團隊研發(fā)做出的孟子模型獲得了中文預(yù)訓(xùn)練模型CLUE測評的第一名,我們隨后又在北京HICOOL創(chuàng)新大賽獲得最高獎。這些成績?yōu)槲覀兇蜷_一定的品牌知名度,逐漸有人從各個渠道了解我們并加入進來,一點點滾雪球式地將團隊發(fā)展成今天的50人團隊,其中90%以上都是技術(shù)人員。人才來了后,如何把他培養(yǎng)起來,并讓他喜歡公司,也是一個很大的挑戰(zhàn)。因為團隊逐漸有了名氣之后,其他公司的“挖角”不可避免。為此我們做了很多功課。首先是建立企業(yè)文化,為員工樹立互助的職業(yè)發(fā)展觀。我們試圖打造一個大家互相幫助、互相成就、新人可以得到學(xué)習(xí)、鍛煉和尊重的工作環(huán)境,并提供一個施展身手的平臺。第二是組織培訓(xùn)討論等形式的交流會。我們一直有每月一次(ChatGPT出現(xiàn)后改為兩月一次)的披薩DAY“傳統(tǒng)”,員工們可以一邊吃披薩,一邊交流學(xué)習(xí),增進彼此之間的理解。每次的披薩DAY都由員工們輪流組織承辦,以此鍛煉每個人的協(xié)調(diào)組織能力和溝通能力。第三,我們還鼓勵員工做內(nèi)部/外部講座,讓他體驗到學(xué)術(shù)水平上升的成就感。除此之外,我也不可避免地面臨初創(chuàng)業(yè)時的茫然。畢竟之前在微軟研究院時,我作為研究員/科學(xué)家,只需要注重算法技術(shù),其他各方面都有微軟平臺,或者同事幫忙照顧解決。但創(chuàng)業(yè)之后,平臺紅利沒有了,方方面面都要靠自己,不僅要從零建設(shè)團隊,還要自己去談融資、業(yè)務(wù)等。這對于我來說都是全新的嘗試和考驗。一開始談投資的時候,每輪我都要見至少20~30家機構(gòu),最終可能只有一兩家機構(gòu)愿意投。在這過程中,對內(nèi),我們要做出項目的核心技術(shù);對外,我要表述出我們的實力以及清晰的戰(zhàn)略方向,還要掌握與投資人的溝通技巧。
如何實現(xiàn)業(yè)務(wù)盈利也成了我必須要考慮的事。剛開始創(chuàng)業(yè)時,我既不知道用戶在哪,也不知道用戶需求是什么,這種情況下,做出的模型也很難被直接投入使用。我覺得一定要走近客戶,才能了解客戶痛點,產(chǎn)出有用的產(chǎn)品。于是我們跟華夏基金成立一個聯(lián)合實驗室,經(jīng)常走訪,盡量了解對方的需求。帶著用戶的反饋,不斷完善大模型能力,讓我們訓(xùn)練的大模型真正實用。我們在過去兩年煉大模型方面積累了很多經(jīng)驗,而且我們在To B業(yè)務(wù)上也建立了不錯的合作伙伴關(guān)系和生態(tài),從技術(shù)到落地形成了閉環(huán)。在ChatGPT引發(fā)大模型熱潮后,我們提出了更高的目標(biāo)。要儲備更多算力、數(shù)據(jù),更快地迭代模型,更好地滿足客戶需求,實現(xiàn)應(yīng)用落地。在我的規(guī)劃里,瀾舟團隊會保持短小精干的狀態(tài)。今年我們有51人,明年可能達到100人左右,未來也不會猛漲。煉大模型需要訓(xùn)練有素的人才,厲害的人1個可能頂10個。我認(rèn)為百人團隊?wèi)?yīng)該是可以長期穩(wěn)定的一個規(guī)模。
3.科學(xué)家創(chuàng)業(yè)的必備要求
最近兩個月,煉模型需要不斷測試、修正、訓(xùn)練、調(diào)優(yōu)等過程。我們團隊的人都感到壓力很大。不過,我并不太著急,我覺得煉大模型不要太過于著急,不可能“畢其功于一役”,它是一個持續(xù)的過程。對每個組的工作,我們都做好了規(guī)劃,設(shè)立了若干check point。大家按照既定方針,按照計劃緊湊、有效、有序地往前推進就可以了。我不會推著團隊去“不舍晝夜”地加班。我認(rèn)為既然這是一個長期奮斗的過程,短期內(nèi)不停加班趕出一個比較粗糙的模型發(fā)布出來,也許可以一時之間造勢,但并不是長久之計。某些大廠急于發(fā)布,肯定有自己的考慮,因為它可能希望造勢,我們非常理解。而我追求的是穩(wěn)扎穩(wěn)打,把事情做得穩(wěn),真水平做出來,尤其是To B企業(yè)服務(wù),要做到令客戶滿意,這才是最重要的試金石。作為領(lǐng)導(dǎo),我要做好統(tǒng)籌布局,把握好每個人的方向,促進他們互相之間的配合,使得他們能最高效地工作,而不是強求他們的最長工作時間。作為一名科學(xué)家/研究員轉(zhuǎn)型創(chuàng)業(yè),面對這個全新的“工作領(lǐng)域”,我覺得要做很多調(diào)整。首先要磨煉心智,因為創(chuàng)始人需要做各種權(quán)衡,甚至有一些痛苦的決定。其次要做前瞻性的思考。有時我會覺得焦頭爛額,沒有時間去思考未來的發(fā)展,因此我試圖平衡自己的時間,比如利用周末去思考未來3-5年的發(fā)展戰(zhàn)略,想得更明白后,再跟團隊進行有效溝通。在這過程中,我每次都抱著學(xué)習(xí)的態(tài)度,我知道自己換了新的領(lǐng)域、新的角色,會有很多我不清楚的地方,虛心請教別人、看一些資料,試圖做出對我來講最正確的決定,不固執(zhí)己見,有人提醒(有道理)我就及時調(diào)整。由于技術(shù)發(fā)展日新月異,我雖然不能保證像以前一樣讀paper、看書、看資料、使勁摳算法,但我一直保持清醒的進取心,新技術(shù)出現(xiàn)了,我就馬上去學(xué)習(xí),去了解它的大致思路,它有什么用、誰用了,適合不適合我們?yōu)懼郯l(fā)展。如果適合,我會快速指定同事去了解,想辦法用在項目中。
保持對新鮮事物、新鮮技術(shù)的好奇心,這是必備的。因此,我日常的學(xué)習(xí)分散到了工作生活的點點滴滴中,比如朋友圈、新聞、論壇等等都是我的學(xué)習(xí)渠道;其次,我也會通過這些途徑去與人交流,了解別人的看法。第三就是要總結(jié),我每周都會寫周報,將我學(xué)到的知識、體會落到“紙面”上,再分享給同事們,這對于我來說是一個萃取提煉的過程,不僅能提升自己,也帶給別人一些啟發(fā)。對于公司的未來發(fā)展,我給自己定下了十年的目標(biāo)。我想用10年的努力,形成有戰(zhàn)斗力的公司文化,使它可以經(jīng)受任何挫折,成為中國乃至世界上最有影響力的NLP團隊。
(圖文來源于網(wǎng)絡(luò)如有侵權(quán)請聯(lián)系刪除)