所有語言
分享
文章來源: 硅星人Pro
作者:王兆洋
竹間智能還活着。
這本是不需要說的話。但在2024年春節開工的第一周,一張迅速傳播的截圖瞬間讓這家AI獨角獸公司陷入“全面停工”的風波,已經許久沒有露面的簡仁賢有些頭疼。
“我們在面對一場轉型。”這位創業第八年的NLP老兵在自己的視頻號里回應。“一場艱難的轉型。”
人們似乎也不在乎真相,哪怕截圖裡明確寫着針對虧損業務進行調整,也擋不住流言發酵。“事件的發酵是偶然的。”在竹間位於上海徐匯區的辦公室見到簡仁賢時,他對我說,口氣略顯無奈。“這件事有些失控,而人們顯然不關心到底發生了什麼。”
這不是一個“突然崩盤”的故事,而是一個技術理想遇到冰冷現實后,一家曾經一路順風順水的明星獨角獸終於要自己面對世界的故事。
在各種討論里,一個廣為流傳的“點評”是,竹間這家曾經的NLP明星“倒在了大模型最火熱的時刻”,言下之意一種被新技術需求拋棄的感覺。然而,竹間智能其實是最早也最徹底投身大模型toB 市場的AI公司。今天的一切,反而是簡仁賢在從技術到產品到市場策略all in大模型一年後,看清現狀而進行的一場痛苦的自我否定。
一年前太興奮也太焦慮了,簡仁賢對我說,當時看到自己期待多年的技術就這麼撲面而來,他的決策也衝動了,但最終現實給了他“教訓”。
“我在否定自己,而這很難。”他說。
“但我必須要活下去,活下去才能看見夢想成真的那一刻。”
當天的對話是“風波”發酵后簡仁賢首次和外界交流,他十分坦誠,某些時刻甚至給人感覺已有些釋然。
在對話中,他分享了很多慘痛經歷換來的經驗,這些教訓自然不如人們已然習慣的Sora類的驚艷驚喜驚嚇來的吸引人,也不如網絡上用一個“全面停工”來概括一切更能迎合看客們“中美差距又在拉大”的情緒,但對於那些和簡仁賢一樣,同時陷在大模型帶來的人類技術大突進和創業環境大低谷這兩個重要周期里的創業者和實幹者們來說,這一年簡仁賢所經歷的,顯然無比重要。
“我都還沒有放棄追逐夢想,哪怕這把年紀。”他說。
“我希望把這些經驗分享出來,沒什麼可藏着掖着,大家還是要一起往前走。”
硅星人:所以最近到底發生了什麼?
簡仁賢:其實涉及不同層面的事情。我先講我們最近發生的事。
一個企業發生這樣的事背後肯定有一長段的歷程。這次事件的發酵是偶然的,因為我們在暫停某一些業務,需要考慮到很多法律法規,要給員工正式通知,但總是有員工會覺得不同意,就情緒化的傳出去了,被錯誤解讀,斷章取義說是全面停工。
其實是我們在調整業務。
硅星人:所以事實上你們在如何調整業務?
簡仁賢:這個說來比較長一點。
企業在三種不同因素影響之下,必須要做一個重大的改變。
第一個因素是融資環境非常不好。這個我毫不諱言,本來我們每一年都有融資,但2023 年年初的融資其實是 2022 年年底確定的,所以等於2023 年我們沒有完成融資。
往年的話我們每一年都有融資事件,因為我們在新技術的投入上是最大的。從 2015 年以後所有的 NLP 都是我們自研的,裏面沒有用過任何開源軟件。除了像 MySQL 等等這些因為客戶會用之外,我們沒有用過開源軟件做我們的NLP技術和我們的所有小模型的算法。我們的產品也都是自研開發的,甚至我們率先研發出來,再被很多企業去抄襲,比如說我們的 bot factory, 一個機器人平台,這個平台到現在也是我們毛利率最高的平台,裏面有數千個不同的小模型在裏面。我們還有非常標準化的機器學習平台,呼叫中心用的助手,知識工程的平台以及知識庫的產品等,這些都是我們用小模型歷史迭代起來的業務,其實在我們最高光的時候,這些業務都做得非常好。
硅星人:然後ChatGPT來了。
簡仁賢:對, 2022 年年底的時候 ChatGPT 突然橫空出世之後,所有的行業里的人都開始焦慮跟急躁,包括我在內。你會發現說,怎麼一個大模型的技術就這麼來了?
因為2022 年年初的時候(InstructGPT論文發布后),我們在看 GPT 3 的時候都覺得這個東西至少還有兩到三年才有辦法承受。為什麼呢?因為它需要大量的算力,這些算力很貴的,非常貴。所以 2022 年的年初,我並不覺得大模型有前途,因為算力太貴,我們做 Tob 的我覺得不可能在 3 到 5 年之內在 ToB 能夠廣泛落地。
後來到 Google 的PaLM出來后,我們從六七月開始,一直到 10 月的時候就開始用大模型來嘗試着要做一些小模型的東西。後來發現大模型能幫助小模型去訓練模型,提高它的準確率,幫忙製造語料等。那麼到了 ChatGPT 真的出來以後,我們發現整個的語義理解經過大模型完全改變了。但是有一件事情沒變,就是算力的需求還是很高。高到企業裏面根本受不了。
所以到2023 年初我就提出來新的產品策略,叫 1 + 4 的產品策略。因為企業算力需求肯定很大,所以我想說未來我們應該是“賣算力”的——核心是提供一個平台讓企業去做模型訓練。
因為企業的數據無法外傳,一定要訓練自己的模型,那麼這樣子我提供了平台讓他在我的平台裏面能夠去訓練模型,去圍繞模型端到端的把各種環節都做好,甚至連 GPU 的資源管理都做好。然後我後面再去用雲資源,再去用GPU,我就可以賺中間的差價。這是一門賣算力的生意。
想明白后,我們就研發出來emotibrain,也就是模型工廠。基本上可以私有部署,也可以公有雲。其實在美國已經有幾家這樣的賣算力的公司,做得非常不錯。
硅星人:美國有CoreWeave。
簡仁賢:對,他們以前做區塊鏈,後來轉型把手上的資源拿去提供算力,可以在上面訓練也可以租用,當然他們也研發了一個共享算力的平台。
但我們在國內做不可能自己去買一萬塊GPU。我肯定就是用一些雲計算資源,比如說華為雲、移動雲、電信雲、聯通雲,他們都有很多雲資源,還有其他很多,我就接他們,我們就算中間廠商。
這聽起來是個非常好的商業模式,對吧?
硅星人:聽起來比較理想。
簡仁賢:對。所以當時我們也推了SaaS。結果還真的簽了好幾個客戶。
硅星人:這個產品就是去年發布的對吧。
簡仁賢:對,2023年年中推出的,我們的定價分別有299,399,和1000。用戶上來可以用它做訓練,拿數據來我們這裏做打標籤的工作,訓練模型等。
硅星人:299是一個月嗎?
簡仁賢:對,299一個月可以讓它用幾個小時。所以這個算力的差價其實是有利潤的,很有利潤。現在我覺得這部分生意以後還是可以繼續以項目的方式做。但是後來很快問題來了。現實跟想象不同。
硅星人:哪裡出了問題。
簡仁賢:問題出在需求。大客戶或者是中客戶雖然有這個需求,但是需求起得有點慢。
硅星人:為什麼呢?
簡仁賢:我們現在拋開一些表面上的這些問題,用第一性原理的來解釋這些現象,其實用第一性原理來解釋整個大模型的進展,就只有一句話。就是——整個技術迭代太快。
因為整個技術迭代太快,所以裏面根本沒有商業價值。
硅星人:就是你在這個基礎技術上面做開發和商業拓展,但下面的技術又往前跑了。
簡仁賢:對。如果一個新技術每個月迭代一次,To C當然很容易嘩眾取寵,但 ToB 的需要一段時間去消化。所有 ToB 的客戶首先需要去學習,需要去探索,需要去試驗、去論證、去提報。然後再去做ROI, ROI 完以後要再去提預算。提預算完以後他才有辦法去做招標,再有可能到開發到實現。
當你每個月都迭代一次的時候,所有的客戶都會觀望。哎,那我再等一個月是不是有新的東西?所以整個的大模型從 ChatGPT 出來之後,我們其實做了一個比較極端的決策。就是我要 all in大模型 ,all in ChatGPT,除了emotibrain,我們還開發了KK bot。
硅星人:就是1+4裏面的後面四個。
簡仁賢:對,四個產品其中第一個。一個對話平台,專門基於大模型的。它裏面可以做Prompt 的優化,Prompt的 template ,Prompt的生成,我們是第一個能夠做Prompt生成的一個軟件。我們在2022年12月就推出來了Prompt Generator,可以產生prompt。嗯,那個時候我就認為 prompt 很重要,但是撰寫編寫跟設計 prime 的門檻相當高。所以我們就設計出來好一些的模板可以自動讓你生成。
當初我的要求就是第一降低模型訓練的門檻,第二降低寫 Prompt 的門檻,第三降低模型訓練的成本。全成本,total owner cost 全部降低。這些體現在 1 + 4裏面。另外幾個也是在用大模型來升級我們已有的產品,比如培訓產品,知識庫產品,可以用大模型來做知識的檢索。
當我們推出的時候,推到客戶那邊去,每個客戶都很喜歡。不過他們都還在探索跟學習大模型。他們也覺得那要怎麼把它們用到業務裏面去?怎麼樣去說服他們的高層?大模型可不可控?光是在討論大模型可不可控,說話能不能控制這些問題,企業的人基本上要花很多很多的時間自己去調研,請專家調研,才有辦法去信任我們,光是廠商跟他講是沒有用的。
完了以後最重要的問題來了,數據不可外傳,一定要本地。那就要私有部署。
硅星人:回到項目制了。
簡仁賢:對。那我們幫你列一個私有部署方案。那接下來,算力呢?企業根本不知道算力要有多少,當你幫他算出來他的算力要有多少的時候。他慌了。因為你訓練時需要GPU,推理時候 GPU 的需求可能又遠高於訓練的數倍到數十倍,這取決於你的用戶數有多少,你對它的響應速度有多少,以及你的場景數據有多複雜。
模型響應快的可以四五秒,但許多主流大模型都是十幾秒。客戶無法接受,你知道客戶要多少,要兩秒。我說 從6 秒到 2 秒,它的算力的需求可能都要 5 倍到 10 倍。那時候一個 A100 的 DGX 的服務器都要 150 萬人民幣,八卡。那麼 10 個 8 卡就要 1500 萬。
硅星人:太貴了。
簡仁賢:客戶的智能客服想要用這個大模型,他不可能說先買幾百萬的 GPU 去做,然後把他現在可能幾十萬、上百萬的智能客戶系統全換掉。這個就符合我最初的判斷,就是大模型在企業這種唾手可得的業務場景裏面要落地是不可能,因為算力是相當高。
除此之外,第二是數據成本也很高。訓練大模型的數據跟企業做結構化數據的梳理跟標註是完全不同的。第三個問題是Prompt,你幫企業部署一個大模型,可是企業用不起來的。因為他不懂得怎麼寫prompt。我們也曾經為一家大企業做一個垂直場景的大模型。對這種具體的場景,通用模型的泛化能力是沒有用的,所以我們要自己去訓練一個模型,我們也訓練了兩三個月,我們的算法工程師自己在標數據,每一天都去調優,然後又要去訓練,一次訓練都要七八個小時,然後再跑出來啊。這個整個的過程是很漫長的。
所以簡單的講,這些原因才造成目前企業在大模型落地速度有點慢。但是需求在不在?需求在,需求很大,可是落地的速度比較慢。從學習到驗證到最後立項才知道原來要這麼多GPU,然後打退堂鼓。
硅星人:就要重新再來一遍。
簡仁賢:對。這個在我們過去一年多來我們的嘗試耗費了大量精力,我們投入太多,回報太少。我可能投入這麼多,預期回報是這麼多,現在回報只有這麼少。那我原來跟我們的股東講說我去年要盈虧平衡,經過這個大模型我又虧錢,那你說我應該怎麼辦?
我說我做的這些產品技術都是業界最棒的,我們 KK bot做出來的時候,其實國內的基礎模型都還沒有那些功能,五六月我們做出來的時候都還沒有,都還沒有啊。他們都只還是有一個模型。比如Prompt builder是11月底ChatGPT出來后四周我們就做出來。但對客戶來說,它是一套的東西。
硅星人:但你們已經投入了一年了。
簡仁賢:我們是更極端的 all in 整個大模型去做,這導致我自己原先的產品的業務受損。但我認為其實我原先產品的業務可以是做得更好的。所以到去年年底我就在思考,我們的這個決定,就是1 + 4 all in 大模型的這個決定,是不是應該調整一下?所以我調整的策略是什麼呢?
是 Half in。
硅星人:之前提到過去年您在用一個雙引擎的策略,外界一度理解是你要大模型和傳統小模型的業務同時做,所以其實並不是,而是all in 大模型?
簡仁賢:雙引擎的確是大小模型雙引擎,但大小模型雙引擎是 all in大模型,是大模型大帶小模型。
硅星人:所以很多人說這次的問題是不夠all in 大模型,其實反而是因為all in帶來的問題,過去的所有業務都要用大模型改造導致的。
簡仁賢:我們是all in在做,比如KK bot是全部重新開發,EmotiBrain上都是大模型。所以一個結果是我們所有的研發資源,所有整體的資源都往大模型裏面去導,大模型的應用、大模型的中台、大模型的底層,甚至於我們也去做了模型訓練的加速。
硅星人:加速也做了?
簡仁賢:是的,我們連加速都去做,訓練的加速。對,加速。加速 llama 2的 finetuning等,整個全棧都做,所以到了 23 年的年底,我覺得這樣子不行了,所以接下來應該怎麼辦?我就覺得說我們應該再調整我的策略,就2024年不是 all in 大模型,應該叫 half in 大模型。
減少一半的意思是什麼呢?是我要以我原先的這些成熟的經過好多年驗證,經過 6 、 7 年驗證的成熟的產品,小模型在前面,我用大模型在後面推。用大模型來幫助小模型,然後用大模型來兜底小模型。也就是說讓我們的產品,不但客戶能有小模型的快准省,再加上大模型的泛化能力跟語義理解能力。
所以我必須要暫停一些業務,比如說我們的 SaaS 業務,暫停一些我們的大模型的標準化產品的業務。再濃縮到我們原來成熟的產品,然後把基於我們的小模型的這個現有客戶,未來幫他們升級成大模型的客戶。這樣我希望能夠不讓我們的客戶受到干擾,不讓我們的投資人受到干擾。
我們可能未來幾個月的時間要用行動來證明,這個模式能在幾個月之內讓我們現金流轉正,我自己能造血之後我再去看大模型。
所以如果時間能回到2022 年的 12 月,我可能就不會那麼激進,我可能就會說讓子彈飛一會兒。
硅星人:要等一等客戶,不能比客戶跑得快太多。
簡仁賢:對。不能比客戶跑得快。這是我 30 年來的心得。 ToB 你要比客戶慢, ToC 你要比用戶快。完全不一樣。別人的理解就跟我不一樣,別人理解說 ToB 你可以有既定需求, ToC 你不用去管你的需求,其實這是錯的。ToB 就是一點,你要賺錢速度就要比客戶慢。ToC 你要賺錢,你就要搶在最前面,剛好相反。
硅星人:所以當初all in的時候甚至你想讓客戶也要跟着你一起 all in 大模型,而現在 half in,相當於另外一半是自己逐漸消耗掉,自己繼續來理解這個大模型,可能客戶不需要知道你很多東西是用了大模型,但是你會在這個產品里用你們的技術積累和技術的認知去繼續改造。
簡仁賢:對。我要往後推一些。原來我們總是跑到最前面去引領創新,因為我的骨子裏面一直都要走在最前面。
硅星人:其實這引出來另一個我想問的問題,你當時為什麼沒有做基礎模型?
簡仁賢:因為我們是7年的公司,你不可能說用大模型的估值去融這麼多錢,融不到,而且相對應的人才都很貴,我要先融錢才有辦法。我也跟投資人開玩笑說,可以竹間不做,我另外再去起一個公司,可以做一個 10 億的公司,馬上可以融2億來做。但是這個是題外話。
今天Half in的意思就是說我不能放棄我能賺錢的東西,而去追求一個還沒有需求爆發的東西。所以我應該是說,我的客戶他們要的是什麼?它要的是大模型么,它其實業務沒變,存款還是存款,貸款還是貸款,風控還是風控,都沒變。只是說他要你要解決他的業務問題,有沒有用最有效的方法?
後來我發現我們的客戶都是怎麼樣,是我要你這個小模型的這個成熟產品,但是這兩個場景幫我用大模型做。所以其實變成80% 用我們成熟產品, 20% 用大模型去做探索性的場景,那麼這些以後就變成二期、三期了,所以我們現在的方式是這樣。這是一個很大的轉型,這樣企業才能生存。
硅星人:每天被這些新技術FOMO式的衝擊,讓人們忘了NLP在過去十年有多成熟,它是一個成熟的 ToB 的市場,成熟的需求,成熟的產生現金流的跑通了的業務模式。
簡仁賢:是的,沒錯。
硅星人:而NLP公司們還有一個特徵,就是它已經有一個成熟的業務模式但同時 NLP 它本身是一個一直在進步的技術,哪怕沒有大模型出來,它也是一直需要技術投入的一個行業。所以您提到的融資環境,今天整个中國投資市場的彈藥就這麼多了,那如果都去了大模型公司,過往本身非常需要融資支持技術研發的NLP公司,彈藥就不夠了。
簡仁賢:是的,沒錯。所以因應這種環境,大部分的資金都是投月之暗面,minimax,智譜,對吧?那我們怎麼做呢?很簡單。我們就自己造血。
所以我為什麼這次轉型就我要先自己造血完以後我能夠有盈餘的,我再加人、再加產品,再加產品、再投入。這樣子 we can survive for a long time。
(不做基礎模型的另一個原因)是你說現在的這些大模型的公司,其實他們經歷的就是我們六年前的故事。其實歷史一直都在重複。
我們剛出來的時候,我們做的 NLP 已經是很牛啊。那個時候我們去用Bert,就有數十種不同的Bert,一個模型也要用 CPU 訓練好幾個小時。我們也知道業界裏面去賣千億大模型的源代碼,一年一年賣,就幾百萬而已,還要提供人員去幫他做調試,這種價格非常低的,都是賠錢的。
所以現在這些大模型經歷的可能是在走我們五六年前的路,所以我現在調整的方向,就是大模型落地是要基於我們的成熟產品去落地,還有我們的 know how 去落地。我己有的高毛利的業務搬到前面來,大模型在後面,然後等到大模型的成本降低了,算力成本、數據成本、推理成本都降低了,我那時候能再次全部 all in。
回歸到第一性原理,不要為新技術潮流所帶來的這一些瘋狂的追捧而迷惑我們應該要有的企業發展方向。
硅星人:必須走一條不同的路了。
簡仁賢:對,不是只有竹間,是我們這一類的公司必須要去造血,所以我們在走一個蛻變的路去造血。
其實這裡有一個模式,做 ToB 的公司它如果要在七八年就要盈利的話,它的技術發展肯定會有遲滯。原來我不希望這樣子,我希望每一年我們的技術都往上升。但是這樣就每一年都要虧錢。
我舉一個例子,美國很成功的一家公司叫Palantir 了,它現在的股價為什麼漲這麼高呢?第一個它從去年 Q4 開始盈利,連續兩季度盈利,市場為什麼來追捧他,因為認為在美國或者是歐洲所有的企業對於 AI 的需求會上升,而它是最具有這個能力去幫他們提供服務的。但是很多人不知道Palantir成立了幾年。
硅星人:20多年。最初做美國軍方生意的。
簡仁賢:對。他原來就是美國軍方業務佔90%,然後上市之後股價也一直都很低迷。後來轉型做非軍方業務、非政府業務。但是他做了 20 年才開始盈利。因為他在技術的投入非常多,數據的投入他叫 data intelligence,這個投入非常非常多,現在他開始投入大模型就很容易做,因為他客戶在那。所以我覺得我們應該是他這種模式,不能急躁。
但問題是國內的資本能不能忍受我們虧 20 年?
硅星人:目前看起來不太會了。
簡仁賢:我們現在處於這個節奏,就第一我們沒有美元資金,第二國內的資金周期又比較短,國內的市場基金又不太可能忍受我們的這個虧損。那我們應該怎麼辦?應該忍痛停止一些業務先造血,只要我們這一關能夠 turn over,能夠過去,我們就變成一個很健康的企業模式了,所以我一直在打磨這個模式。
硅星人:所以,竹間智能長大了。
簡仁賢:是,終於長大了。
硅星人:你的身份也變了,以前是微軟的高管,大廠里做創新業務,後來這八年是高光的不愁融資的明星創業者。現在是不是面對整個公司做這樣的決定也讓你的角色變得更不同了。
簡仁賢:是,這個要求其實蠻苛刻的。這個要求是在讓我自己跟自己在做天人交戰。因為以前我們都是用第一人稱在做這個公司,就所有的開頭都是“my dream”。This is my dream, this is my passion,this is my success,his is what I do(這是我的夢想,這是我的激情,這是我的成功,這是我的做法)。
但是現在我遇到了一個完美風暴:新技術排山倒海的在顛覆,同時,資本寒冬。而且我們自己曾經原本已經要上市,後來窗口沒有了。三個方面的衝擊同時來,完美風暴,我該怎麼做。
其實過去這幾個月其實蠻煎熬的,其實就是我在尋求你剛才講的這樣一個轉變。
後來我找到了一條出路,就是把自己抽出來,不是第一人稱在做這個公司,而是抽出來,自己成了別人,然後來建議我自己,如果我是你我會怎麼樣做。
然後要做一個非常大的調整,這個大的調整就是否定自己做過的有些事情,你要去否定它,這很難,否定自己是最難的。因為你一旦沒有做好,你的信心整個就沒了。所以你要去否定,要去承認自己有些做的事情是錯誤的,那你要去調整它,你能不能調整。而且當你調整的過程當中,你的團隊有可能認為,你怎麼變來變去的。
硅星人:因為沒有任何一個人能掌握跟你一樣的信息。
簡仁賢:沒人能夠理解你的各種因素,投資人的壓力,投資人股東,你的財務、你的上司,你的合作夥伴,還有你的這個工作的員工小夥伴,等等的這些人,沒有人能夠去理解你的這個狀況,那你自己就要抽出來了,抽出來了應該怎麼辦?所以我們才做這樣一個比較重要的比較痛的一個決定。
回到day zero,不要把自己當做一個成熟公司,融了好幾輪再繼續融。no,應該把它當作 day Zero,是沒有錢的時候你怎麼辦,沒有人的時候你怎麼辦,沒有客戶的時候你怎麼辦。要用這樣的方式去思考你的商業模式,用第一性原理去想你的問題,這樣你就可以看到很多真相,而這時候做決策其實很多是在否定自己,那你能不能接受,接受就能夠成功,不能接受的那就沒了。那剩下就是你有沒有這個膽量,去執行。
硅星人:沒有被迫一定要做這些事情的時候,可能真的就逼不出來這樣的一個自己。
簡仁賢:對,非常對。就是一個人的認知都是在他真正經歷磨難的時候才能夠理解的。你平常去教他去建議他是沒有用的,他必須要自己去踩。當你在高光的時候一直在往亮的方面去走,你看不到黑暗面,真的,你到黑暗的時候你才知道理解到黑暗是什麼。我做了這麼多年,我現在才理解。
硅星人:聽起來很殘酷,那你創辦這家公司的那個夢也醒了是么。
簡仁賢:其實夢還沒醒,這個夢還在。就我常常提醒自己的一句話就是, i will not give up on my dreams, i will not give up on myself。我不會放棄我的dream,我也不會放棄我自己。
但是我們要完成這個夢的過程當中,不會是每一天都是順的,這個是新的認知,不像以前我們每一年都是順的,以前我們的過程當中我們股東沒有退出的,你信不信,他們都認為我們很有前途。這個就是我的責任,這個夢的部分,我最初要做這個情感機器人的部分,我去年就是時候我看到GPT我覺得可以做了,然後現在看到這個数字人的時候,我說,哇,這個加上聲音克隆,加上多模態,對,就完全是我的 dream,我一直想做的那個。
但是我要達到我的dream,我必須要能survive。所以我在做的工作,不是夢醒,而是要survive。If i don’t survive, i will not see my dream come true(如果我不能活下來,我不會看見我的夢想成真)。我需要 survive till the day when my dream comes true(活下來直到夢想變成現實)。
所以,我的夢還在。我年紀這麼大但我還是不會放棄夢想放棄自己。