所有語言
分享
近幾個月來,GPT相關的話題不斷出圈,給各行各業帶來巨大的變化,而一項技術的發展是經過漫長的歲月迭代而成,不同國家和地區在這方面的進度也不盡相同,通過梳理各個國家在人工智能語言模型的發展歷程,我們似乎能夠看到未來的發展趨勢。
美國
自20世紀50年代以來,人們一直在探索如何使用計算機處理語言。美國一直是處於人工智能領域研究的前沿陣地。早期的研究集中於理解和翻譯語言,隨着計算機和數據存儲技術的發展,研究重點逐漸轉移到語言生成和自然語言處理技術上。
1950年,克勞德·香農的論文《通信中的數學原理》提出了信息論,奠定了自然語言處理的理論基礎。
1954年,喬治敦大學的IBM研究員胡哲提出了一種用於機器翻譯的統計模型,開創了機器翻譯領域。
1960年代,美國國防部開展了機器翻譯研究計劃,促進了語言處理技術的發展。
1971年,麻省理工學院的塞繆爾教授發布了自然語言生成系統的第一個版本。
1983年,微軟研究院的里奇和韋特斯坦開發了第一個大規模神經網絡語言模型,即經典的循環神經網絡(RNN)。
1991年,IBM的Watson計劃啟動,旨在開發一種可以回答人類問題的計算機系統。
2018年,OpenAI發布了GPT-2,一種大規模預訓練語言模型,引起了全球廣泛關注。
2022年11月30日,OpenAI公布了一個通過由GPT-3.5系列大型語音模型微調而成的全新對話式AI模型ChatGPT,掀起人工智能的熱潮。
2023年3月15日,OpenAI發布ChatGPT-4,瞬間席捲各行各業。成為人工智能領域最為領先的語言處理技術。
中國
中國自20世紀80年代末開始涉足語言處理領域。隨着中國信息技術的發展和對人工智能的投資增加,語言模型在中國的應用逐漸擴大。
1984年,中國科學院計算技術研究所成立了自然語言處理研究室,開展了語言處理技術的研究。
1996年,哈爾濱工業大學成立了自然語言處理實驗室,開展了漢語自然語言處理研究。
2002年,中文信息處理領域的國家重點實驗室成立,推動了語言處理技術在中國的發展。
2011年,百度推出了自然語言處理平台,加速了語言處理技術在中國的商業化應用。
2014年,中國科學院計算技術研究所的鄭華東等人開發了具有革命性的深度學習框架PaddlePaddle,成為了中國領先的人工智能開源平台。
2018年,華為發布了自研的AI芯片“昇騰”,用於支持深度學習和自然語言處理等人工智能技術。
2019年,百度發布了GPT-2的中文版本“ERINE”,成為中國自然語言處理領域的一大突破。
2022年3月16日,百度正式發布文心一言,包括五大能力——“文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成”。
日本
日本自20世紀60年代開始研究自然語言處理技術,並在此領域中發揮了重要作用。
1960年代,日本開始研究機器翻譯技術,並在該領域取得了重要進展。
1984年,日本筑波大學成立了自然語言處理研究室,推動了日本語言處理技術的發展。
1990年代,日本在信息技術方面取得了重大突破,推動了自然語言處理技術的發展。
2004年,日本電氣通信大學教授岩澤毅等人開發了CRF(條件隨機場)算法,成為日本語言模型領域的重要突破。
2015年,LINE公司推出了基於深度學習的語音助手“Clova”,加速了自然語言處理技術在日本的商業化應用。
2018年,日本東京大學的團隊發表了一篇論文,提出了一種基於Transformer的語言模型,即BERT(Bidirectional Encoder Representations from Transformers),開創了預訓練模型的新時代。
2021年8月,Rinna發布了一個名為GPT2-medium的模型,然後又在次年推出了日本版的GPT-2,參數達到13億。目前已經是日本參數規模最大,最具代表性的大模型了。
韓國
韓國在語言模型領域的發展相對較晚,但隨着信息技術的發展和韓國政府對人工智能的重視,該領域正在快速發展。
1994年,韓國信息通信部成立了自然語言處理研究室,開展了語言處理技術的研究。
2006年,KAIST(韓國科學技術院)成立了人工智能研究中心,致力於推動人工智能技術在韓國的發展。
2012年,Naver公司推出了智能語音助手“Clova”,並開展了自然語言處理技術的研究。
2016年,韓國政府推出了“AI大師計劃”,旨在培養具備人工智能領域專業知識和技能的人才,推動人工智能產業的發展。
2018年,KAIST研究團隊開發了韓國首個基於深度學習的自然語言處理平台“KoNLPy”,為韓國語言處理技術的發展提供了支持。
2019年,Naver發布了韓國首個AI語音助手“Wave”,成為韓國語音技術領域的一大突破。
2022年12月,LG集團的人工智能智庫LG AI Research 推出了Exaone。這是一個擁有3000億參數,使用圖像和文本數據的多模態模型,也是目前韓國參數規模最大的模型。
總結
從以上各國的發展可以看出,美國是語言模型發展最早、最快的國家,早期在語言模型領域的重要人物包括香農、麥卡洛克等,後來發展出了許多具有代表性的語言模型,如LSTM、GPT等。
中國在語言模型領域的發展相對較晚,但近年來隨着信息技術的快速發展和政府的大力支持,該領域取得了快速進展,如Baidu的“ERINE”、PaddlePaddle平台等。
日本在語言模型領域中也具有重要地位,早期主要在機器翻譯技術方面有所突破,後來也逐漸轉向深度學習技術的研究,如BERT模型。
韓國在語言模型領域的發展相對較晚,但近年來隨着政府和企業的支持,該領域也在逐漸迎頭趕上,在研發主力上更多偏向於財閥巨頭。
從各國的人工智能語言模型的發展歷程可以看出目前大數據語言模型的發展特點:
數據方面,從少量標註數據、大量標註數據、海量非標註數據+少量標註數據到海量非標註數據,越來越多數據被利用起來,人的介入越來越少,未來會有更多文本數據、更多其它形態的數據被用起來,更遠的未來是任何我們能見到的电子數據,都應該讓機器自己從中學到知識或能力。
算法方面,表達能力越來越強,規模越來越大,自主學習能力越來越強,從專用向通用,沿着這個趨勢往後,未來Transformer預計夠用,同時也需要替代Transformer的新型模型,逐步邁向通用人工智能。
人機關係方面,人的角色逐漸從教導者轉向監督者,未來可能會從人機協作、機器向人學習,發展成人向機器學習,最後由機器拓展人類。
目前大數據語言模型的發展已經取得重大成就,隨着技術的不斷髮展將必然朝着智能化、個性化、多樣化、可靠性安全性和共享開放和發展。