“創新落地,生態共贏”2024瀾舟科技大模型技術和產品發布會圓滿舉辦!
2024年3月18日,瀾舟科技在中關村國家自主創新示范區展示中心隆重舉行了“創新落地,生態共贏”大模型技術和產品發布會。此次發布會取得了圓滿成功,不僅展示了瀾舟科技的大模型的最新進展和大模型技術的實際應用落地、生態構建的成果,更體現了其對未來發展的深度思考和戰略布局。
北京超級云計算中心作為瀾舟科技的算力服務合作伙伴,為孟子大模型的訓練提供了好用可靠的算力資源服務。在發布會現場,北京超級云計算中心與其他用戶和合作伙伴齊聚一堂,共同與瀾舟科技簽約并合影,以紀念這一重要時刻。
簽約儀式合影
??以下內容轉載自瀾舟科技公眾號??
開場致辭
北京市海淀區副區長徐振濤發表致辭
發布會伊始,北京市海淀區副區長徐振濤發表致辭。首先對瀾舟科技大模型取得的突破和進展表示了祝賀。當前,全球人工智能技術高速演進,大模型創新成果層出不窮,面對人工智能發展機遇,海淀區時刻保持對于產業發展趨勢和演進的敏銳性,始終站在國家戰略高度,持續擴大已有發展基礎和優勢,全力打造人工智能產業高地。
一是科研力量持續引領創新。集聚了北大、清華、中科院等頂尖高校院所,啟源、中關村兩個國家實驗室,智源、通研院、科學智能研究院等新型研發機構和七家全國重點實驗室。
二是頂尖人才匯聚。區內擁有眾多人工智能領域頂尖科學家和產業領軍人才,聚集了人工智能學者1.23萬人,占全市的82%。AI2000全球頂尖學者89人,占全市73%。
三是產業鏈企業高度集聚。圍繞重點環節,已基本形成芯片、框架、大模型等全產業鏈部署,集聚企業近千家,占全市的2/3,全國的1/6。大模型企業、機構超90家,并且數量持續增長。通過備案的大模型36家,占全市的72%以上,初步圍繞中關村、知春路、學院路等周邊地區在全國率先形成了人工智能大模型產業集聚區。
四是產業創新生態較為完善。截止到目前已經培育20家獨角獸企業,占全市的60%,企業在人工智能領域,授權發明專利數量8.1萬件,占全市的62%。去年,國家發改委公布第一批66個國家級產業集群評審結果,海淀區人工智能產業集群獲評優秀,也是全市唯一獲評優秀的產業集群。同時海淀區緊抓通用人工智能發展機遇,印發了《關于加快中關村科學城人工智能大模型創新發展的若干措施》,圍繞大模型研發所需創新資源和共性需求,從算法、算力、數據、全流程加強要素供給,從場景應用、資本、評測體系、人才與國際合作、孵化培育、監管、倫理等方面完善生態,加快推動人工智能產業有序健康發展。
2023年是生成式人工智能大模型發展元年,行業應用出現井噴式增長,瀾舟科技作為北京市大模型合作伙伴計劃成員單位,是駐區代表性大模型企業,在預訓練技術、規模化技術、工具鏈技術、推理部署技術等方面均有深厚的積累,成立兩周年以來,也在產業應用方面做了大量的工作。大模型產品已經在金融、文娛、翻譯等領域落地應用,為產業智能化發展提供了堅實的支撐。
下一步,海淀區將深入貫徹國家北京市關于加快新一代人工智能發展的戰略部署,發揮中關村科學城在人工智能領域產業資源密集、體系完備的發展優勢,持續支持大模型前沿研究及應用發展,加快打造具有國際影響力的通用人工智能創新生態。
最后,希望瀾舟大模型持續取得重大突破進展,進一步促進與繁榮我國通用人工智能大模型生態!
AI2.0平臺變革進行式
隨后,創新工場董事長、零一萬物CEO李開復博士進行了《AI 2.0 平臺變革進行式》主題演講。
創新工場董事長、零一萬物CEO李開復博士正在演講
李開復博士指出, AI 2.0 模型能力突飛猛進,通識理解已經超越人類專家。AI 2.0 通過圖靈測試并趨于成熟,揭示下一個平臺級變革 。新一代創新應用需要新的技術平臺,基于強大的底層技術搭建出高效的開發工具, 從而節約開發生態做創新產品的成本,促進包括新產品、新業態、新的商業模式的全新應用生態。
隨后,李開復博士展望了AI 2.0未來的四大趨勢:
- 最革命性的 AI 2.0 應用應該是 AI-First / AI-Native:最終脫穎而出的應用屬于那些敢于全力投入新技術的先驅者。大語言模型的引入為 AI-First 應用帶來了巨大的推動力。
- 大模型始于文本,未來將拓展至“全模態”:跨模態生成技術是實現認知和決策智能的轉折點。現實世界的信息是文本、音頻、視覺、傳感器以及人類各種觸覺的綜合體系,要更為精準地模擬現實世界,就需要將各種模態能力打通,例如文本-圖像、文本-視頻等跨模態甚至全模態的綜合能力。
- AI 2.0 將超越對話,從聊天工具到智能生產力工具:用戶體驗以及未來交互界面和商業模式都會發生大的變革。
- AI 2.0 將走向實體,大幅提振社會生產力:具身智能可以讓機器人制造機器人, 進一步實現AI 2.0 + 生產線智能規劃。
最后,李開復博士表示AI2.0趨勢要能落地,需要最優秀的、能專注場景實踐的合作伙伴。瀾舟在基于大模型面向企業市場落地方面已經有了非常好的基礎,零一萬物在千億級大模型、多模態方面會投入更多力量,此次大會瀾舟科技和零一萬物進行了戰略合作簽約,雙方優勢互補,強強聯手,預期一定會取得更大的突破。李開復博士作為零一萬物的創始人兼CEO和瀾舟科技創始人兼CEO周明博士在臺上握手致意,現場來賓共同見證了這一激動人心的時刻!
周明博士與李開復博士握手達成戰略合作
在議程中間環節,本次發布會也很榮幸播放了眾多知名專家、學者和企業家們錄制的視頻寄語,他們分別是:中國科學院院士張鈸、中國中文信息學會名譽理事長李生、中國工程院外籍院士張亞勤、美國國家工程院外籍院士沈向洋、北京航空航天大學機器人研究所名譽所長王田苗、微軟全球資深副總裁周禮棟、阿里云智能集團CTO周靖人、同花順創始人易錚、中文在線創始人童之磊、傳神語聯網CEO何恩培、創新奇智CEO徐輝、創業黑馬董事長牛文文等。這些寄語不僅是對瀾舟科技的鼓勵與支持,更是對人工智能產業發展前景的肯定與期待。
“一橫N縱”孟子大模型系列及產品發布
在瀾舟科技最新技術和產品發布環節,瀾舟科技創始人&CEO周明博士發表了《大模型技術和應用雙輪驅動加速創新》主題演講。他回顧了瀾舟科技的發展歷程,并展望了未來的發展方向。他強調在數字化浪潮中,以大模型為代表的人工智能正在重塑人類的未來。2024年將是大模型落地元年,如何利用大模型技術助力企業成長已成為業界關注的焦點。
瀾舟科技科技創始人&CEO周明博士在演講
2021年6月,瀾舟科技正式成立, 致力于自主研發大模型技術和行業應用,在去年3月發布了孟子GPT V1(MChat),今年1月孟子大模型GPT V2(含孟子大模型-標準、孟子大模型-輕量、孟子大模型-金融、孟子大模型-編碼)對公眾開放。
周明博士強調,瀾舟科技注重技術和應用雙輪驅動。在積極研究和掌握前沿技術的同時,公司也致力于確保這些技術的有效應用。在每一個關鍵技術發展的時期,瀾舟科技都會攜手客戶及合作伙伴,如傳神、數說故事、華為云、華夏基金、同花順、中金公司等,共同開展深入合作。通過深入應用場景、精準把握用戶需求,瀾舟科技不斷推動技術和產品的迭代升級,力求在激烈的市場競爭中保持領先地位。
周明博士回顧了過去一年來大模型的迅速發展:
- 大模型的能力得到快速提升:在更長的上下文處理能力、數學能力和推理能力、安全對齊等方面得到大幅度增強。
- RAG(檢索增強生成):通過結合搜索相關數據庫的結果與用戶指令進行生成,可有效改善模型幻象、實時性、數據安全等問題。
- GPTs:用戶基于大模型的超強能力方便地搭建自定義的GPT。
- 多模態大模型:SORA突破了4秒鐘限制,可以生成60秒的視頻,而且生成的視頻質量大幅度提升。
- 大模型原生應用方面略現端倪:譬如,利用大模型構建AI搜索、角色扮演聊天、數字人等。
- 大模型開源:LLaMA等開源模型有力地推動大模型的普及和發展,也顯著地改變了大模型的競爭格局。
2024年將是大模型落地元年, 各界熱切期盼大模型能結合不同行業的場景應用,實現規模化效用。政府工作報告新鮮出爐,特別強調以人工智能+,驅動各行各業的轉型升級。周明認為要把握好這個歷史契機,通過落地,創造價值,拉動創新。要做好大模型落地,周明表示,互聯網的七字法則仍然適用:專注、極致、口碑和快,還要再加上成本,形成大模型落地九字法則。
周明強調,大模型ToB應用要解決四個大問題:訓練和部署成本、行業適配性、幻象、數據安全,并解釋了瀾舟科技在這四個方面所作的努力。
此次發布會的核心為”一橫N縱"體系,其中的“一橫”即為孟子大模型技術,而“N縱”是基于孟子大模型的面向ToB應用最重要的技術和產品。希望通過“一橫N縱”,徹底貫徹大模型落地九字法則:專注、極致、口碑、快、成本。
周明博士首先介紹了從預訓練,到SFT,到強化學習,安全,降低幻覺的完備的孟子大模型訓練體系。孟子大模型離不開背后的高質量的數據集—Mengzi-3數據集,總規模為3T tokens,包含了網頁、代碼、書籍、論文等高質量數據來源。
最后,在Mengzi-3語料數據的加持下,瀾舟團隊在近期完成了Mengzi3-13B的大模型訓練,在常見公開數據集,如MMLU,Chinese-MMLU,GSM8K,HUMAN-EVAL等評估模型效果來看,該模型在各項基準測試中與相仿參數量大模型相比,中英文語言能力成績領先。
針對大模型訓練和部署的成本高的問題,瀾舟科技專注把ToB場景使用最多的LLM模型(參數量7B、13B、40B最高到100B)做到最佳并大幅度提升大模型的推理效率。
3月30日Mengzi3-13B的模型將在GitHub、HuggingFace、魔搭和始智AI社區開源,屆時也期待社區更多的反饋。
針對大模型的行業落地適配問題,周明博士再次重申了L1-L2-L3-L4的層次化分級服務體系, 基于L1-通用大模型,在此基礎上加入行業數據訓練出L2-行業/垂直大模型,如金融、編程大模型。針對重要場景,在L1或者L2模型基礎上finetune,實現L3大模型。最后Agents可以調用L1-L2-L3任何一層的模型形成完整的一個特定任務。
針對大模型的幻象問題和用戶數據安全問題,孟子大模型提出了改進的RAG能力。通過孟子大模型理解用戶意圖,可分別經過大模型自身,或者通過RAG查找用戶知識庫,甚至通過Web搜索,最后多路召回搜索結果,經過排序輸出最可信結果。
在總結階段,周明博士強調大模型創業所需要的生態環境非常重要, 瀾舟一方面聚焦自己擅長的能力和場景,另外一方面會注重與開源社區、與客戶和合作伙伴攜手共進,共同拓展更廣闊的市場空間,實現互惠共贏的局面。
在孟子通用大模型這“一橫”之上,瀾舟科技合伙人、首席產品官李京梅向與會觀眾詳細介紹和發布了“一橫N縱”的應用能力型產品,包括AI文檔理解、文檔問答、文檔輔助寫作、機器翻譯、瀾舟智會、AI搜索。
瀾舟科技合伙人&首席產品官李京梅在演講
在值得關注的行業/垂直大模型中,瀾舟科技目前重點投入到了金融行業,輔助編程等領域,旨在通過更加全面、專業、優質的領域數據,打造更加貼近行業場景的垂直大模型。
AI文檔理解 – 基于孟子文檔理解大模型提供專業的文檔解析和信息提取能力。該產品涵蓋專業的PDF文檔解析能力和信息抽取能力。它為RAG方案中的文檔理解提供了更優的基礎能力。在與新華智云共建文化大模型,以及其他眾多AI文檔理解,信息提取類客戶場景中均已使用。
AI文檔問答 – 助力構建企業智能知識庫。該應用產品服務提供了文本、表格內容處理的高效、準確解析能力、基于AI搜索賦能的基于文檔的知識庫問答、生成摘要和觀點,以及可信的內容回溯。根據企業需要,提供私有化企業智能知識庫構建的解決方案能力。日前,中金公司的中金點睛投研平臺已經開始集成瀾舟公司的針對研報等封閉式文檔問答以及針對路演會等會議紀要的搜索、問答和摘要。
除了文檔理解、搜索和問答,本次發布也推出了面向場景的可控AI寫作助手 - AI文檔輔助寫作。該產品支持用戶上傳多個文檔作為參考資料,支持自定義多級題目和寫作提綱,由大模型賦能自動化按要求生成完整的文章初稿,目前已經在聯通客戶項目落地,為其數智化投研平臺提供了智能研報寫作的能力。
李京梅也提到,之前已經發布過的瀾舟智會和機器翻譯近期也都做了背后模型能力的升級。
瀾舟智會是一款專注會議內容的智能分析和問答的產品, 是基于大模型打造的大模型原生的智能會議助手。它采用大模型技術對文字進行可讀性優化,提供全文智能摘要總結,基于話題智能劃分章節,提供要點導航,以及針對AI搜索結果提供可靠原文追溯。瀾舟智會目前已經在人保科技部署,為員工提供智能會議助手服務。
瀾舟機器翻譯平臺專注以中文為中心的世界主要語種之間互譯和20幾個領域的專業翻譯,均具備了世界一流水準的翻譯精度和性能,已經為華為、傳神、中金等客戶提供服務。
除此之外,瀾舟還與新華智云合作,利用文化歷史、地方志、詩詞等數據共拓文化大模型;與某頭部企業合作,通過歷史客服對話數據進行大模型訓練,升級在線機器人/虛擬數字助理的效果,技術驗證可以實現意圖識別率提升5%,問題解決率提升14%。
產品發布之后,李京梅邀請部分在京的客戶和合作伙伴公司代表上臺,請周明博士向他們回遞合作簽約協議并合影留念。瀾舟科技將積極與產業鏈上下游企業合作,共同打造一個開放、共享、協同的技術生態,推動整個行業的快速發展。
之后,瀾舟科技合伙人、算法和應用VP馬永亮分享了《瀾舟AI搜索—大語言模型時代的搜索引擎》。
馬永亮指出當前我們正處在一場搜索技術和產品體驗變革的浪潮之中。大模型和檢索增強架構的引入,為搜索領域帶來了革命性的變化。大模型技術讓搜索引擎能夠更好地理解用戶的搜索意圖和上下文,從而提供更精準、更個性化的搜索結果。此外,大模型的應用還使得搜索結果的總結和推理能力得到了極大的提升。通過對海量數據的學習和分析,搜索引擎能夠為用戶提供更加全面、準確的搜索結果,并且能夠基于用戶的搜索歷史和偏好進行智能推薦,從而提升搜索體驗的質量和效率。隨著大模型技術的發展,我們可以預見到搜索引擎將會向著更加智能化、情景化和個性化的方向發展。在這個過程中,人工智能技術將會扮演著越來越重要的角色,而大模型技術則會成為推動搜索引擎發展的核心驅動力。
馬永亮進一步深入分享了大模型技術應用在搜索領域的一些實踐和探索。
首先,向量檢索模型是深度學習、預訓練廣泛應用于搜索技術中最有代表性的技術之一。它改進了檢索召回的效果,對于基于關鍵詞的召回方法起到了非常好的補充作用,加強了在檢索階段語義理解和匹配的能力。我們正在探索如何通過大模型的領域數據合成來提升檢索模型在垂直領域的泛化能力。這一創新意味著我們能夠更好地適應不同領域的搜索需求,從而提供更加準確和全面的搜索結果。
其次, 馬永亮還講到他們在工作中引入了大模型和小模型結合的非對稱嵌入模型,在提高檢索的召回率的同時保持搜索的效率。基于大模型的嵌入模型對比小模型優勢明顯,但是在實際應用中還是會因為大參數量造成計算資源和推理時間明顯增加。大模型和小模型結合的非對稱嵌入模型,充分利用了大模型的優勢,使得在保證檢索效率的同時,提升搜索結果的質量和準確性。
最后,將檢索和排序模型進行聯合訓練,以進一步提升搜索結果的質量和準確性。
此次AI搜索分享還包含了搜索Agent優化策略的創新與實踐。目前團隊正在探索如何通過基于領域知識和用戶搜索反饋數據構建偏好數據,利用DPO算法,為搜索場景優化Agent大模型,使模型能夠準確地分析用戶的意圖和搜索系統對當前搜索的反應,為每個搜索決定調用哪些搜索模塊,以及如何規劃搜索流程。
另外,馬永亮為大家介紹了基于大模型技術的搜索情景化和個性化。這意味著用戶無需過多關注搜索關鍵詞的選擇,同時,流通在系統中的結構化的上下文信息和個性化信息可以以語言的形式表達出來,搜索引擎能夠準確把握用戶的意圖,并提供滿足情景化和個性化搜索需求的結果。其中涉及為情景化和個性化專門優化的大模型,基于大模型和場景語料等構建Narrative搜索需求分析等數據專門訓練,表現更優。
目前,“瀾舟AI搜索”已經在瀾舟官網上線,歡迎大家試用。
在最后圓桌論壇中,瀾舟科技創始人兼CEO周明、中關村數智人工智能產業聯盟理事長,原小米集團副總裁崔寶秋、智象未來創始人兼CEO,加拿大工程院外籍院士梅濤、零一萬物聯合創始人祁瑞峰、瀾舟科技合伙人、首席產品官李京梅等五位嘉賓圍繞大模型技術的發展、應用和創新商業模式展開深入探討和交流。
2024瀾舟科技大模型技術與產品發布會的圓滿落幕,標志著瀾舟科技在技術創新、應用落地和生態構建方面又向前邁出了堅實的一步。未來,瀾舟科技將繼續秉承“創新落地,生態共贏”的理念,與客戶和合作伙伴一道共同推動科技創新和產業發展。
再次感謝北京市、海淀區、中關村科學城,瀾舟的各位投資人(創新工場、科學家基金、聯想創投、斯道資本、中關村科學城等機構)、客戶、合作伙伴、媒體機構、和廣大關注我們的朋友們!