大語言模型作為AI領(lǐng)域的明星,憑借其強(qiáng)大的語言理解和生成能力,正深刻地改變著人們的生活與工作。其興起得益于預(yù)訓(xùn)練和生成式AI技術(shù)的發(fā)展,未來將在多領(lǐng)域發(fā)揮重要作用,但同時(shí)也面臨隱私、倫理等挑戰(zhàn)。本書全面介紹大語言模型(Large Language Model,LLM)的前世今生、工作原理、應(yīng)用實(shí)踐及未來趨勢(shì)。全書共4篇:基礎(chǔ)篇追溯了大語言模型的起源與興起,深度揭秘了其工作原理,并對(duì)當(dāng)前現(xiàn)狀與研發(fā)競賽進(jìn)行深入分析,同時(shí)展望了其未來發(fā)展前景。進(jìn)階篇聚焦于模型規(guī);⑻崾竟こ、思維鏈推理等關(guān)鍵技術(shù),詳細(xì)介紹了以ChatGPT為代表的大語言模型背后的技術(shù)原理,并探討問答系統(tǒng)在實(shí)際應(yīng)用中的落地實(shí)踐。高階篇深入剖析了Transformer架構(gòu)與預(yù)訓(xùn)練模型的核心機(jī)制,探討微調(diào)技巧在提升模型性能中的作用,以及大語言模型在多領(lǐng)域的應(yīng)用實(shí)踐,同時(shí)構(gòu)建和完善了大語言模型的API生態(tài)體系。展望篇探討了大語言模型如何重塑互聯(lián)網(wǎng)格局,驅(qū)動(dòng)各行業(yè)創(chuàng)新升級(jí)及其面臨的社會(huì)挑戰(zhàn)與應(yīng)對(duì)策略,展望了以DeepSeek為代表的大語言模型對(duì)未來技術(shù)發(fā)展與人們生活方式可能帶來的深遠(yuǎn)變革。本書適合AI從業(yè)者、研究人員及對(duì)大語言模型感興趣的讀者閱讀。
在大語言模型重塑千行百業(yè)的浪潮中,掌握大語言模型相關(guān)知識(shí),是把握技術(shù)變革趨勢(shì)、推動(dòng)產(chǎn)業(yè)創(chuàng)新升級(jí)、應(yīng)對(duì)未來挑戰(zhàn)的關(guān)鍵所在,也是在數(shù)字化時(shí)代提升個(gè)人競爭力的重要基石。本書以專業(yè)且通俗的筆觸以及幽默精美的漫畫系統(tǒng)拆解大語言模型的技術(shù)奧秘與應(yīng)用實(shí)踐,從 Transformer 架構(gòu)的深度剖析,到人類反饋強(qiáng)化學(xué)習(xí)的算法解析,再到 RAG 框架與 LangChain 工具鏈的構(gòu)建,為讀者呈現(xiàn)清晰的技術(shù)原理。同時(shí),書中豐富的產(chǎn)業(yè)案例,如醫(yī)療 AI 病理診斷、教育智能建議等,為產(chǎn)業(yè)決策者指明 人工智能 產(chǎn)業(yè)創(chuàng)新 的方向;對(duì)技術(shù)倫理、應(yīng)用前景的探討,更為政策研究者提供深度思考素材。無論是深耕技術(shù)的開發(fā)者、布局產(chǎn)業(yè)的決策者,還是關(guān)注趨勢(shì)的研究者,都能從本書中獲得啟發(fā),把握大模型發(fā)展的脈搏,助力 人工智能 戰(zhàn)略落地,推動(dòng)新質(zhì)生產(chǎn)力蓬勃發(fā)展。
在科技日新月異的今天,AI已經(jīng)成為推動(dòng)社會(huì)進(jìn)步的重要力量。而在AI的廣闊天地里,大語言模型無疑是最耀眼的明星之一。它以驚人的速度走進(jìn)人們的視野,改變著人們的生活方式、工作方式和交流方式。那么,什么是大語言模型?它是如何工作的?又將如何影響人類的未來?讓我們一同踏上這場探索大語言模型奇妙世界的旅程。初識(shí)大語言模型大語言模型這一AI領(lǐng)域的璀璨明珠,其誕生與發(fā)展并非一蹴而就,而是AI技術(shù)長期積累與創(chuàng)新的結(jié)晶。從早期的簡單規(guī)則系統(tǒng),到統(tǒng)計(jì)學(xué)習(xí)方法的興起,再到深度學(xué)習(xí)技術(shù)的蓬勃發(fā)展,每一步都為大語言模型的問世奠定了堅(jiān)實(shí)的基礎(chǔ)。近年來,隨著預(yù)訓(xùn)練模型的崛起和生成式AI時(shí)代的來臨,大語言模型終于以其強(qiáng)大的語言理解和生成能力,走進(jìn)了人們的視野。預(yù)訓(xùn)練模型通過海量無監(jiān)督學(xué)習(xí),從浩如煙海的文本數(shù)據(jù)中提煉出語言的精髓,賦予模型以廣泛的語言智慧。而生成式AI技術(shù)的突破,則讓大語言模型能夠生成流暢自然、富有邏輯的文本,甚至在某些場景下,其表現(xiàn)已與人類相媲美。這一系列的進(jìn)步,不僅推動(dòng)了AI技術(shù)的飛速發(fā)展,更激發(fā)了各大企業(yè)和科研院所對(duì)大語言模型的熱烈追捧和深入研究。在這場激烈的研發(fā)競賽中,我們見證了無數(shù)令人振奮的成果。從ChatGPT等明星產(chǎn)品的橫空出世,到科研院所不斷探索的新技術(shù)和新方法,大語言模型正以其獨(dú)特的魅力,引領(lǐng)著AI領(lǐng)域的新風(fēng)尚。同時(shí),國產(chǎn)大語言模型的開發(fā)及競爭也顯得尤為重要,它不僅關(guān)乎我國在AI領(lǐng)域的國際地位,還將推動(dòng)我國相關(guān)產(chǎn)業(yè)的蓬勃發(fā)展。與模型互動(dòng)與大語言模型的互動(dòng),既是一場智慧的較量,也是一次藝術(shù)的探索。為了充分發(fā)揮大語言模型的潛力,我們需要深入了解其工作原理和特點(diǎn),并掌握一系列關(guān)鍵的互動(dòng)技巧。模型規(guī)模化效應(yīng)是我們必須考慮的重要因素。通過合理選擇模型規(guī)模,我們可以實(shí)現(xiàn)資源的優(yōu)化配置,既確保模型的卓越性能,又降低運(yùn)算成本,實(shí)現(xiàn)高效與經(jīng)濟(jì)的完美平衡。語境內(nèi)學(xué)習(xí)則是提升大語言模型應(yīng)用效果的秘籍。通過巧妙的提示工程,我們可以精準(zhǔn)地引導(dǎo)模型的行為,使其更加貼合我們的需求和期望。同時(shí),思維鏈推理技術(shù)的引入,進(jìn)一步增強(qiáng)了文本的邏輯性和連貫性,讓模型的語言理解和生成能力更上一層樓。此外,指令微調(diào)器和人類反饋強(qiáng)化學(xué)習(xí)也是優(yōu)化大語言模型表現(xiàn)的神器。指令微調(diào)器允許我們根據(jù)特定任務(wù)的需求,對(duì)模型進(jìn)行精細(xì)化的調(diào)整,使其在該任務(wù)上大放異彩。而人類反饋強(qiáng)化學(xué)習(xí),則通過引入人類的智慧與判斷,讓模型更加深入地理解人類的需求和意圖,從而提供更加精準(zhǔn)、個(gè)性化的服務(wù)。模型應(yīng)用與實(shí)踐大語言模型的應(yīng)用領(lǐng)域廣泛而深遠(yuǎn),它正以其強(qiáng)大的能力改變著世界。在自然語言處理領(lǐng)域,大語言模型能夠輕松應(yīng)對(duì)各種復(fù)雜的語言任務(wù),如在文本分類、情感分析、自然語言推理等方面,展現(xiàn)出驚人的智能與效率。在智能問答方面,大語言模型更是大放異彩。它能夠根據(jù)用戶的問題,迅速提供準(zhǔn)確、全面的答案,讓信息交流變得更加便捷與高效。同時(shí),在文本生成領(lǐng)域,大語言模型也展現(xiàn)出了非凡的創(chuàng)造力,它能夠生成連貫、自然的文本,為創(chuàng)作和編輯提供強(qiáng)大的支持。以Transformer為核心機(jī)制的預(yù)訓(xùn)練語言模型,是大語言模型中的重要一員。它通過自注意力機(jī)制和卓越的文本生成能力,推動(dòng)了自然語言處理技術(shù)的飛速發(fā)展。GPT、RoBERTa、T5等模型,憑借其出色的表現(xiàn),已成為業(yè)界的佼佼者,并在跨語言處理等領(lǐng)域展現(xiàn)出了廣闊的應(yīng)用前景。在大語言模型的應(yīng)用實(shí)踐中,我們還見證了諸多創(chuàng)新的工具和生態(tài)系統(tǒng)的涌現(xiàn)。這些框架和工具,如RAG、LangChain、LlamaIndex、LM Studio等,為大語言模型的部署和應(yīng)用提供了便捷、高效的解決方案。同時(shí),分布式學(xué)習(xí)技術(shù)的引入,使得大語言模型的訓(xùn)練和應(yīng)用更加高效、可擴(kuò)展,為AI技術(shù)的普及和應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。迎接大語言模型大語言模型的未來,充滿了無限的可能與挑戰(zhàn)。它將繼續(xù)推動(dòng)AI技術(shù)的發(fā)展與突破,為我們的生活、工作和交流帶來更多的便利與驚喜。在互聯(lián)網(wǎng)領(lǐng)域,大語言模型將引領(lǐng)新一代技術(shù)平臺(tái)的形成,重塑互聯(lián)網(wǎng)交互體驗(yàn),讓信息交流更加智能、高效。然而,大語言模型的應(yīng)用也伴隨著一系列挑戰(zhàn)與問題。隱私安全、社會(huì)倫理與公平等問題是我們必須正視并努力解決的難題。我們不能因?yàn)榧夹g(shù)的便利而忽視這些問題的存在與影響,只有在保障用戶隱私和安全的前提下,才能更好地推動(dòng)大語言模型的應(yīng)用與發(fā)展。展望未來,大語言模型將繼續(xù)在AI領(lǐng)域發(fā)揮舉足輕重的作用。它將不斷突破技術(shù)的限制與應(yīng)用的邊界,為我們帶來更多前所未有的驚喜與可能。同時(shí),我們也期待看到更多創(chuàng)新的應(yīng)用和解決方案涌現(xiàn)出來,共同推動(dòng)AI技術(shù)的進(jìn)步與發(fā)展。在這場探索大語言模型奇幻世界的旅程中,我們見證了 AI 技術(shù)的飛速發(fā)展與應(yīng)用的廣泛拓展。我們相信,在未來的日子里,大語言模型將繼續(xù)為我們創(chuàng)造更多的價(jià)值與可能。讓我們攜手并進(jìn),共同迎接大語言模型時(shí)代的到來!
王符偉人工智能領(lǐng)域?qū)<遥琁T與藝術(shù)融合兩棲圖書作者。擅長將深?yuàn)W晦澀的技術(shù),以獨(dú)具匠心的插畫形式進(jìn)行生動(dòng)拆解,讓復(fù)雜的技術(shù)變得趣味橫生、易于理解。引領(lǐng)讀者在探索技術(shù)的旅途中,感悟生活的哲理與智慧,體驗(yàn)科技與藝術(shù)交融的獨(dú)特魅力。曹宇九三學(xué)社社員、副教授,現(xiàn)就職于上海城建職業(yè)學(xué)院,深耕科研與教學(xué)工作近二十年。兼任上海九三學(xué)社市社制造專工委委員、碩士研究生導(dǎo)師及高級(jí)職稱評(píng)審委專家等職務(wù)。長期專注于計(jì)算機(jī)應(yīng)用技術(shù)領(lǐng)域,在教學(xué)與研究上成果斐然。成功主持多個(gè)企業(yè)級(jí)項(xiàng)目,在專業(yè)領(lǐng)域發(fā)表數(shù)十篇學(xué)術(shù)論文。已出版《分布式應(yīng)用開發(fā)框架研究》《Sprinud Alibaba 與 Kubernetes 微服務(wù)容器化實(shí)踐》等十余部專著。
序言1序言2前言基礎(chǔ)篇 初識(shí)大語言模型1 大語言模型是什么(了解AI時(shí)代大語言模型的前世今生) 21.1 大語言模型什么時(shí)候突然走進(jìn)我們的視野 21.2 追溯大語言模型的前世 31.3 預(yù)訓(xùn)練模型的興起:AI進(jìn)化的方向 61.4 生成式AI時(shí)代的到來:大語言模型TOP-1 92 大語言模型是如何工作的(解密大語言模型的工作原理) 222.1 大語言模型:放大版的生成式AI 222.2 大語言模型的左膀右臂:微調(diào)與提示 252.3 大語言模型 :AI平臺(tái)時(shí)代的到來 312.4 大語言模型生態(tài)的繁榮:第三方框架與軟件庫的持續(xù)發(fā)展與完善 342.5 開源大語言模型:驅(qū)動(dòng)未來AI騰飛的靈魂 373 深度剖析大語言模型的現(xiàn)狀與研發(fā)競賽(企業(yè)與科研院所的競相角逐與創(chuàng)新探索) 403.1 AI技術(shù)的持續(xù)創(chuàng)新與突破 403.2 加速發(fā)展 突破想象力的AI產(chǎn)品不斷涌現(xiàn) 413.3 企業(yè):資金與數(shù)據(jù)的雙重驅(qū)動(dòng) 423.4 科研院所:學(xué)術(shù)與技術(shù)的深度融合 433.5 國產(chǎn)大語言模型的開發(fā)及競爭的意義 443.6 未來競爭的焦點(diǎn) 453.7 基準(zhǔn)測(cè)試:揭秘大語言模型的性能密碼 47進(jìn)階篇 與模型互動(dòng)4 模型規(guī);(yīng):評(píng)估模型性能指標(biāo)(選擇適用的模型規(guī)模,實(shí)現(xiàn)資源優(yōu)化配置) 534.1 如何衡量模型的規(guī)模 534.2 權(quán)衡FLOPS與Accuracy 584.3 模型的選擇策略 605 語境內(nèi)學(xué)習(xí):利用提示工程有效提升服務(wù)(利用提示控制語言模型,推動(dòng)智能系統(tǒng)的應(yīng)用) 625.1 走近提示工程 625.2 提示工程驅(qū)使語言模型萬能化 655.3 懂提示的AI會(huì)驅(qū)逐程序員嗎 675.4 熟悉幾種具體的提示形式 716 思維鏈(CoT)推理:加強(qiáng)文本邏輯和連貫性(提升模型的語言理解和生成水平) 756.1 趣聊思維鏈推理,讓AI更聰明更有邏輯 756.2 巧用思維鏈,改善LLM推理能力 776.3 提高思維鏈推理的穩(wěn)健性 806.4 思考樹(ToT):進(jìn)化版的思維鏈 817 指令微調(diào)器:優(yōu)化模型在特定任務(wù)中的表現(xiàn)(提供高效的智能解決方案) 847.1 有效利用已有的數(shù)據(jù)集 847.2 與指令微調(diào)容易混淆的技術(shù) 857.3 指令微調(diào)存在的問題和挑戰(zhàn) 878 人類反饋強(qiáng)化學(xué)習(xí):實(shí)現(xiàn)個(gè)性化和協(xié)同學(xué)習(xí)(利用人類反饋實(shí)現(xiàn)模型學(xué)習(xí)的精準(zhǔn)性和個(gè)性化,促進(jìn)人機(jī)協(xié)同合作) 898.1 強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)機(jī)制 898.2 獎(jiǎng)勵(lì)標(biāo)準(zhǔn)的考量 918.3 獎(jiǎng)勵(lì)標(biāo)簽?zāi)芊馎I化 929 ChatGPT熱潮:深度解析其學(xué)習(xí)來源和問答精度(探究ChatGPT的學(xué)習(xí)數(shù)據(jù)和黑匣子技術(shù),提升人機(jī)交互質(zhì)量) 949.1 LLM的學(xué)習(xí)數(shù)據(jù)從哪里來 949.2 LLM通過深度學(xué)習(xí)提高精度 959.3 LLM生成的文章很自然 1009.4 LLM也懂巧妙措辭嗎 1029.5 LLM的語言風(fēng)格很文雅 10310 問答系統(tǒng)實(shí)踐:將ChatGPT融入大語言模型應(yīng)用的領(lǐng)先地位(文檔檢索模型,實(shí)現(xiàn)智能化和個(gè)性化應(yīng)用效果的極致體驗(yàn)) 10510.1 問答系統(tǒng)是什么 10510.2 問答系統(tǒng)的基本類型 10810.3 包含文檔檢索的問答系統(tǒng) 11010.4 將文檔檢索模型用于專業(yè)問答 112高階篇 模型應(yīng)用與實(shí)踐11 深度解析Transformer核心機(jī)制:從自注意力機(jī)制到文本生成(Transformer推動(dòng)自然語言處理技術(shù)進(jìn)步) 11811.1 Transformer工作原理 11811.2 詞嵌入,文本的數(shù)值化表示 12011.3 神經(jīng)網(wǎng)絡(luò)中的詞嵌入應(yīng)用 12511.4 注意力機(jī)制,聚焦關(guān)鍵信息 12811.5 趣解Query-Key-Value機(jī)制 13011.6 Transformer的文本生成能力 14112 預(yù)訓(xùn)練語言模型解析:GPT、RoBERTa、T5(透視預(yù)訓(xùn)練語言模型的豐富表達(dá)與跨語言能力) 14412.1 文字預(yù)測(cè)的過程 14412.2 GPT:文本生成的鼻祖 15012.3 BERT?RoBERTa:文本生成的新思路 15212.4 T5:模型融合的全新范式 15412.5 模型如何應(yīng)對(duì)多語言任務(wù) 15612.6 中文處理策略:微觀視角的分詞 16013 模型微調(diào)深入分析:揭秘自然語言處理任務(wù)(情感分析、自然語言推理、語義相似度和語境多項(xiàng)選擇的微調(diào)技巧) 16413.1 大語言模型擅長的基本任務(wù) 16413.2 情感分析:本質(zhì)是文本分類 16613.3 自然語言推理:機(jī)器理解文本的邏輯思維挑戰(zhàn) 16913.4 微調(diào)與語義相似度的結(jié)合:智能的雙重奏 17113.5 多項(xiàng)選擇問答:打造智能問答高手 17313.6 LoRA微調(diào)策略 17414 摘要生成:提高信息獲取效率的精練技術(shù)(探討如何提高信息獲取效率,助力知識(shí)傳播與創(chuàng)新) 17614.1 摘要生成的基本概念 17614.2 面向查詢VS非面向查詢 17815 命名實(shí)體識(shí)別:助力多領(lǐng)域NLP應(yīng)用的信息提取(深度挖掘文本中有價(jià)值的信息,為多領(lǐng)域應(yīng)用提供強(qiáng)大支持) 18015.1 什么是命名實(shí)體識(shí)別 18015.2 有哪些基本任務(wù) 18215.3 解決任務(wù)的基本方法 18516 語句嵌入:優(yōu)化文本處理與理解技術(shù)(發(fā)掘語句嵌入的應(yīng)用潛力,提升智能系統(tǒng)的服務(wù)能力) 18916.1 什么是語句嵌入 18916.2 解鎖語義相似度計(jì)算,賦能智能問答 19017 大語言模型API框架生態(tài):打造智能應(yīng)用部署新范式(基于RAG、LangChain和分布式的創(chuàng)新工具與生態(tài)系統(tǒng)建設(shè)) 19217.1 為什么要重視API框架生態(tài) 19217.2 RAG:結(jié)合信息檢索的方法創(chuàng)新 19417.3 RAG對(duì)大語言模型進(jìn)化的影響 19617.4 LangChain登場:智鏈地球村 19917.5 LlamaIndex:輕松打造個(gè)性化問答聊天 20117.6 LM Studio:你的私人AI實(shí)驗(yàn)室 20317.7 分布式學(xué)習(xí):多GPU與多節(jié)點(diǎn)訓(xùn)練 204展望篇 迎接大語言模型18 大語言模型對(duì)未來互聯(lián)網(wǎng)的影響(大語言模型技術(shù)將推動(dòng)新一代技術(shù)平臺(tái)的形成) 20818.1 新一代技術(shù)平臺(tái)的構(gòu)建 20818.2 互聯(lián)網(wǎng)交互體驗(yàn)的重塑 21019 大語言模型在各行業(yè)的應(yīng)用前景(大語言模型在醫(yī)療、金融、教育等垂直行業(yè)的創(chuàng)新應(yīng)用和潛力) 21219.1 醫(yī)療與AI跨越式融合與創(chuàng)新 21219.2 AI病理診斷與未來健康 21519.3 AI走近焦慮抑郁防線 21719.4 AI為下一代教育提供有效建議 22119.5 AI無雇員超市的興起 22219.6 AI語音產(chǎn)品與人類的積極互動(dòng) 22320 大語言模型時(shí)代的社會(huì)挑戰(zhàn)與應(yīng)對(duì)(大語言模型應(yīng)用可能帶來隱私安全、社會(huì)倫理與公平等問題) 22520.1 不是所有的數(shù)據(jù)都有權(quán)獲取 22520.2 不能因?yàn)槭茿I就與倫理無關(guān) 22620.3 AI可以涉足公平性任務(wù)嗎 22821 大語言模型技術(shù)的發(fā)展趨勢(shì)(展望大語言模型未來的技術(shù)突破) 23021.1 AI監(jiān)控街道交通真的很有效嗎 23021.2 AI解析通緝犯特征 23122 大語言模型對(duì)人類生活的影響(大語言模型技術(shù)如何改變?nèi)藗兊娜粘I睢⒐ぷ、交流方式?23323 深探智能:DeepSeek大模型技術(shù)的新里程(引領(lǐng)中文AI新紀(jì)元,開啟人機(jī)共生新篇章) 23523.1 破繭而出:DeepSeek的誕生背景 23523.2 智芯躍遷:技術(shù)解碼與創(chuàng)新突破 23623.3 智啟未來:應(yīng)用圖景與社會(huì)影響 238參考文獻(xiàn) 242