筆者認(rèn)為,人工智能本身代表新型生產(chǎn)力,是人類的發(fā)展方向;Web3與A的結(jié)合將使得Web3成為新時代的新型生產(chǎn)關(guān)系,成為組織未來人類社會,避免 AI 巨頭形成絕對壟斷的救贖之路。
作為一名長期奮戰(zhàn)在 Web3 一級投資一線,以及曾經(jīng)的 AI研究者,寫一篇賽道 mapping,弟認(rèn)為自己責(zé)無旁貸。

一、本文目標(biāo)
為了更充分地理解 A,我們需要了解:
1.A的一些基礎(chǔ)概念如:什么是機器學(xué)習(xí),為何需要大語言模型。
2.AI開發(fā)的步騾如:數(shù)據(jù)獲取,模型預(yù)訓(xùn)練,模型fine tune,模型使用;都是在做什么。
3.一些新興方向如:外置知識庫,聯(lián)邦學(xué)習(xí),ZKML,F(xiàn)HEML,promptlearning,能力神經(jīng)元。
4.整個 A鏈條上對應(yīng) Web3 都有哪些項目。
5.對于整個 AI鏈條 什么環(huán)節(jié)具有比較大的價值 或者說容易出大項目。
在描述這些概念的時候,筆者會盡量不使用公式、定義,而是用打比方的方式進(jìn)行描述。
本文盡可能覆蓋了較多的新名詞,筆者希望在讀者心里留下個印象,如果未來遇到,可以回來查其處于知識結(jié)構(gòu)中的什么位置。
二、基礎(chǔ)概念
Part 1
當(dāng)今咱們熟悉的 web3+ai項目,他們的技術(shù)是屬于人工智能 中的 機器學(xué)習(xí) 中的 神經(jīng)網(wǎng)絡(luò)這一思路。
下面的這段主要界定清楚一些基礎(chǔ)概念:人工智能、機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、訓(xùn)練、損失函數(shù)、梯度下降、強化學(xué)習(xí)、專家系統(tǒng)。
Part 2
人工智能
定義:人工智能是研究開發(fā)能夠模擬、延申、擴展人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能的研究目的是促使智能機器,會:聽,看,說,思考,學(xué)習(xí),行動
我的定義:機器給的結(jié)果和人給的結(jié)果一樣,真假難辨(圖靈測試)

Part 3
專家系統(tǒng)
如果一件事 有明確的步驟、需要用到的知識:專家系統(tǒng)
Part 4
如果一件事 難以描述怎么做到:
1.有標(biāo)注數(shù)據(jù):機器學(xué)習(xí),比如分析文本中的情感
例子:需要的訓(xùn)練數(shù)據(jù)
配鑰匙師傅問我:”你配嗎”neutral
隔壁很壯的小王問我:”你配嗎“-negative
2.幾乎無標(biāo)注數(shù)據(jù):強化學(xué)習(xí),比如 下棋

Part 5
神經(jīng)網(wǎng)絡(luò)是怎么教會機器一個知識的
機器學(xué)習(xí)現(xiàn)在涉及的知識和范圍很廣,我們這里僅僅討論機器學(xué)習(xí)中最經(jīng)典的套路,神經(jīng)網(wǎng)絡(luò)。
神經(jīng)網(wǎng)絡(luò)是怎么教會機器一個知識的呢?我們可以類比為我們:
如果想教會小狗如何在墊子上小便(經(jīng)典案例,無不良指向)——(如果想教會機器一個知識)
方法1:如果狗狗在墊子小便則獎勵塊肉,如果不在則打屁股
方法2:如果狗狗在墊子小便則獎勵塊肉,如果不在則打屁股;而且距離墊子越遠(yuǎn),打得越狠(計算損失函數(shù))
方法3:狗狗每走一步,就進(jìn)行一次判定:
如果是朝向墊子走,則獎勵塊肉,如果不是朝向墊子走,則打屁股
(每進(jìn)行一次訓(xùn)練,計算一次損失函數(shù))
方法4: 狗狗每走一步,就進(jìn)行一次判定
如果是朝向墊子走,則獎勵塊肉,如果不是朝向墊
子走,則打屁股;
并且給狗狗在指向墊子的方向擺一塊肉,吸引狗狗往墊子走
(每進(jìn)行一次訓(xùn)練,計算一次損失函數(shù),之后向著能最好降低損失函數(shù)的方向,進(jìn)行梯度下降)

Part 6
為什么最近十年神經(jīng)網(wǎng)絡(luò)突飛猛進(jìn)?
因為最近十年人類在 算力、數(shù)據(jù)、算法上突飛猛進(jìn)。
算力:神經(jīng)網(wǎng)絡(luò)其實上個世紀(jì)就被提出了,但是當(dāng)時的硬件運行神經(jīng)網(wǎng)絡(luò),耗時過長。但隨著本世紀(jì)芯片技術(shù)的發(fā)展,計算機芯片運算能力以18個月翻一倍的速度發(fā)展。甚至還出現(xiàn)了 GPU這種擅長并行運算的芯片,這使得神經(jīng)網(wǎng)絡(luò)在運算時間上變得“可接受”。
數(shù)據(jù):社交媒體,互聯(lián)網(wǎng)上沉淀了大量訓(xùn)練數(shù)據(jù)大廠們也有相關(guān)的自動化需求。
模型:在有算力,有數(shù)據(jù)的情況下,研究者研究出了一系列更高效,更準(zhǔn)確的模型。
“算力”、“數(shù)據(jù)”、“模型”也被成為 人工智能 三要素。
Part 7
大語言模型(LLM)為什么其很重要
為什么要關(guān)注:今天我們歡聚于此,是因為大家對Al+ web3 很好奇;而A 火是因為 ChatGPT;ChatGPT 就屬于 大語言模型。
為什么需要大語言模型:我們上面說了,機器學(xué)是需要訓(xùn)練數(shù)據(jù)的,但是大規(guī)模數(shù)據(jù)標(biāo)注成本太高;大語言模型以一種巧妙的方式解決了這個問題。
