開云世界杯官網(wǎng) “納秒級”極速,給“萬物訂價(jià)”——華爾街最頂尖量化機(jī)構(gòu)Jane Street的“算力戰(zhàn)局”

當(dāng)通盤硅谷都在為通用東說念主工智能(AGI)和萬億參數(shù)的通用大模子放蕩時(shí),華爾街最精巧、最成績的量化巨頭 Jane Street(簡街本錢)卻在暗暗開辟另一條極其蹧跶的算力陣線。
近日,盛名科技播客支配東說念主 Dwarkesh Patel 凄涼獲準(zhǔn)實(shí)地探訪了 Jane Street 位于德克薩斯州的中樞數(shù)據(jù)中心。在這場與 Jane Street 手藝團(tuán)隊(duì)共同負(fù)責(zé)東說念主 Yaron Minsky 以及物理工程團(tuán)隊(duì)負(fù)責(zé)東說念主 Dan Pavatova 的深度對話中,這家剛剛砸下60億好意思元算力多量訂單的華爾街"造王商",初次解密了他們?nèi)绨苍诟哳l往復(fù)的"納秒天下"與大模子的"重算力時(shí)間"之間構(gòu)筑起無法復(fù)制的全都壁壘。
中樞不雅點(diǎn):
突破延長迷想: 量化往復(fù)并非全盤追求納秒。最優(yōu)計(jì)策是"集成設(shè)施"——100納秒內(nèi)靠 FPGA 進(jìn)行極簡決策;而更大、更靈巧的 AI 模子則運(yùn)行在微秒、毫秒致使小時(shí)級別的時(shí)限上。
60億好意思元的算力貪心: 金融數(shù)據(jù)的"字節(jié)與浮點(diǎn)運(yùn)算比率(Bytes to Flop Ratio)"極高,且噪聲極大。Jane Street 不追求硅谷那種"一個(gè)模子作念通盤事"的通用 Scaling Law,而是通過海量定制化架構(gòu)和極速迭代來榨取逾額收益。
基礎(chǔ)門徑成新圣杯: 算力的真實(shí)瓶頸早已不是芯片自己,而是發(fā)電機(jī)、變壓器和液冷開導(dǎo)。為了讓 GPU 提前 6 個(gè)月上線,公司致使不錯(cuò)作念出"燒毀全面發(fā)電機(jī)備份"的激進(jìn)買賣決策。
往復(fù)是"AGI完全"問題: 往復(fù)的骨子是預(yù)測疇昔。在商場發(fā)生"相變(頂點(diǎn)特地)"時(shí),東說念主類的元判斷遠(yuǎn)比模子可靠。AI 時(shí)間,頂尖工程師和往復(fù)員的身價(jià)不降反升。
納秒極速與大模子的"時(shí)辰譜系"
外界對高頻量化往復(fù)一直存在一種刻板印象:機(jī)器必須緊挨著往復(fù)所(干事器托管 Colo),每一筆往復(fù)都必須在納秒級內(nèi)完成,而動(dòng)輒需要龐大籌備延長的 AI 大模子似乎與之消極遜色。
對此,Yaron Minsky 明確指出:"量化往復(fù)不存在單一的時(shí)辰跨度,而是存在一個(gè)完整的譜系。"
100納秒內(nèi)的"極限硬件生涯"
在百納秒級別的極限速率下,決定輸贏的致使不是編程談話(無論是 OCaml、Rust 照舊 C++),而是地說念的硬件邏輯:
中樞開導(dǎo): 順利掛載在相聚導(dǎo)線上的 FPGA(現(xiàn)場可編程門陣列)。
極限速率: "如若你在輸入和輸出的導(dǎo)線上蟻合一個(gè)示波器,你會看到數(shù)據(jù)包在被完全接管完之前,就也曾啟動(dòng)從輸出端發(fā)出去了。"
代價(jià): 這種極致速率擄掠了復(fù)雜的籌備空間,此時(shí)的決策邏輯極其淺顯。
微秒到小時(shí)級的"AI主戰(zhàn)場"
跟著決策時(shí)辰窗口放寬到幾微秒、幾百微秒、毫秒致使數(shù)小時(shí),更大、更靈巧的 AI 模子便有了用武之地。
預(yù)測中樞: 預(yù)測金錢的"公允價(jià)值(Fair Value)",并將其當(dāng)作模塊高度可組合地鑲嵌到種種往復(fù)經(jīng)由中。
空間活潑性: 模子越大、越慢,物理擯棄的位置就不錯(cuò)離往復(fù)所越遠(yuǎn)。這使得巨型 GPU 集群不必?fù)矶略诟呱星沂芟薜耐鶑?fù)所托管機(jī)房中,開釋了算力規(guī)模。
砸下60億好意思元算力:為何不走硅谷的 Scaling Law?
不久前,Jane Street 與算力云巨頭 CoreWeave 簽署了一項(xiàng)高達(dá) 60億好意思元 的籌備條約。針對這筆驚東說念主的進(jìn)入,Yaron 進(jìn)展了華爾街與硅谷 AI 實(shí)驗(yàn)室(如 OpenAI 等)在 Scaling Law(規(guī)模定律)上的骨子永訣。
拒卻"大一統(tǒng)",擁抱"定制化"
銀河游戲在線娛樂中國官網(wǎng)傳統(tǒng) AI 實(shí)驗(yàn)室追求稽查一個(gè)完全通用的、能作念通盤事情的單一模子。而 Jane Street 的價(jià)值則來自于模子架構(gòu)的極大種種性與放蕩的實(shí)驗(yàn)數(shù)目。研究東說念主員需要極快的迭代時(shí)辰,去針對千奇百怪的數(shù)據(jù)源嘗試天淵之別的全新模子假想。
稀奇的"字節(jié)與浮點(diǎn)運(yùn)算比率(Bytes to Flop Ratio)"
金融邊界的 AI 稽查有著稀奇的底層能源學(xué):
高數(shù)據(jù)量,低信息密度: 金融數(shù)據(jù)包含海量的噪聲,單字節(jié)的信息量遠(yuǎn)低于天然談話。
模子特征: 比擬大談話模子(LLM),Jane Street 的模子通常更小,但渾沌的數(shù)據(jù)量卻大得多,對數(shù)據(jù)加載和存儲性能的要求達(dá)到了變態(tài)的級別。為此,他們正在大舉構(gòu)建我方里面的大規(guī)模對象存儲系統(tǒng)。
算力戰(zhàn)局的隱形瓶頸:從芯片到發(fā)電機(jī)與變壓器
當(dāng)硅谷還在為英偉達(dá)最新的 GPU 芯片大打起首時(shí),負(fù)責(zé)物理工程的 Dan Pavatova 清醒,真實(shí)的戰(zhàn)場也曾升沉到了物理基礎(chǔ)門徑上。
買賣決策打敗純工程無缺目標(biāo)
"發(fā)電機(jī)是咫尺你能買到的交貨周期(Lead Time)最長的開導(dǎo)之一," Dan 默示。為了突破這個(gè)瓶頸,Jane Street 展現(xiàn)出了極其狼性的華爾街想維:
"咱們不錯(cuò)挑戰(zhàn)以前的不雅念。通盤數(shù)據(jù)中心真實(shí)都需要發(fā)電機(jī)備份嗎?如若咱們拿掉部分備份,只留給最中樞的系統(tǒng),就能讓咱們的 GPU 提前 6 個(gè)月上線。從工程上看這好像不是最無缺的,但這全都是最好的買賣決定。"
物理極限的靠近:1兆瓦機(jī)架與800V直流電
跟著算力密度的放蕩飆升,疇昔的手藝有操辦正在發(fā)生巨變:
開導(dǎo)瓶頸: 咫尺變壓器、發(fā)電機(jī)以及用于液冷的冷卻開導(dǎo)處于相稱枯竭狀況。
手藝演進(jìn): 數(shù)據(jù)中心正在向單機(jī)架 1兆瓦(MW) 的恐怖密度邁進(jìn),冷卻管說念越來越粗。供電架構(gòu)也正在從傳統(tǒng)的交流電向 800伏直流電(DC) 演進(jìn)。
兩階段鎖定計(jì)策: 鑒于芯片迭代太快而基礎(chǔ)門徑成立太慢,Jane Street 傾向于"作念多(Long)"電力和數(shù)據(jù)中心容量,先鎖定能源,再推遲對高尚芯片的采購決策,致使在必要時(shí)將電力容量分流給他東說念主。
被動(dòng)燒毀的"x86捷徑"
多年來,Jane Street 運(yùn)營手藝組織的一個(gè)決竅是"走捷徑":假裝天下上只須 x86_64 一種 CPU 架構(gòu),況兼只愛戴一個(gè)大型研究數(shù)據(jù)中心和一個(gè)存儲集群。但當(dāng)今,跟著算力需求全球化散布(無法在單一地點(diǎn)引入足夠恐怖的電力),以及英偉達(dá)全新 ARM 架構(gòu)居品的推出,這一捷徑已被透澈突破。籌備和存儲調(diào)遣的交匯、以及對 ARM 架構(gòu)的維持,讓系統(tǒng)復(fù)雜度變高了幾個(gè)數(shù)目級。
四、 AGI時(shí)間,東說念主類分解為何依然是"終極護(hù)城河"?
當(dāng)被問及"一朝 AGI(通用東說念主工智能)兌現(xiàn),是否會坐窩讓 Jane Street 自在"這一激進(jìn)問題時(shí),Yaron 給出了一個(gè)盡頭清醒且長遠(yuǎn)的修起。
往復(fù)是"AGI完全(AGI-complete)"問題
Yaron 認(rèn)為,往復(fù)骨子上和"NP完全"問題一樣,是一個(gè)"AGI完全"問題。這意味著天下上發(fā)生的任何風(fēng)吹草動(dòng)(政事、天災(zāi)、科技變革)最終都會匯入并影響往復(fù)布景。
"在淺顯的部分被自動(dòng)化后,那些模子無法自動(dòng)化的硬核部分,反而成為了競爭上風(fēng)的終極所在。我從來莫得像今天這樣熱切地想要招聘更多的工程師和往復(fù)員。"
無法被電子化取代的"東說念主際修辭"與相變
非電子化往復(fù)依然遒勁: 即使在今天,巨額大額往復(fù)(如債券業(yè)務(wù))依然依賴于東說念主與東說念主之間通過聊天器具的順利疏導(dǎo)。往復(fù)員需要肉眼和直觀去評估電話那頭的東說念主代表了多猛進(jìn)度的"逆向選拔(Adverse Selection)"(即對方是否掌捏了你不知說念的內(nèi)幕)。
相變中的"元判斷(Meta Judgment)":"簡街最成績的日子,通常是天下墮入放蕩、沒東說念主知說念發(fā)生了什么、商場發(fā)生‘相變’的時(shí)刻。咱們但愿模子能證據(jù)好,但咱們深知,東說念主類在應(yīng)付相變時(shí)比模子靠譜得多。此時(shí)需要一種東說念主類獨(dú)到的‘元判斷’來決定系統(tǒng)該作念什么。"
全面擴(kuò)招:簡街正在尋找哪些東說念主?
跟著 GPU 規(guī)模在短期內(nèi)辯論從幾萬張放蕩飆升至幾十萬張,Jane Street 正在全球范圍內(nèi)伸開前所未有的東說念主才搜獵,機(jī)器學(xué)習(xí)和往復(fù)如今是一項(xiàng)"全場地的團(tuán)隊(duì)分解":
物理工程類: 機(jī)械工程師、電氣工程師、結(jié)構(gòu)工程師、表情司理、建筑師(負(fù)責(zé)數(shù)據(jù)中心全生命周期的尋找、假想、建造與運(yùn)營)。
通用/專科軟件工程: 除了高表率籌備機(jī)科學(xué)布景的通用工程師,簡街當(dāng)今放蕩渴慕"全艦隊(duì)/全集群范圍優(yōu)化(Fleet-wide Optimization)"的東說念主才(肖似于超大規(guī)模云干事商的架構(gòu)師),因?yàn)楫?dāng)算力投資達(dá)到數(shù)十億好意思元時(shí),通用的微弱優(yōu)化將產(chǎn)生多量的財(cái)務(wù)報(bào)恩。
前沿硬件與數(shù)理研究: 假想定制芯片(ASIC)的硬件工程師;專攬數(shù)學(xué)講明注解讓軟件更高效的"時(shí)勢化設(shè)施(Formal Methods)"團(tuán)隊(duì)(AI 鼎新讓這一冷門邊界整宿回春);以及領(lǐng)少見學(xué)、物理、籌備機(jī)布景的往復(fù)員。
高階前端工程師: 以前簡街相稱顧惜敕令行結(jié)尾,假裝 Web 網(wǎng)頁手藝從未發(fā)生過。但當(dāng)今為了給研究東說念主員提供更直不雅的 AI 器具、畫出精確的直線和器具教導(dǎo),他們正在大舉投資成立頂尖的前端開發(fā)團(tuán)隊(duì)。
以下為對談全文,由AI緩助翻譯:
Dwarkesh:
Jane Street 是我播客的合營伙伴,咱們意想的一個(gè)道理點(diǎn)子是:為什么我不外來躬行參不雅一下你們運(yùn)行的用于稽查(AI模子)的數(shù)據(jù)中心呢?是以我剛剛在手藝團(tuán)隊(duì)共同負(fù)責(zé)東說念主 Yaron Minsky(譯注:視頻中口誤及速記為 Ron Minsky)和物理工程團(tuán)隊(duì)負(fù)責(zé)東說念主 Dan Pavatova(譯注:速記為 Dan Ponttovo)的指揮下,參不雅了這個(gè)位于德克薩斯州的數(shù)據(jù)中心。盡頭感謝兩位帶我參不雅。值得一提的是,我以前從未去過這種地方,是以我亦然第一次參不雅,這太棒了。
以前我一直很困惑:既然你們需要在納秒(nanosecond)級別進(jìn)行往復(fù),那你們?nèi)绾文茏髂?GPU 關(guān)系的事情呢?也許你們不錯(cuò)注視講講,你們往復(fù)的踐諾時(shí)辰跨度(時(shí)限)是如何的?在作念出往復(fù)決策的過程中,你們能職守得起運(yùn)行大型模子的成本(或時(shí)辰延長)嗎?
Yaron:
我認(rèn)為這里需要領(lǐng)路的中樞少許是,并莫得單一的時(shí)辰跨度,而是存在著許多不同的時(shí)辰跨度。咱們構(gòu)建的一些往復(fù)系統(tǒng)和進(jìn)行的某些往復(fù),為了保持競爭力,你踐諾上必須在 100 納秒以內(nèi)處理并復(fù)返一個(gè)數(shù)據(jù)包。這是一個(gè)完全不同的手藝范圍,對吧?
東說念主們或然會磋議,比如:"哦,你們能用 OCaml 編寫高性能的東西嗎?"咱們的修起是:"咱們不錯(cuò)。但對于這種級別的速率,不管你是用 OCaml、Rust 照舊 C++ 編寫都不重要,因?yàn)槟愀贌o法使用 CPU。你必須使用 FPGA,它順利通過導(dǎo)線蟻合到相聚上。你復(fù)返數(shù)據(jù)包的速率盡頭快,如若你在輸入和輸出的導(dǎo)線上蟻合一個(gè)示波器,你會看到數(shù)據(jù)包在被完全接管完之前,就也曾啟動(dòng)從輸出端發(fā)出去了。"
是以這是一個(gè)盡頭不同、盡頭特殊的邊界。但是,當(dāng)你處于這個(gè)時(shí)辰邊界時(shí),你踐諾上無法進(jìn)行太多的籌備,你所作念的決策將會盡頭淺顯。事實(shí)上,在決策的"靈巧進(jìn)度"(無論是模子照舊其他某種致使是手寫的決策過程)與"復(fù)返速率"之間,存在著一條完整的量度弧線。
而構(gòu)建最好往復(fù)計(jì)策的正確設(shè)施,踐諾上是接納一種集成(ensemble)設(shè)施。對于某些類型的決策,你會盡頭趕緊地作念出盡頭淺顯的決策;對于某些類型的決策,你的運(yùn)作規(guī)模可能是——不再是辯論 100 納秒,也許是幾微秒、幾十微秒、幾百微秒或毫秒;而在某些情況下,有些經(jīng)由如若能在半小時(shí)或本日內(nèi)完成決策復(fù)返,那也完全沒問題,在這些時(shí)辰跨度上,你在時(shí)辰基礎(chǔ)上不異具有競爭力。但在通盤這些不同的時(shí)辰跨度上,你所作念的決策類型是完全不同的。
也許你未便清醒,但這些模子究竟在預(yù)測什么?詳情不單是訂單簿(order book)中的下一個(gè)變動(dòng)吧,或者也許即是?
咱們當(dāng)今顯明是在觸及一些很難公開批駁的話題。但我認(rèn)為最淺顯也最重要的一個(gè),亦然咱們一直在想考的——不僅是當(dāng)今在想,25 年前我剛加入 Jane Street、用線性記憶等器具構(gòu)建模子時(shí)就在想——一個(gè)盡頭有用、盡頭經(jīng)典的事情即是預(yù)測某樣?xùn)|西的公允價(jià)值(fair value)。比如,咱們認(rèn)為這個(gè)東西真實(shí)巧若干錢?這能夠以一種盡頭可組合的方式融入到許多不同的往復(fù)經(jīng)由中。這并不是咱們當(dāng)作預(yù)測磋商的唯獨(dú)一類事物,但它是一個(gè)很重要的磋商。
有一陣子,我嗅覺有一種對于往復(fù)公司在作念什么的梗(meme),那即是:你必須管理干事器托管(colo),搬到納斯達(dá)克往復(fù)所所在的地方,你的機(jī)器必須緊挨著那兒,這盡頭重要。
在不深入磋議咱們把什么東西放在何處的具體細(xì)節(jié)的前提下,你的推理(inference)過程可能在 CPU 上,可能在 FPGA 上,也可能在 GPU 上,這取決于你需要若干籌備量、模子有多大、需要如何的延長復(fù)返等斂跡條目。
是的,更大、更慢的東西,你不錯(cuò)把它放得更遠(yuǎn)一些。把通盤的籌備開導(dǎo)都緊挨著往復(fù)所擯棄是很令東說念主頭疼的。而對于那些真實(shí)極其快速的事物,只是待在托管機(jī)房里是不夠的,你致使會感情通往那里的線纜線圈有多長——在那種極低的納秒級別下,你真實(shí)需要去測量光纖布線的長度。但總的來說,更大的模子在它們物理擯棄的位置上給你帶來了大得多的活潑性。
Dan:
如若咱們把 GPU 放在往復(fù)所傍邊的這些托管門徑中,當(dāng)今你必須遵照他們的法例,你懂吧,是誰當(dāng)作干事商為你提供阿誰空間。此外,你的電力、冷卻,通盤這些斂跡條目當(dāng)今可能都比你我方假想和運(yùn)營的門徑要略微更緊俏一些。是以,你當(dāng)今必須想出一些辦法,比如:"嘿,可能一個(gè)機(jī)架里我只可放一個(gè) GPU,因?yàn)樗瀑M(fèi)太多電了,是以我必須把它分散開來,而不是能夠在一個(gè)機(jī)架里兌現(xiàn)高效的液冷。"是以跟著咱們的籌備需求不休增長,這些都是咱們需要辯論的事情。
你們最近與 CoreWeave(譯注:速記錯(cuò)錄為 core reef)簽署了一項(xiàng)價(jià)值 60 億好意思元的籌備條約。嗯,你們預(yù)備用它來作念什么?
AI 天下的其他邊界有規(guī)模定律(scaling laws),咱們也有咱們的規(guī)模定律,有許多模子咱們都想稽查。我認(rèn)為咱們與那些更傳統(tǒng)的 AI 實(shí)驗(yàn)室之間道理且可能不同的少許在于,咱們模子架構(gòu)的種種性以及咱們正在進(jìn)行的實(shí)驗(yàn)數(shù)目。因此,你從中獲取的大部分價(jià)值就在于,全球在模子假想中嘗試了巨額盡頭不同的新事物,給研究東說念主員提供了更快的迭代時(shí)辰,讓他們能夠發(fā)現(xiàn)更多的想法并鞭策更多的創(chuàng)新,這被講明注解是極其重要的。
在那些基礎(chǔ)模子實(shí)驗(yàn)室的情況下,稽查一個(gè)能夠作念通盤事情的、完全通用的單一模子是有平正的,而不是構(gòu)建一堆定制的不同模子。你能讓我了解一下,為什么在 Jane Street 會有不同的量度采選嗎?
對咱們來說,某些專門化是為了能夠適合和破費(fèi)正確的數(shù)據(jù)類型,對吧?咱們不錯(cuò)喂進(jìn)去的潛在數(shù)據(jù)源絕裁奪。比如咱們在需要達(dá)到的數(shù)據(jù)速率上存在許多互異。
另一個(gè)讓咱們需要對所作念的職責(zé)進(jìn)行某些專門化的成分是,舉座的推理和往復(fù)動(dòng)態(tài)都因"字節(jié)與浮點(diǎn)運(yùn)算比率"(bytes to flop ratio)的不同而變得天淵之別。咱們用來稽查模子的數(shù)據(jù)量要大得多,但就單字節(jié)而言,這些信息量卻比較少,因?yàn)榻鹑跀?shù)據(jù)噪聲(noise)盡頭大。是的。因此,模子通常更小,而數(shù)據(jù)通常噪聲更大、噪聲更多,且數(shù)據(jù)量要大得多。
另外,咱們針對不同應(yīng)用構(gòu)建的不同模子之間亦然不一樣的,對吧?當(dāng)咱們試圖找出"咱們該如何專攬?jiān)蹅儷@取的更多信息"時(shí),就會波及到種種決策,從"咱們?nèi)绾胃咝У卮鎯图虞d數(shù)據(jù)",到"咱們?nèi)绾嗡茉炷W?,再到"咱們?nèi)绾巫屚评磉^程具備它所需的渾沌量和延長"。這其中會有一整套天淵之別的量度。因此,去理清這些并為不同的應(yīng)用挑選出最好有操辦,曲直常有價(jià)值的。
那你們的推理(inference)職責(zé)負(fù)載踐諾上是如何的,或者說,K8凱發(fā)中國官方網(wǎng)站它與傳統(tǒng)的那些作念大談話模子聊天機(jī)器東說念主的大公司比擬如何?
大體上說,正如你所意料的,延長更為關(guān)鍵。批處理(batching)仍然是一個(gè)問題,取決于你所作念的模子,你可能會有針對你所不雅察的不同往復(fù)代碼(symbols)進(jìn)行解耦/分散(disaggregated)的模子或模子的一部分。因此,從多個(gè)數(shù)據(jù)源拉取數(shù)據(jù)并將其打包批處理在一王人不異會產(chǎn)生影響。
我認(rèn)為另一個(gè)道理的點(diǎn)是,數(shù)據(jù)速率真實(shí)盡頭高。在大型大談話模子實(shí)驗(yàn)室里,你從通盤不同用戶那里獲取的總體(團(tuán)聚)數(shù)據(jù)速率也很高,但你從任何單一用戶那里獲取的序列數(shù)據(jù)量(sequential data)并不大;而當(dāng)你拉取的數(shù)據(jù)是來自納斯達(dá)克行情送禮(NASDAQ feed)的字節(jié)時(shí),天哪,在單一邊界內(nèi)需要以因果前后接踵的方式進(jìn)行序列化破費(fèi)的數(shù)據(jù)速率極高。是以再次強(qiáng)調(diào),這里的動(dòng)態(tài)發(fā)生了改革。不外我認(rèn)為,許多肖似的基礎(chǔ)工程問題其實(shí)大同小異,只是通盤的常量都被微調(diào)到了不同的位置,因此你最終作念出了不同的選拔。
這意味著在你們必須如何假想這些系統(tǒng)方面,無論是從存儲照舊其他方面來看,有什么具體體現(xiàn)?
是的,我認(rèn)為與你凡俗看到的比擬,咱們對數(shù)據(jù)加載性能的關(guān)注度更高。我想咱們正在作念巨額職責(zé)來構(gòu)建咱們我方的大規(guī)模數(shù)據(jù)存儲系統(tǒng),咱們我方的里面對象存儲(object store)。咱們之前使用過種種供應(yīng)商的居品,但跟著時(shí)辰的推移,我認(rèn)為對于其中一些以研究為導(dǎo)向的用例,咱們需要在更大的規(guī)模下運(yùn)行,還需要應(yīng)付數(shù)據(jù)中心的種種性。
對吧?這不太是一個(gè)推理時(shí)的問題,而更多是一個(gè)稽查時(shí)的問題——也即是說,咱們即是無法在歸并個(gè)地方獲取咱們想要的通盤籌備資源。我不知說念,我認(rèn)為總的來說,靈驗(yàn)運(yùn)營一個(gè)手藝組織的一個(gè)重要決竅即是去弄清醒你不錯(cuò)走哪些捷徑。
咱們多年來很行運(yùn)能夠走的一個(gè)捷徑是,咱們不錯(cuò)假裝這個(gè)星球上只須一種 CPU 架構(gòu),比如通盤東西都是針對 x86_64 的,咱們假裝其他任何東西都不存在,這簡化了許多事情。咱們還曾領(lǐng)有一個(gè)大型的研究數(shù)據(jù)中心和一個(gè)大型的存儲集群,這也極地面簡化了許多事情。
而踐諾上,這兩點(diǎn)當(dāng)今都已被突破了。比如,你即是無法獲取那么大的電力,你無法在歸并個(gè)數(shù)據(jù)中心里接入足夠多的電力引入(譯注:此處 Yaron 幽默地用了"thunderbolts/雷電"一詞指代極高電力)來為你所需的通盤事物供電,你需要把數(shù)據(jù)中心建辭天下各地。是以這里存在一個(gè)龐大的去中心化/分散(disaggregation)問題,這也給你帶來了一個(gè)難題,比如:哦,當(dāng)今你必須辯論讓你的籌備調(diào)遣和存儲調(diào)遣精致交匯在一王人。而且有海量的數(shù)據(jù),因此在它們之間轉(zhuǎn)移這些數(shù)據(jù)絕非易事。
另外,咱們也不得不燒毀"僅限 x86"的作念法,因?yàn)橛ミ_(dá)推出了一系列酷炫的新址品,這意味著你當(dāng)今必須維持 ARM 架構(gòu)了。
放大視角,我想問一個(gè)盡頭天真實(shí)問題。可能會有一種天真實(shí)看法,認(rèn)為如若你領(lǐng)有了通用東說念主工智能(AGI),它就能坐窩作念 Jane Street 所作念的事情。請讓我了解一下,為什么這種天真實(shí)看法是天真實(shí)?
是的,我不想完全辯說它。確乎有這樣一種天下怡然是咱們需要負(fù)責(zé)對待的:也即是咱們將構(gòu)建出大談話模子或其他東說念主工智能系統(tǒng),它們在嚴(yán)格意旨上比地球上的通盤東說念主類都更靈巧,在通盤分解任務(wù)上都更有智力。是的,那將會很不可想議,那將是一種完全不同的狀況。在那種情況下,確乎,Jane Street 所作念的很大一部分事情可能會被自動(dòng)化取代,也許咱們?nèi)蚨紩砥涔Γ嗪赛c(diǎn)瑪格麗特雞尾酒之類的,我不知說念阿誰天下會是什么式樣。但嗅覺咱們當(dāng)今距離阿誰階段還不是特別近。
我認(rèn)為總的來說,東說念主們很容易低估這項(xiàng)職責(zé)的豐富性和復(fù)雜性,不僅是像 Jane Street 這樣的公司所作念的職責(zé),踐諾上在職何真實(shí)有貪心、高難度的公司級任務(wù)中都是如斯。我尤其認(rèn)為,往復(fù)對我來說有點(diǎn)像"AGI 完全"(AGI-complete)問題,肖似于"NP 完全"(NP-complete)問題。
這意味著天下上通盤不同的問題最終都會在往復(fù)布景下影響你正在作念的事情,因?yàn)闅w根結(jié)底,往復(fù)波及弄清醒事物的價(jià)值,這意味著對疇昔作念出預(yù)測,而許多不同的事情都會匯入其中。跟著其中的各個(gè)部分被悠閑自動(dòng)化,你就會遭受常見的情況:那些咱們還不知說念如何很好地自動(dòng)化的其他用功部分,最終成為了競爭上風(fēng)之所在。
我認(rèn)為東說念主類和東說念主類的分解比以往任何時(shí)候都更有價(jià)值。我從來莫得像今天這樣熱切地想要招聘更多的工程師和往復(fù)員,因?yàn)闁|說念主們所作念的每一件事都比以前更有價(jià)值。我的道理是,這在一定進(jìn)度上是因?yàn)槲页钟幸恍岩勺黠L(fēng),不認(rèn)為咱們距離在通盤事情上都比東說念主類靈巧的模子像某些東說念主想象的那么近。
也許這波及到物理基礎(chǔ)門徑,比如踐諾管理托管機(jī)房;也許踐諾上是你們構(gòu)建的軟件基礎(chǔ)門徑。能讓我了解一下到底是什么東西會……
是的,咱們構(gòu)建了種種各樣極其復(fù)雜的軟件,讓東說念主們?nèi)ハ肟荚S多不同的往復(fù)問題,其中一些問題根蒂不如何電子化。這個(gè)業(yè)務(wù)的種種性遠(yuǎn)比東說念主們以為的要豐富得多。有一種想法是:"哦,對,那詳情是一件很淺顯的事,你只須有一群靈巧的東說念主,他們作念出靈巧的決策,寫出優(yōu)質(zhì)的軟件就行了。如若咱們能把靈巧這部分自動(dòng)化,那就萬事大吉了。"但我認(rèn)為事情要比這復(fù)雜得多。
你所說的往復(fù)中"非電子化"的部分是指什么?
我的道理是,當(dāng)今仍然有通過聊天器具在東說念主與東說念主之間進(jìn)行疏導(dǎo)、共同決策并完成的往復(fù)。比如有東說念主會去評估電話那頭的東說念主代表了多猛進(jìn)度的逆向選拔(adverse selection),這依然是業(yè)務(wù)中盡頭真實(shí)的一部分。
你知說念,開云世界杯官網(wǎng)即是有不同種類的證券需要更長的時(shí)辰才能兌現(xiàn)更高進(jìn)度的自動(dòng)化。舉例,債券業(yè)務(wù)的自動(dòng)化進(jìn)度就遠(yuǎn)不足你在股票業(yè)務(wù)中看到的水平。踐諾上,咱們對此也有點(diǎn)困惑。我認(rèn)為咱們這些在行業(yè)里待了一段時(shí)辰的東說念主,天然我啟動(dòng)得有點(diǎn)晚,沒能真實(shí)見證股票走向電子化的轉(zhuǎn)型過程,但那些比我關(guān)注得早少許的東說念主會認(rèn)為:"行吧,我猜其他通盤邊界接下來也會這樣。"
關(guān)聯(lián)詞,你懂的,也曾以前了 25 到 30 年,并不是通盤事情都走向了阿誰標(biāo)的。天然咱們當(dāng)今也曾不如何看到有許多東說念主站在往復(fù)所大廳里了,但依然有巨額的往復(fù)深度依賴于東說念主類以及東說念主類的判斷當(dāng)作中介。
說到這個(gè),在模子和往復(fù)決策之間,東說念主類參與(humans-in-the-loop)的進(jìn)度有多高?
你們許多最成績的日子通常發(fā)生在一些奇怪的事情發(fā)生、出現(xiàn)緊要事件、天下變得放蕩、沒東說念主知說念發(fā)生了什么的時(shí)候。在那些情況下提供流動(dòng)性通常極其用功,是以你為此獲取的酬謝也更高,而且在那些日子里凡俗會有龐大的往復(fù)量。要把這些作念好,通常需要東說念主類的判斷力,去想考"今天與以往通盤日子有什么不同?"
天然在可能的范圍內(nèi),咱們但愿構(gòu)建能夠很好應(yīng)付相變(phase transitions)的模子,但咱們也認(rèn)為,東說念主類在應(yīng)付相變時(shí)比模子證據(jù)得更好,或然你需要這種元判斷(meta judgment)來決定該如何作念。因此,即使對于高度自動(dòng)化的系統(tǒng),也需要負(fù)責(zé)監(jiān)控的東說念主員作念出決策,而咱們歷久都有東說念主在進(jìn)行監(jiān)控,對吧?我認(rèn)為往復(fù)中一個(gè)重要的部分是在往復(fù)日內(nèi)去關(guān)注和想考正在發(fā)生的事情,即使個(gè)別往復(fù)的發(fā)生速率遠(yuǎn)遠(yuǎn)快到東說念主類無法在單筆往復(fù)的基礎(chǔ)上進(jìn)行紛擾。
Dan,在你從事這類建筑(數(shù)據(jù)中心)職責(zé)的以前 20 年里,最顯耀的變化是什么?
是啊,東說念主們當(dāng)今竟然真實(shí)啟動(dòng)感情數(shù)據(jù)中心了,況兼想要聊聊它。你知說念,我作念冷卻系統(tǒng)也曾有一段時(shí)辰了,當(dāng)今倏得之間全球都啟動(dòng)磋議它,認(rèn)為它很道理。是以這挺好玩的,很讓東說念主振作,我想我團(tuán)隊(duì)里的東說念主也有同感。
有些在數(shù)據(jù)中心行業(yè)干了 20 年的東說念主,仍然想用以前的方式去作念事,但我認(rèn)為這種老設(shè)施當(dāng)今正在被淘汰。你會發(fā)現(xiàn)全球正在挑戰(zhàn)以前的不雅念,比如:"嘿,我的通盤數(shù)據(jù)中心都有發(fā)電機(jī)當(dāng)作后備電源,但發(fā)電機(jī)是你能買到的交貨周期(lead time)最長的開導(dǎo)之一。是以也許咱們把它們拿掉,只把發(fā)電機(jī)用于需要這種彈性的系統(tǒng)中樞部分。這能讓咱們的 GPU 提早六個(gè)月上線,那就干吧!"是以,你知說念,有些事情也許從純工程角度看不是最好的決定,但它全都是最好的業(yè)務(wù)決定。我認(rèn)為肖似這樣的事情正在越來越多地出現(xiàn)。
嗅覺每年東說念主們在擴(kuò)大 AI 籌備規(guī)模時(shí)遭受的瓶頸都在發(fā)生變化。在你們進(jìn)行更多談判并試圖獲取更多籌備資源的過程中,拋開籌備、內(nèi)存和通盤那些好玩的東西不談,咫尺的瓶頸是什么?你瞻望疇昔的瓶頸會是什么?
發(fā)電機(jī)、變壓器,還有一些咫尺用于液冷的冷卻開導(dǎo),需求量都盡頭大。而且它變化得很快,我今天告訴你的情況,兩周后詳情就不一樣了。
咱們作念的一件事是,與里面的采購團(tuán)隊(duì)盡頭精致地合營,去囤積其中的一些物質(zhì)。對于那些咱們知說念在所少見據(jù)中心之間都不錯(cuò)通用的物質(zhì),咱們會進(jìn)行倉儲并隨時(shí)準(zhǔn)備使用。但像發(fā)電機(jī)這樣的部件,你不可能把一個(gè)龐大的發(fā)電機(jī)放進(jìn)泛泛的倉庫里;或者,舉例如若你在作念像渦輪機(jī)(turbine)這樣"表后"(behind-the-meter)的表情,你就必須對這些商場多作念一些想考——你從何處獲取它們,在何處進(jìn)行安置,你不成隨粗率便把它們擱在一邊。
是以,我認(rèn)為緊缺的部件詳情是會變化的,剛才提到的即是其中一些大件。而且,跟著咱們的密度越來越高,一個(gè)但愿是建筑不錯(cuò)變得略微弱少許,也許咱們能夠更快地把建筑蓋好,把通盤的籌備資源緊湊地緊縛在一王人,然后周圍的通盤基礎(chǔ)門徑可能都是預(yù)制好并運(yùn)載到現(xiàn)場的。沒錯(cuò),模塊化數(shù)據(jù)中心或模塊化基礎(chǔ)門徑正在變得越來越寬綽,這些組件(尤其是那些長交貨周期的組件)在場外進(jìn)行假想和建造,然后運(yùn)到現(xiàn)場,盡可能地接近"即插即用"(plug-and-play)。
你之前提到的一個(gè)不雅點(diǎn)是,跟著機(jī)架自己的密度越來越高,數(shù)據(jù)中心里越來越多的部分其實(shí)是圍繞踐諾機(jī)架周圍的基礎(chǔ)門徑。這踐諾上有點(diǎn)肖似于芯片上的封裝(package),對吧?或者說封裝上的芯片。籌備中樞只占通盤封裝總面積的極小一部分。
是的,這很故道理。我的道理是,這自己并不成解決任何問題,反而可能會帶來其他問題,天然。比如,當(dāng)你達(dá)到單機(jī)架 1 兆瓦(megawatt)的水平時(shí),全球會問:"單機(jī)架 1 兆瓦到底是什么主張?"你接入那里的冷卻管說念只會變得越來越粗。而且,無論咱們當(dāng)今使用的是交流電(AC),照舊疇昔的趨勢——800 伏直流電(DC),你仍然必須把通盤這些組件帶到歸并個(gè)地方。
從咱們的角度來看,道理的少許是,天然咱們不錯(cuò)假想這些工程上的東西,但歸根結(jié)底,無論是英偉達(dá)、定制芯片(ASIC)公司照舊其他任何東說念主,他們都必須銷售能夠在數(shù)據(jù)中心運(yùn)行的組件,而且他們也在盡頭負(fù)責(zé)地想考他們要賣什么,因?yàn)槟阈枰獤|說念主們能夠用得上它,對吧?如若你建造了一個(gè) 1 兆瓦的數(shù)據(jù)中心或 1 兆瓦的機(jī)架,但卻莫得辦法為其供電和冷卻,那就毫無謂處。是以咱們正在與該邊界的險(xiǎn)些通盤東說念主開展盡頭精致的合營,去想考你需要哪些組件才能維持這些下一代居品。因?yàn)槟闼f的交貨周期或然會進(jìn)取一年,而你通常是在為芯片下訂單之前就得對基礎(chǔ)門徑作念出決定。
是以,比如你得嘗試……你知說念谷歌的 TPU,它們使用溫度更低的水,而且它們的密度只須英偉達(dá) NVL72(譯注:此處速記錯(cuò)錄為 NBL72 GP300,踐諾團(tuán)結(jié)高下文應(yīng)為英偉達(dá)的 NVL72 架構(gòu)配 GB200 芯片)的一半。對吧?是以這需要不同的計(jì)策,而你必須確保疇昔能夠兼容處理這些開導(dǎo)。
超大規(guī)模云干事商(hyperscalers)之是以能夠開心進(jìn)入海量的籌備資源,原因之一是他們對閑置籌備資源有一些"備用用途"(reserve use),不錯(cuò)在特定時(shí)辰不消于大談話模子稽查或推理時(shí)派上用場。舉例,像 Meta 這樣的公司,如若他們買的某些 GPU 沒在用,他們不錯(cuò)順利說:"咱們今天就把 Instagram 的告白投放模子作念得略微好少許。"那么對于 Jane Street 來說,有什么平等的籌備資源備用用途嗎?這不錯(cuò)說是這些籌備資源對你們價(jià)值的底線。
部分原因在于,咱們在許多方面其實(shí)瀕臨著盡頭嚴(yán)重的籌備資源受限。東說念主們領(lǐng)有的巨額創(chuàng)新、實(shí)驗(yàn)和新想法都受限于咱們所領(lǐng)有的籌備量。是以從某種意旨上說,如若咱們略微嚴(yán)格地去評估一下咱們能夠運(yùn)行的那些不同新任務(wù)的價(jià)值,會發(fā)現(xiàn)那些咱們不得不拒卻的任務(wù)的價(jià)值踐諾上曲直常高的。對吧?是以咱們正在作念咱們認(rèn)為最有價(jià)值的事情,但如若事實(shí)講明注解咱們領(lǐng)有的籌備資源超出了這些任務(wù)所需,那么在阿誰邊界還有海量的其他研究和實(shí)驗(yàn)不錯(cuò)作念。是以咱們還遠(yuǎn)遠(yuǎn)莫得到說"噢,籌備資源太多了"的地步,咱們反而是遭受了相悖的問題。
我認(rèn)為在這個(gè)方朝上也有許多"低落的果實(shí)"(low-hanging fruit,容易兌現(xiàn)的落幕),比如更常常地再行稽查模子即是很有價(jià)值的。跟著時(shí)辰的推移,模子的質(zhì)料會有所闌珊,而能夠再行運(yùn)行它們——這對公司具有順利且明確的價(jià)值。此外,咱們還不錯(cuò)履行一定數(shù)目的巨額(bulk)推理任務(wù),當(dāng)系統(tǒng)中莫得其他可調(diào)遣的任務(wù)時(shí),不錯(cuò)用它們來填補(bǔ)空缺。因此,咱們并莫得完全肖似于 Instagram 告白投放那樣的應(yīng)用,但確乎存在一大片"盲區(qū)/未知空間(dark space)",即那些咱們沒在作念、但如若有了更多籌備資源就會去作念的事情。是以咱們盡頭不惦記無法從這些開導(dǎo)中榨取價(jià)值。
這里面確乎有一系列的隱性下注(embedded bets),比如咱們正在這些東西上進(jìn)入巨資,你不錯(cuò)想象,有些事情的發(fā)展速率可能不會像咱們預(yù)期的那么快,比如咱們正在運(yùn)行的各個(gè)模子和往復(fù)所產(chǎn)生的價(jià)值;而且這是一個(gè)競爭強(qiáng)烈的環(huán)境,也許其他東說念主會打敗咱們。我認(rèn)為保持優(yōu)秀的要素之一,即是歷久對競爭敵手可能摸索出與你肖似的作念法并縮短你的業(yè)務(wù)價(jià)值而感到彌留。是以,確乎有可能出現(xiàn)一些并不告成的情況。但顯明,以咱們咫尺現(xiàn)存的籌備任務(wù)組合來看,咱們距離遭受"算力彌散"這個(gè)問題還盡頭遠(yuǎn)處。
這很故道理,天然這莫得完全修起問題,但你不錯(cuò)把"為數(shù)據(jù)中心供電"與"購買芯片"剝離開來,然后說:"好吧,我以后可能會需要使用這些籌備資源,讓我當(dāng)今先鎖定數(shù)據(jù)中心和電力資源,但推遲對盡頭高尚的芯片作念出采購決策。"對吧?在阿誰你可能需要籌備資源的時(shí)辰節(jié)點(diǎn)上,先讓我方處于電力和數(shù)據(jù)中心容量略微"作念多"(long,充裕)的狀況。然后咱們不錯(cuò)假想一些機(jī)制,比如:嘿,也許咱們不錯(cuò)把其中一部分容量分流(offload)給其他東說念主。出于無庸贅述的原因,對咱們來說,分流電力和數(shù)據(jù)中心容量要比分流芯片自己容易得多,但你確乎不錯(cuò)將這兩者清醒地一分為二。
這也改革了對于招聘的考量。我是說,你們招聘的門檻也曾高到極致了,但這會讓它進(jìn)一步擢升。如若你多招一個(gè)東說念主,那這個(gè)東說念主就需要籌備資源來作念實(shí)驗(yàn),而這部分籌備資源將不得不與你團(tuán)隊(duì)中其他不異優(yōu)秀、本不錯(cuò)我方作念實(shí)驗(yàn)的東說念主進(jìn)行量度和采選。
我明白你的道理,但咱們不會去想:"噢,再招更多研究東說念主員會很奇怪,因?yàn)槟菢釉蹅兙捅仨毥o他們更多的籌備資源。"相悖,咱們的邏輯是:研究自己極其有價(jià)值,研究東說念主員也極其有價(jià)值,這反而是購買更多籌備資源的一個(gè)絕佳根由。
因此,咱們盡頭有能源去擴(kuò)大籌備規(guī)模。比如咫尺,咱們的 GPU 數(shù)目大致在幾萬張的范圍內(nèi),而在不久的將來,咱們將達(dá)到幾十萬張 GPU 的規(guī)模。咱們認(rèn)為這完全不錯(cuò)由業(yè)務(wù)效益來講明注解其合感性。你知說念,這并不是說咱們會在那里惦記:"哦,咱們能不成憑據(jù)往復(fù)計(jì)策的損益(P&L)來講明注解它的合感性呢?"不,不,不,這顯明是很好的投資。是以在招聘方面,這并不會讓咱們減速腳步。
在某些方面,增長的最大侵略在于需要時(shí)辰去真實(shí)培訓(xùn)新東說念主、讓他們?nèi)谌朐蹅兊奈幕⑴惆樗麄兂砷L并共同成立這個(gè)地方。咱們但愿 Jane Street 絡(luò)續(xù)成為一個(gè)偉大的職責(zé)陣勢。我完全不認(rèn)為硬件問題是侵略咱們發(fā)展的成分,我認(rèn)為真實(shí)的適度成分是尋找優(yōu)秀的東說念主才,以及咱們對他們的導(dǎo)師迷惑智力(mentorship capacity)。
我猜這可能是一個(gè)很好的契機(jī),讓你們提一下你們咫尺正在招聘哪些類型的職位?
天哪,那 Dan,你要不要先從工程邊界啟動(dòng)聊聊?
好的,我先來。我的道理是,總的來說,咱們即是在尋找盡頭靈巧、對作念這些事情誼興味的東說念主。這包括機(jī)械工程師、電氣工程師、表情司理、建筑師——也即是匡助假想和建造其中一些空間的東說念主。你知說念,我團(tuán)隊(duì)的職責(zé)踐諾上是尋找這些空間、進(jìn)行假想、建造,然后去運(yùn)營它們,這是一個(gè)全生命周期(full life cycle)。是以在每個(gè)階段你都需要東說念主才。你需要許多工程師,許多咱們稱之為"物理工程"(physical engineering)邊界的東說念主,這是咱們我方發(fā)明的一個(gè)詞。但具體來說即是機(jī)械工程師、結(jié)構(gòu)工程師,可能還有電氣工程師這類東說念主才。
而且機(jī)器學(xué)習(xí)和通盤往復(fù)行業(yè)其實(shí)盡頭像一項(xiàng)團(tuán)隊(duì)分解,是以咱們但愿招聘來自許多不同布景、領(lǐng)有許多不同智力的東說念主才。咱們天然盡頭振作能招到一些領(lǐng)有特定機(jī)器學(xué)習(xí)布景的東說念主,比如從事架構(gòu)假想和在種種情況下構(gòu)建模子的東說念主。就像我提到的,咱們針對我方特有的、商場特征所需的數(shù)據(jù),領(lǐng)有一大堆定制的架構(gòu)等。此外,咱們也構(gòu)建大談話模子(LLM),咱們對在 LLM 稽查生命周期的各個(gè)階段有告誡的東說念主都盡頭感興味,況兼一直在擴(kuò)大這個(gè)邊界的規(guī)模。
你知說念,咱們招募了巨額領(lǐng)有邃密科學(xué)和手藝布景的東說念主——比如數(shù)學(xué)、籌備機(jī)科學(xué)(CS)、物理、工程等專科——來作念往復(fù)員。這需要一種詳盡性的手段。但這是咱們不絕盡頭振作去招東說念主的一個(gè)邊界。
在軟件工程方面,有一個(gè)通用的軟件工程師職位,咱們老是渴慕招到優(yōu)秀的東說念主才。我認(rèn)為這能帶來很好的報(bào)恩。天然提及來有點(diǎn)傻,但正如 Dan 所說,靈巧、充滿贊佩心且領(lǐng)有極佳籌備機(jī)科學(xué)布景的東說念主,盡頭符合這個(gè)通用職位的變裝,他們最終不錯(cuò)作念許多不同類型的事情。
還有許多道理的專科邊界也讓咱們盡頭振作,舉例有件相稱新的事情:跟著如今算力規(guī)模的發(fā)展,咱們對全集群/全艦隊(duì)范圍的優(yōu)化(fleet-wide optimization)比以前感興味得多。咱們以前對性能優(yōu)化的看法是,它更多是對于讓那些對速率最關(guān)鍵(speed-critical)的部分盡可能地快,而更寬綽的情況是,算力挺低廉的,而東說念主力很貴,是以咱們并不會花太多時(shí)辰去優(yōu)化咱們的通用籌備。但是,天哪,咱們當(dāng)今正在進(jìn)行海量的通用籌備,當(dāng)你啟動(dòng)在這個(gè)邊界投資數(shù)十億好意思元時(shí),優(yōu)化就變得更有價(jià)值了。有些東說念主曾在某些超大規(guī)模云干事商(hyperscalers)那里有過這方面的告誡,咱們盡頭但愿招到更多具有這種布景的東說念主,來想考咱們正在遭受的優(yōu)化問題。這些問題有重疊之處,但在重要方面又有所不同,是以這既是一個(gè)關(guān)系的挑戰(zhàn),亦然一個(gè)新的挑戰(zhàn)。
另外,咱們還作念許多道理的硬件工程職責(zé),比如假想咱們我方的定制芯片(ASICs),領(lǐng)有這種告誡的東說念主不異讓咱們感到超等振作。
還有一件事,咱們剛才吃午飯時(shí)提到過,咱們啟動(dòng)辯論設(shè)立一個(gè)時(shí)勢化設(shè)施(formal methods)團(tuán)隊(duì),基本上是專攬數(shù)學(xué)講明注解來讓軟件工程變得更靈驗(yàn)率。這是一個(gè)盡頭新、極具探索性(speculative)的邊界,咱們盡頭振作能在那里找到東說念主才。我認(rèn)為這是一通盤群體的東說念主,在以前我總不得不讓他們失望,對他們說:"是的,咱們對時(shí)勢化設(shè)施不感興味。"但由于通盤東說念主工智能鼎新,時(shí)勢化設(shè)施倏得造成了一個(gè)道理得多的邊界,是以這是咱們很振作去投資的地方。
另外,我也不知說念,比如表情司理、作念前端開發(fā)(front-end dev)的東說念主。事實(shí)上,在 Jane Street 的大部分發(fā)展歷程中,咱們都假裝這整套 Web 網(wǎng)頁手藝從未發(fā)生過,咱們險(xiǎn)些通盤的器具都只是在結(jié)尾(terminal)里運(yùn)行。但事實(shí)講明注解,如若能畫一條直線,或者有一個(gè)器具教導(dǎo)(tool tip)之類的內(nèi)容,曲直常有用的。是以咱們踐諾上進(jìn)入了巨額資源來構(gòu)建盡頭出色的前端開發(fā)器具,并為東說念主們打造器具。領(lǐng)有了得的前端工程師——他們既是優(yōu)秀的軟件工程師,又對"如何制作一款對用戶友好的應(yīng)用"有很好的領(lǐng)路——這曲直常重要的。
對于通盤這些,我想說一個(gè)總體的、更高維度的不雅點(diǎn)(meta point):我認(rèn)為,在現(xiàn)時(shí)圍繞 AI 器具的通盤合理且真實(shí)的振作中,東說念主們或然會冷漠這一切當(dāng)中"東說念主的成分"(human element)的重要性。咱們真實(shí)盡頭敬重構(gòu)建對東說念主類有意的器具,這也包括 AI 器具自己,對吧?我認(rèn)為,以一種能夠提妙手類領(lǐng)路力、能動(dòng)性(agency)和效力的方式去鞭策器具的發(fā)展,才是最中樞的事情。適度咱們發(fā)展的最主要成分,莫過于在這里職責(zé)的了得東說念主才,以及能否找到更多合適的東說念主并擴(kuò)大組織規(guī)模,從而讓咱們能作念更多的事情。因此,在想考咱們所構(gòu)建的系統(tǒng)時(shí),咱們接納了一種盡頭以東說念主為本(human-oriented)的方式。
看你們制作這些道理的謎題和挑戰(zhàn)真實(shí)很酷。我認(rèn)為你們平時(shí)就在這樣作念,而且你們還專門為咱們播客的聽眾制作了幾個(gè)。我認(rèn)為在聽這期內(nèi)容的聽眾可能會對去望望這些謎題很感興味。趁機(jī)說一句,其中有一個(gè)謎題,不僅提交參加競賽的東說念主里莫得一個(gè)能解出來,連 Jane Street 我方也解不出來。阿誰謎題波及尋找種種內(nèi)置了觸發(fā)詞(trigger phrase)的大談話模子的后門。不管如何說,我提到這少許是因?yàn)椋缛羧蛴信d味深入了解,我認(rèn)為這些道理的謎題可能會在一定進(jìn)度上展現(xiàn)出在這里職責(zé)是什么式樣的,以及為什么這里是一個(gè)道理的地方。
是的,謎題是咱們文化中樹大根深的一部分,是以用它們當(dāng)作一種與全球設(shè)立計(jì)劃的方式真實(shí)很棒。
太好了,感謝兩位參與此次對話。
Yaron & Dan: 盡頭感謝開云世界杯官網(wǎng),咱們的幸運(yùn)。