在人工智能領域,AGI(Artificial General Intelligence,人工通用智能)無疑是極具有挑戰性和吸引力的。在此浪潮之下,天澤智云也在系統性研究與布局工業AI,聯合創始人李杰教授作為IAI全球帶頭人更是從戰略高度思考未來與發展趨勢,圍繞工業AI的新可能為主題聯動內部戰略研討,本文是李杰教授與團隊的內部研討過程,以文字形式展現供業界探討參考。
——天澤智云聯合創始人李杰(Jay Lee)教授與團隊漫談ChatGPT類通用智能對工業智能的啟示
核心提要:
(相關資料圖)
1.通用的問答追求的或許是“海洋的可能性”,所以ChatGPT提供的答案目前看精密度不高,是“能用”(possible use),并不是“好用”(good use);而工業里更多需要“一條船的使用性”,ChatGPT在工業里目前或許只適合做“初選”。
2.工業需要的是能優化操作的生成式精密預訓練模型OperationGPPT(Operation GenerativePrecision Pre-trained Transferable model),而不是生成式的預訓練模型,其目的是要收斂到讓運營管理的績效不斷提升,而非發散地問答。
3.操作的精密預訓練模型OperationGPPT應該有三個特色:目的性,邏輯性,因果性。
4.ChatGPT值得借鑒的一個思路是,可以在工業里構建Connected AI(連接的智能)來協同作業,從而更快收斂到全局最優,來提質增效。
5.李杰教授在馬里蘭大學工業人工智能中心(Center for Industrial Artificial Intelligence,IAI Center)的最新研究動向:AI Data Foundry(工業智能數據工坊),工業智能作為一種通用量測(metrology)工具的實現,以及“One-day AI”。
這是一場來自內部的戰略研討和技術交流...
李杰( Jay Lee)天澤智云聯合創始人美國馬里蘭大學Clark Distinguished Professor
工業人工智能中心(IAI Center)創始主任
世界經濟論壇全球未來先進制造與生產委員會成員
美國制造商協會(NAM)制造執行領導委員會理事會成員
MTConnect董事會成員
麥肯錫高級顧問
天澤智云李教授,不知道您對于當前AGI(通用人工智能)在工業中的應用前景如何看呢?
AGI的應用主要還是針對有海量數據的、重復性的場景。ChatGPT給的答案只是是一個“初選”,不代表是一個“對選”。ChatGPT的問題是它的精密度不高。你自己去使用,會發現他很多錯誤,搜索三次,三次答案不一樣。所以,它對我們來講是一種幫你做初選的東西。工業界我們不希望太多的發散,希望收斂,ChatGPT基本上還是發散比較多,因為他答案會讓你意外(surprise),是吧?但我們在工業界,答案不需要意外(surprise)。
李杰 天澤智云那是不是說明,在工業界里面單純強調生成式AI,其實這個思路本身就值得去再商榷呢?
對,因為它本身是預訓練(pre-trained)的,所以你一定要有一些先驗關系標簽(prior relationshiplabel)。但是,在這種開源領域(open-sourceddomain)里面,比如搜索引擎(search engine),信息有很多冗余和噪聲(garbage),所以它能夠給你的答案會有很多可能性,反而對你沒有幫助。生成式AI的根本問題,我覺得是一個“可用”跟“有用”的問題。ChatGPT提供的答案是可用,但不見得有用。
第二個,比如你(要ChatGPT)作一首詩,你一定不知道它會作什么詩,它是一個意外(surprise)。我們工業界,你不希望是意外(surprise),你希望是更聚焦更準。因為我們領域知識(domain)已經大概知道會有幾個可能性,只是希望模型給我們做最準一點。我們會希望,越是專家,可能性越少,專家要給出更肯定的答案——“就這樣就對了”。
李杰 天澤智云不過不知道在美國有沒有選擇擁抱這類技術的工業的、制造業的公司,他們是怎么去應用這類技術,只是用它問答的能力嗎?
因為ChatGPT這類應用是一個生成式的人工智能平臺(generative AI platform),所以你可以用在幾乎任何東西,只要是能夠一直重復使用,重復相關性的組配,但是,不代表它有用。生成式的(generative)不代表配的是對的,而是說你越配越多的可能性,是“能用”(possibleuse),并不是“好用”(good use)。可是在工業界我們更要的是精密的生成式預訓練模型(Generative Precision Pre-trained Transferable model),是“GPPT”,而不是“GPT”。這是我個人的看法了。
李杰 天澤智云本質上還是海量資料的整合、總結。
對。比如我們一個學生,他用ChatGPT做作業,我們一看就看出來,為什么?因為他講的都對,但不是我上課教的,沒有用我上課的資料。我上課的資料不在ChatGPT里面。ChatGPT提供的是海洋式的可能性,但是工業我要的只是一條船的“使用性”。
這就是為什么說,工業智能如果通用化,不應單純是一個語言的生成式模型,它應該是一個操作的精密模型。操作的生成式預訓練模型(OperationGPPT)應該有三個特色:第一個是它的目的性,要產能最大,維護成本最低,這是優化的目標函數(objective function);第二個,它有它的邏輯性:什么時候該做什么,隨工況(regime)變化而變化,它一定有是由某種操作邏輯決定的;第三個,很重要的,它有因果性,好跟壞、大跟小、高跟低,它一定有因果關系。
所以說,一個是ChatGPT,一個是OperationGPPT。對比起來(編者按:如下表所示),ChatGPT是發散的,然后工業是收斂的;ChatGPT通用的可能性是很多的,而對我們工業界,領域專有的精密性要高,等等。
李杰表1AGI生成式預訓練模型ChatGPT與IAI操作優化的精密模型OperationGPPT特性對比
ChatGPT | OperationGPPT |
發散的 | 收斂的 |
提供可能性 | 聚焦使用性 |
通用 | 精密 |
明白。確實,工業領域不同的目標和要求,決定了工業領域的通用智能形態和研究的方向也會有不同。另外,不知道李教授您在馬里蘭大學的工業智能中心(Center for Industrial Artificial Intelligence,IAI Center)現在有什么新的研究動向?
我們現在在學校做三個東西。
一個就是我們的“工業AI Data Foundry(工業智能數據工坊)”,我建了一個數據群,75組到100組的數據,包括以前的PHM(故障預測與健康管理)的數據競賽(Data Challenge)的數據,我們希望訓練學生用這些數據來增加工業AI的分析能力。比如說,我從齒輪做到發動機、做到醫療、做到半導體,學生做完信心就會增加。傳統的人工智能科學(AIscience)只希望做一些數據量很大的問題,但真正工業界的AI不見得是數據量很大的問題。你要做有用的事情。
第二個,我要把工業智能建模的速度增快。我希望把工業AI變成一個量測(metrology)的觀念,將工業AI變成一個很強的量測工具,可以用來量機器好壞、量制程好壞、量人健不健康,等等,讓工業AI變成一個響應服務趨近模型(response service approximation),“RSA”。RSA是個元模型(meta-model),也是一個代理模型(surrogate model),它可以被用來量測輸入和輸出(input and output),去替代需要用很昂貴的儀器、算法計算的場景。所以,一個是新的定義,一個是新的做法。
第三個,我希望以后我們開發工業AI,能在一天之內開發完畢,叫 “One-day AI(一日智能)”,這是我的一個夢想。
李杰 天澤智云其實剛剛說的,如何能快速構建模型,也是我們的模力工場產品現在努力演進完善的一個方向。其他不知道李教授您還有補充嗎?
事實上,ChatGPT的觀念可以用在這里:因為現在的AI模型是分散的,每個應用可能都有一個AI模型,它們之間沒有串通在一起。參考ChatGPT的觀念,以后這些模型完全可以是一個“Connected AI(連接的智能)”。ConnectedAI的好處是,它可能有很強的收斂性,要“快”跟“準”。
現在每個AI都是獨立的一個智慧孤島,它們之間沒有連在一起。所以要ConnectedAI很重要,不是說只是更多的AI,更多的AI不見得有用的,而是要能夠協同(coordinated)和合作的。譬如工廠里面有刀具的AI、沖壓過程(stamping)的AI、工業機器人(robot)的AI,每個對象可能都有AI,但是基本上最后的目的還是一個質量問題、效率問題。
李杰 5月31日,\"工業互聯網專場\"等你來撩!掃碼即可報名參會