不只OpenAI，AIGC下個十年

　　自從去年11月ChatGPT正式發布、Open AI開啟了AI新時代以來，生成式AI領域就開始如火如荼：巨頭殺紅了眼，創業公司也在力求突破。
　　從Open AI背後的金主微軟，到趕鴨子上架發布了Bard的谷歌，再到Open AI出走自立門戶的Anthropic等……目前，在生成式AI模型這個赤手可熱的風口上，矽谷還有哪些公司在摩拳擦掌，準備大幹一場呢？
　　Meta：另辟蹊徑，不做聊天做開源
　　押註元宇宙的Meta也在悄悄趕上這波生成式AI的浪潮。
　　不久前，Meta在宣布發布了自己的大語言模型LLaMa，其全名為Large Language Model Meta AI。在Facebook社交媒體上，Facebook的CEO Mark Zuckerberg宣布LLaMa「將在生成文本、對話、總結寫作材料，和更多諸如解決數學問題和預測蛋白質結構等復雜的任務中展示新的希望」。
　　Meta 的發布也很引人註目，部分原因是它避開了AI聊天機器人這一當下最熱門也最擁擠的領域。其實Meta過去曾經發布過自己的用戶側AI 聊天機器人，包括廣受批評的BlenderBot，和因為不停地製造科學廢話才三天就被下線 Galactica的機器人。不過在一篇研究論文中，Meta 聲稱 LLaMA 模型的第二小版本 LLaMA-13B「在大多數基準測試中」比 Open AI的GPT-3模型表現更好。
　　但與Open AI的ChatGPT不同，Meta發布的LLaMa並不致力於製作出用戶側的對話工具。
　　作為Meta對開放科學承諾的一部分，LLaMa旨在幫助研究人員推進他們在 AI 子領域的工作。Meta特意強調了這款模型的非商用性，「為了保持完整性並防止濫用，我們將根據專註於研究用例的非商業許可發布我們的模型。將根據具體情況授予隸屬於政府、民間社會和學術界組織的人員和世界各地的行業研究實驗室相關的權限。」
　　Meta認為，在大型語言模型空間中訓練像 LLaMA 這樣的小型基礎模型是可取的，因為它需要更少的計算能力和資源來測試新方法、驗證他人的工作和探索新的用例。基礎模型在大量未標記數據上進行訓練，這使得它們非常適合對各種任務進行微調。
　　針對大型語言模型中的偏見、有毒評論和作假的風險，Meta希望通過共享 LLaMA 的代碼，讓其他研究人員可以更輕松地限製或消除大型語言模型中這些問題。Meta還在LLaMa的論文中提供了一組語言評估模型的標準，支持在這一關鍵領域的進一步研究。
　　Open AI叛將：自立門戶，卻加入谷歌陣營
　　來自Open AI背景的研發人員成立了Anthropic。Anthropic是一家AI研究公司，由Open AI前員工於2021年創立。
　　該公司推出了名為Claude的類似ChatGPT的對話軟服務。該公司使用一種稱為Constitutional AI（條約型AI）的方法開發了聊天機器人。針對該框架，其研發團隊有一篇完整的論文，但簡而言之，Claude使用一組大約 10 條「自然語言指令或原則」來訓練語言模型，用於自動修改它的回答。根據 Anthropic 的說法，該系統的目標是在不結合人類反饋的情況下「訓練更好、更無害的人工智能助手」。
　　Anthropic的論文中的Constitutional AI的介紹，圖片來自網絡
　　他們目前提供兩個版本的 Claude：Claude 和 Claude Instant。Claude 是最先進的高性能模型，而 Claude Instant 是更輕、更便宜、更快的選擇。Claude 可通過開發人員控製臺中的聊天界面和 API 進行訪問，可以幫助處理總結、搜索、創意和協作寫作、問答、編碼等用例。
　　目前，AI 數據平臺 Scale 獲得了訪問 Claude 的權限，Scale的相關人士認為，Claude與可作為ChatGPT強勁的競爭對手，並且該機器人「更傾向於拒絕不適當的請求」。然而，相比之下Claude容易犯事實數學上錯誤。谷歌也於去年年底向Anthropic註資了3億美元。
　　創業公司：開放第三方整合，沖得更快
　　You.com 是一家由兩名前 Salesforce 員工創建的公司，自稱是「你控製的搜索引擎」。乍一看，它可能看起來像是典型的搜索引擎，但它帶有一個人工智能驅動的「聊天」工具，其工作方式與微軟在 Bing 上的試點非常相似。
　　You.com 於 2022 年 12 月首次推出了名為 YouChat 的聊天機器人，並表示它建立在公司的 C-A-L 模型之上，就像微軟的 AI 一樣，YouChat 可以為各種類型的查詢提供帶註釋的答案、創建來自網絡的文章摘要、生成代碼、撰寫論文等等。
　　除此之外，You.com 最近還添加了內置人工智能圖像生成器模型，包括 Stable Diffusion 1.5、Stable Diffusion 2.1 和 Open Journey，用戶可以使用這些模型根據書面描述生成圖像。該引擎還會對 Reddit、TripAdvisor、Wikipedia 和 YouTube 等網站上的相關結果進行分解，得到用戶更想要的答案。
　　You.com生成的猴子踢球的照片，該圖片來自網絡
　　微軟 VS 谷歌：
　　當然，還是必須得說回目前聲勢最浩大的谷歌和微軟。
　　首當其沖的是微軟。微軟作為Open AI的最大投資人和技術集成者，通過將ChatGPT的技術整合進他的網絡搜索引擎Bing中，並將新的Bing提供給測試用戶。測試用戶可以問出像「你能推薦巴黎的景點嗎？」或者想要像小紅書那樣的食譜推薦。然後收到Bing的機器人的「優秀答卷」 – 包括帶註釋的景點回復，或者是概述食譜中的配料和步驟。不過目前用戶還是發現了一些可以「玩」的漏洞，比如說一個「已經禁用」的提示，該提示會觸發Bing機器人泄露其內部昵稱Sydney，以及其開發人員為其行為設置的一些參數。盡管微軟限定了5個回答和50個問題的上限來作為這種漏洞觸發的限製，但又由於用戶的投訴放寬了這個限製。
　　此外，微軟還正式把Open AI的GPT-4模型裝進了Office套件，推出了全新的AI功能Copilot。
　　Bing的Chat交互界面，該圖片來自網絡
　　而相較之下，谷歌的發布略顯急促。搜索業務是谷歌的核心護城河，因此當ChatGPT問世時，谷歌也匆匆忙忙地發布了他們的對話型人工智能服務 – Bard。根據谷歌的CEO Sundar Pichai的描述，谷歌使用了公司內部生成的大型語言模型LaMDA來為對話式人工智能服務提供支持，該服務「利用網絡信息提供新鮮、高質量的回復。
　　Bard的官方介紹，圖片來自谷歌
　　上周Bard開啟了公測。總體來看，谷歌的Bard跟New Bing的使用模式和功能基本一致。此次Bard也為用戶提供了一個單獨的聊天界面，戶可以在文本框中進行提問和搜索，比如讓Bard幫你寫一個計劃、列一個食譜、幫你搜索一個冷知識等。但在定位上，谷歌強調 Bard 並不是其搜索引擎的替代品，而是「搜索的補充」， Bard自稱為「你具有創造力的得力協作者（Collaborator）「。
　　谷歌其實也宣布了一系列關於在自家產品線中集成AI功能的重磅更新：旗下包括包括Gmail以及Google Doc、Sheets、Slides等所有Workspace辦公組件將上線生成式AI功能，同時還開放了自家的大語言模型PaLM的 API。
　　推演和猜想：不可錯過的未來
　　那麼，為什麼各大公司都在狂熱地入場ChatGPT這樣的生成式語言技術，即使非常匆忙，甚至在技術尚未成熟時也要分一杯羹呢？
　　生成式AI無論是對企業，還是對用戶來說，可能都將帶來一系列的變革。首先，在當今的世界中，很多人都會使用手機、電腦等設備來進行內容的生產、創作和消費。這些內容覆蓋各行各業或者各種消費場景，比如說客戶服務、語言翻譯、市場分析、發郵件、電商購物甚至是寫代碼。生成式AI可以幫助人們提高內容產生的效率，並且為人們提供更有趣的交互場景。從企業視角來說，生成式AI有助於各職能的職場人提高工作效率，也有助於企業內部流程更加智能和自動化，從而節約人力成本。從用戶視角來說，各家公司更加智能化定製化的服務體系也能改善用戶在平臺上的體驗，從而提升用戶在平臺上的留存和購買力。
　　在企業競爭的維度上，由於泛用戶側的互聯網的滲透已經達到一個平緩的階段，使用互聯網用戶的規模和一天當中的使用時長相對已經固定。優先有效利用生成式AI創造多種業務場景和落地模式的公司更容易在用戶側的競爭中占據一席之地，對用戶的APP使用時長和使用場景進行再分配，甚至進一步增加用戶更多場景的滲透空間。
　　從行業版圖上看，生成式AI最終可以落地在什麼場景，最終會形成什麼樣的競爭格局，又會普惠什麼樣的人群呢？
　　我們做一些推演和猜想。
　　美國信息服務公司Gartner曾經做過一個技術成熟度曲線，非常適用於近兩年諸如元宇宙和生成式AI風口的客觀規律。當前，生成式AI處在了技術萌芽期（Technology Trigger），並隨著ChatGPT的註冊用戶數暴漲而暴露在媒體的聚光燈下。於是各大擁有算力並做過一些早期AI研發的巨頭公司開始借助這波趨勢嘗試深化和商用。但從各公司的技術成熟度上看，生成式AI還擁有諸多使用時暴露出的漏洞，既沒有找到合適的商用模式，又會面臨各國政策和隱私法律的阻礙。因此這項技術很有可能同自動駕駛或者元宇宙一樣，面臨著期望膨脹期後的泡沫破裂期。而企業競爭的幸存者會將讓他們受益的實例具體化，在復蘇期推出更加成熟的產品，最終在生產成熟期獲得廣泛的采用和更明確的生存能力標準。
　　Gartner的技術成熟度曲線，該圖片來自網絡
　　對於最終將會實現第一階段落地的商用場景，筆者認為會有如下的幾個方向：
　　1．搜索引擎的智能化：人們在搜索引擎上花費的時間可能會變長，這是由於人們可能期待更智能化的搜索答案，諸如春節的拜年短信、學生論文的模版和一些相關資料的有效聚合；能實現這一結果的搜索引擎將能迎來用戶更強的接受率；
　　2．企業的內容生產提效化：這包括市場數據的自動化收集和語義理解，還有企業員工與生產工具的交互從打字式走向對話式等等；
　　3．客服系統場景深化：諸如金融（比如銀行和原油投資管理）、電商平臺的後臺客服系統將因為生成式AI而更加智能化和場景深化，並且可以幫助企業有效節約人力成本。

報道