长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

谷歌將“大模型”裝進手機里

2023-10-27 12:05
來源:澎湃新聞·澎湃號·湃客
字號

作者:金旺

2023年上半年,科技領域最熱不過大模型;

2023年下半年,大模型開始集體“上山下鄉(xiāng)”,進入行業(yè)、深入硬件。

端側(cè)大模型,就是在這時開始成為一個重要研究方向。

這其中,谷歌在今年2月發(fā)布對標ChatGPT的Bard后,在前不久"made by Google"的硬件發(fā)布會上,正式將大模型相關(guān)技術(shù)下沉到了Pixel 8 Pro上。

“買手機送大模型”,也成了業(yè)界送給谷歌Pixel 8系列手機最好的推廣文案。

Bard下沉到端側(cè)

2016年,谷歌CEO Sundar Pichai在made by Google大會上正式宣布,谷歌從“Mobile First”轉(zhuǎn)向“AI First”,AI由此成為了谷歌的主旋律。

僅僅一年后,谷歌就對外發(fā)布了為大模型埋下伏筆的Transformer架構(gòu),造就了后來OpenAI的崛起,以及如今大模型時代的到來。

同樣是基于Transformer架構(gòu)的Bard在今年2月正式發(fā)布后,行業(yè)內(nèi)開始高度關(guān)注這一模型。

一是關(guān)注這一模型是否能夠迎頭趕上風頭正盛的ChatGPT,二是關(guān)注谷歌將如何應用這一模型。

畢竟,谷歌有著世界上最優(yōu)秀的工程師團隊和工程師文化,曾在過往互聯(lián)網(wǎng)熱潮中,研發(fā)出了幾乎統(tǒng)治了搜索引擎江湖的Google搜索引擎,在移動互聯(lián)網(wǎng)時代,又憑借Android承載了移動互聯(lián)網(wǎng)生態(tài)的半壁江山。

今年9月,就在谷歌這場硬件發(fā)布會之前,Bard產(chǎn)品總監(jiān)Yury Pinsky在官方博客中透露,Bard已經(jīng)可以連接到用戶的Google應用服務,以實現(xiàn)針對用戶本人的定制化AI服務。

在這篇博文中,他指出,Bard可以從用戶每天使用的諸如Gmail、YouTube、谷歌云盤、谷歌地圖等服務中獲取信息,甚至可以跨應用獲取信息,來提供千人千面的個人AI助手的能力。

例如,如果你和你的朋友正在籌備一場去大峽谷的旅行,你就可以通過自然語言與Bard交互,讓它為你做這樣一個規(guī)劃。

Bard在收到指令后,會通過查閱Gmail郵箱中信息來找到適合每個人的出行日期,通過查找實時航班和酒店信息,和前往機場的谷歌地圖路線,甚至觀查閱機場活動的YouTube視頻,來為你規(guī)劃好整個形成。

同樣是在這篇博文中,Yury Pinsky還提到了另一項功能——多人交互。

當有人通過向你分享了他與Bard的聊天時,你可以接著他的對話內(nèi)容,繼續(xù)與Bard交互。

顯然,更符合這些功能的應用場景實際上是在移動端,這樣的應用研究,正是谷歌在為Bard下沉到端側(cè)做準備。

實際上,就在這篇博文發(fā)布兩周后,2023年10月4日,谷歌"made by Google"硬件發(fā)布會在紐約正式召開。

在這場硬件發(fā)布會上,谷歌不僅發(fā)布了Pixel 8手機,還將大模型正式下沉到了端側(cè)手機上。

端側(cè)大模型,用處幾何?

在今年的made by Google大會上,谷歌高級副總裁Rick Osterloh一上場就表示,“谷歌聚焦讓AI變得對每個人都更有用。”

至于如何讓AI變得對每個人都更有用,谷歌的做法是,做一款將軟件、硬件和AI整合在一起的手機,也就是谷歌Pixel手機。

2023年大模型這么熱,谷歌也在端側(cè)大模型應用上做出了些花樣。

首先,在和Fitbit聯(lián)動時,生成式AI可以作為你的運動健康小助理,告訴你,你今天之所以跑步會比往常感覺更困難,是因為你今天選擇的路線更崎嶇、有更多的爬升。

與此同時,生成式AI還會根據(jù)你的問題,為你輸出含有圖表的詳細分析報告。

其次,谷歌再次提及自家語音助手時,也特別強調(diào)加入引入了Bard。

Google Assistant負責人Sissie Hsiao在發(fā)布會上表示,引入Bard后,Google Assistant將個性化功能與大模型的推理能力、生成能力相結(jié)合,可以實現(xiàn)聽、說、影響處理能力的全面升級。

Sissie Hsiao在發(fā)布會上通過一系列提問為我們展示了端側(cè)大模型的功能:

1、她告訴手機上的Bard“查看本周所有未讀郵件”,隨后,Bard幫她整理出收件箱中未讀郵件,并整理出相關(guān)郵件的概要,其中有一封關(guān)于派對邀請的郵件;

2、她接著問Bard“這個派對的地址在哪”,Bard通過訪問手機上的谷歌地圖,為用戶提供出這一派對的具體位置;

3、她繼續(xù)追問Bard“到這個派對需要多長時間”,Bard就會進一步在谷歌地圖上給出路線信息。

與此同時,在手機上,Bard依然擁有大模型所有該有的文字處理和文字生成能力,這些能力也成了谷歌這代手機的一大亮點。

人均大模型時代開啟

當然,在這場硬件發(fā)布會上,谷歌還公布了一系列其他加入AI魔力的實用功能。

例如可以讓你免于騷擾電話侵擾的Call Screen。

當有電話接入你的手機時,你的語音助手會先請對方說明來意,如果對方也是一個機器人,闡述的信息被識別為垃圾信息,會主動回絕并將來電信息和相關(guān)來意一并顯示在用戶屏幕上。

例如可以為你用手機拍攝的視頻消除背景噪音的Audio Magic Eraser。

當你視頻中有不是你需要的背景噪音時,通過這一加入生成式AI能力的功能,可以直接將這些背景噪音擦除。

再比如,可以為你P圖的Best Take。

當你在為朋友拍照時,只需要多拍幾張照片,當有某個或某些人表情不到位或有閉眼時,通過這一功能就可以篩選其他合適的表情直接替換。

此外,谷歌在Pixel 8 Pro中通過融合更強大的攝像頭、Tensor G3和計算音頻的能力,引入了視頻增強(Video Boost)功能,通過谷歌云端計算攝影模型對每一幀圖像進行處理,從而得到更漂亮的視頻。

也是在發(fā)布會上,谷歌Pixel產(chǎn)品總監(jiān)Shenaz Zack也指出,“得益于谷歌數(shù)據(jù)中心模型(data center models),谷歌提升了Video Boost功能,改善了Google assistant的能力。”

這樣看來,端側(cè)大模型要想用起來,依然需要云端大模型提供助力。

Rick Osterloh指出,“谷歌人工智能團隊正在嘗試基于生成式AI改變現(xiàn)在我們看到的一切。”

尤其是輸入法中的文字修正功能、長文章的摘要整理功能,未來在大模型的加持下,將會在潛移默化中逐漸被大家頻繁使用。

對于谷歌來說,更重要的是,谷歌認為,Pixel 8 Pro是第一款搭載端側(cè)大模型的手機。

這將注定讓谷歌再次載入史冊。

    本文為澎湃號作者或機構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機構(gòu)觀點,不代表澎湃新聞的觀點或立場,澎湃新聞僅提供信息發(fā)布平臺。申請澎湃號請用電腦訪問http://renzheng.thepaper.cn。

    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網(wǎng)安備31010602000299號

            互聯(lián)網(wǎng)新聞信息服務許可證:31120170006

            增值電信業(yè)務經(jīng)營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業(yè)有限公司

            反饋
            大发888平台下载| 百家乐长庄投注| 全讯网程序| 博必发百家乐官网的玩法技巧和规则 | 棋牌| 中原百家乐的玩法技巧和规则 | 佛山市| 最好的百家乐投注| 百家乐官网赢钱绝技| 百家乐庄家抽水的秘密| 乐享百家乐官网的玩法技巧和规则 | 博狗玩百家乐好吗| 皇冠网vip小说| 姚记百家乐的玩法技巧和规则| 百家乐官网开户百家乐官网技巧| 太子百家乐官网娱乐城| 界首市| 全讯网hg055.com| 子山午向的房子24山图| 真人百家乐官网赌博技巧| 网上有百家乐玩吗| 做生意风水关键吗| 百家乐官网只打闲打法| 百乐门娱乐城注册| 尊龙百家乐娱乐| 优博百家乐yobo88| 百家乐官网娱乐平台会员注册| 大西洋娱乐城开户地址| 网上百家乐真钱游戏| 百家乐游戏全讯网2| 百家乐官网真人视频出售| 神州百家乐官网的玩法技巧和规则 | 大发888怎么了| 宁波水果机遥控器| 百家乐统计软件| 澳门百家乐规律星期娱乐城博彩| 奥斯卡百家乐官网的玩法技巧和规则 | 黄金城百家乐苹果版| 百家乐赌马| 百家乐出千的方法| 做生意如何风水|