长兴郴障科技有限公司

澎湃Logo
下载客户端

登录

  • 3
  • +1
    1

稚暉君剛挖來的90后機器人大牛:逆襲履歷堪比爽文男主

关注
2025-04-03 17:14
北京
来源:澎湃新聞·澎湃號·湃客
字号

一水 發自 凹非寺

量子位 | 公眾號 QbitAI

剛剛,稚暉君旗下創企智元機器人官宣了兩個新動向——

一則是關于人事變動。

具身智能領域的國際領軍學者羅劍嵐博士,已于近日加盟并出任首席科學家。

羅劍嵐在該領域已深耕10年,曾擔任Google X、Google DeepMind研究科學家,是UC伯克利17萬引大佬Sergey Levine團隊的核心成員。

他曾參與打造世界上首個超人類的機器人真機強化學習系統SERL/HIL-SERL——首次實現將任務成功率提升到100%,在全球范圍內被廣泛應用。

接下來他將牽頭組建「智元具身智能研究中心」,主導前沿算法研發與工程化落地。

另一則是關于公司新合作。

國際頂尖具身智能公司Physical Intelligence(Pi)正式和智元機器人達成合作伙伴關系,雙方將圍繞動態環境下的長周期復雜任務,在具身智能領域展開深度技術合作。

以及實屬罕見的是,在競逐AI、機器人以及軟硬件的最前沿陣地,中美兩家明星公司,竟然聯手了。

稚暉君挖來具身智能領域大佬

羅劍嵐,出生于1993年,本科畢業于武漢理工大學汽車學院。其后在AI和機器人重鎮UC伯克利,拿到了博士學位。

從2015年開始,也是在機器人學習領域初步興起的階段,他就投身了機器人研究當中。

過程中,他逐漸將目光放在了將強化學習應用到真實機器人這一細分領域。

在積攢了一波學術經驗后,2020年他毅然選擇踏入工業界,進入谷歌多個機器人部門任職,包括Google X、DeepMind等。

在此期間,他與機器人學習領域的泰斗Stefan Schaal教授進行了一系列合作,主要學習了更多從底層動力學到上層控制的機器人系統知識。

值得一提的是,Stefan Schaal教授是UC伯克利機器人領域的領軍專家,曾多次與李飛飛共同發表論文。

兩年時間,當他所參與的項目被孵化為工業機器人創企Intrinsic后,他重新回到了伯克利從事博士后研究,師從 Sergey Levine。

Sergey Levine是UC伯克利電氣工程和計算機科學系的副教授,專注于能夠使Autonomous Agents通過學習獲得復雜行為的算法,特別是能夠使任何自主系統學習解決任何任務的通用方法。

Sergey Levine因兩件事而聲名遠播。

一是他是領域內的大神,不僅谷歌學術被引用量為超過12.7萬,還是不折不扣的頂會狂魔。

此前的不完全統計中,Sergey Levine 2018年在ML和NLP頂會上共發表22篇論文;ICML 2019,他參與論文數量排名第三;NeurIPS 2019、NeurIPS 2020,他均有12篇論文被接收……

其二,他屬于UC伯克利的網紅教授,此前推出的深度學習課程Deep Reinforcement Learning(課程代號CS 285)非常受歡迎。

回到羅劍嵐,正是在回歸學術界的這一時間,他參與產出了“強化學習+真機”這條路線上具有代表性的兩篇論文:SERL和HiI SERL。

SERL/HIL-SERL作為世界上首個超人類的機器人真機強化學習系統,首次實現將任務成功率提升到100%, 在全球范圍內被廣泛應用。

具體而言,在SERL這項研究中,機器人能用20分鐘學會裝配電路板,成功率達到了100%。

這一結果真實驗證了強化學習的有效性,而在這之前,該方法一直受到行業詬病。

至于HIL-SERL,則是基于SERL的升級版。不過與SERL僅依賴人類的示范不同,HIL-SERL還結合了人類的糾正來訓練強化學習策略。

實驗結果顯示,使用強化學習框架HIL-SERL,研究者可以直接在現實世界中訓練基于視覺的通用機器人操作策略。

其中,機器人經過1~2.5小時的訓練后,就能完成主板、儀表盤以及正時皮帶組裝等操作任務。

更重要的是,成功率也是100%。

手握上述重要機器人學習技術,羅劍嵐博士這次又選擇加入智元投身工業落地。

中美明星具身智能公司,罕見聯手

與此同時,智元機器人這次也選擇了和一家國外同行開展合作。

Physical Intelligence,去年3月官宣亮相的美國明星創業公司,其團隊全是一群機器人和AI大佬,聯合創始人就有羅劍嵐博士后研究期間的導師Sergey Levine。

據了解,這家公司在去年11月完成了4億美元的A輪融資,融資后估值為20億美元,主要投資者包括亞馬遜創始人貝索斯、OpenAI、Thrive Capital等知名公司或投資機構。

關于智元為什么會選擇這家公司合作的原因,可能還要從Physical Intelligence所推出的產品或技術來追蹤。

就在今年2月底,這家公司推出了“分層交互式機器人”(Hi Robot)系統,它能夠將視覺-語言-行動(VLA)模型,如π0 ,納入一個分層推理過程。

劃重點,分層推理。

面對“如何讓機器人能像人類一樣執行復雜任務”這個行業難題,Physical Intelligence早已明確給出答案:

讓機器人學會以系統 2思維進行思考

合理推測,未來兩家可能會在讓機器人學會推理方面展開深度合作。

另外,據智元介紹,雙方的合作已經初有成效,可以實現一個通用模型根據不同的指令輸入執行多個任務。

同時也可以適配多種末端執行器,包括靈巧手、平行夾爪和旋轉夾爪,并兼容魚眼和針孔相機等多種傳感器。

官方演示demo如下:

可以看到,視頻中的智元機器人能完成在鏡子前戴上圍巾、換垃圾袋,將物品從傳送帶移入物流箱等覆蓋家庭和工業場景的多元復雜任務。

整體而言,對行業來說,兩家明星具身智能公司的強強聯合,不僅蘊藏了大模型推理技術在機器人領域的垂直應用趨勢,而且還將進一步加速機器人真實落地家用場景。

One More Thing

當然,對于智元今日的人才大新聞,背后還有一段傳奇佳話。

本科畢業于武漢理工的羅劍嵐,實際也上演了一段“爽文男主”人生。

因為從中國一所211大學本科,能夠拿到UC伯克利競爭激烈的王牌專業offer,并且碩博連讀,每年5萬美元獎學金!羅劍嵐的故事堪稱傳奇,甚至被專門報道過。

據《長江日報》2015年報道稱,當年UC伯克利的機器人方向博士生競爭非常激烈,收到了全球1500份申請,而招生名額僅有30個,最后羅劍嵐成功脫穎而出,還打破了紀錄——成為唯一一位被機器人和智能機器實驗室錄取的中國人。

在采訪中,羅劍嵐坦承自己因為在科研項目中關注到UC伯克利分校卡澤洛尼教授領銜的實驗,其后有緣又在天津舉辦的機器人研究國際會議上,獲得了直接向卡澤洛尼教授發問的機會,并進一步在會后遞上了自己的簡歷,向教授明確表達:“我想讀您的研究生!”

卡澤洛尼也被年輕本科生的履歷吸引。據介紹,羅劍嵐從大二開始就跟著武漢理工大學的導師田哲文做項目,發表了4篇核心期刊論文,參加全國和省級重大科研項目有5個,還獲得了美國數學建模比賽一等獎。

卡澤洛尼教授給他的回答是:“或許我能有機會讓你到伯克利來。”

也正是這句認可,點燃了羅劍嵐心底的火苗。

回到武漢后,他又花了大半年時間,利用別人打游戲的時間,啃下了卡澤洛尼教授實驗室發表的100多萬字的學術資料。

其后2014年8月,羅劍嵐更是上演了一段“孤身飛赴韓國追教授”的瘋狂。

他查到卡澤洛尼教授將赴韓國參加一場有關機器人的國際會議,隨即辦好簽證就追了過去。并在貴賓室外,等到了卡澤洛尼教授如廁的機會,再次表達了希望跟隨讀研讀博的想法。

卡澤洛尼記得羅劍嵐:哦,你住在首爾?

羅劍嵐回答:不!我住在中國武漢,我來這里見您,就是希望讀您的研究生!

而且也是在這次會議上,羅劍嵐的半年苦功也換來了回報,他獲得提問機會,把幾個月來的思考化成幾個刁鉆的問題拋給了教授,卡澤洛尼會后再次找到他給出認可:“小伙子,不出意外,我想,我要把你帶到伯克利。”

于是回國后,羅劍嵐繼續與卡澤洛尼教授聯系,并附上自己的思考,通過電子郵件給對方發了過去。卡澤洛尼教授告訴他:你寫的每篇綜述我都看了七八遍,我不敢相信這是一位來自中國的本科生所寫。

而也是在卡澤洛尼教授力薦下,羅劍嵐在2015年夏天收到了加州大學伯克利分校的offer。

機器人和智能機器實驗室,每年5萬美元獎學金,從全球1500份簡歷中脫穎而出,成為了當年唯一一位被該頂級實驗室錄取的中國人。

參考鏈接:

[1]http://auto.whut.edu.cn/xyh/xywh/201912/t20191227_429864.shtml

[2]https://x.com/physical_int/status/1894829058883731962

[3]https://agibot-world.cn/collaboration

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    1
    收藏
    我要举报
    评论(3)
    发表
    已经到底了
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2025 上海东方报业有限公司

            反馈
            娱乐城体验金| 澳门百家乐有赢钱的吗| 太阳城二手房| 百家乐官网开闲几率| 百家乐官网出牌规| 路单百家乐的玩法技巧和规则| 宾利娱乐城| 噢门百家乐注码技巧| 宜君县| 百家乐必赢外挂软件| 百家乐官网怎么计算概率| 柬埔寨百家乐的玩法技巧和规则 | 真人游戏 role/play| 金龍百家乐官网的玩法技巧和规则 | 澳门百家乐官网一把决战输赢| 济州岛百家乐的玩法技巧和规则| 网上百家乐官网分析软件| 五星百家乐的玩法技巧和规则| 做生意戴什么珠子招财| 百家乐官网| bet365娱乐场下载| 百家乐必胜软件下载| 12倍百家乐官网秘籍| 大发888娱乐城娱乐城| 百家乐博彩网址| 永利百家乐官网的玩法技巧和规则| 东辽县| 全讯网新3| 百家乐交流群号| 真人百家乐官网平台下载| 哪个百家乐投注好| 打百家乐官网纯打庄的方法| 百家乐官网桌布小| 太阳城百家乐官网优惠| 大发888电话多少| 介绍百家乐赌博技巧| 百家乐桌子北京| 菲律宾百家乐开户| 百家乐视频聊天软件| 百家乐官网英皇娱乐网| 库伦旗|