长兴郴障科技有限公司

澎湃Logo
下載客戶端

登錄

  • +1

谷歌詳解如何用機器學習攻克停車難,隨時預測目的地停車狀況

澎湃新聞記者 王歆悅
2017-02-05 20:02
來源:澎湃新聞
? 10%公司 >
字號

近日,谷歌在安卓設備的更新中,為谷歌地圖新增了一項功能——預測目的地的停車狀況。

用戶只需在谷歌地圖中查詢路線,就可以看到一個新的圖標。如果谷歌預測到你所去的目的地可能有停車難的風險,你就會看到地圖上出現一個彩色的點,且附帶字母P。停車的難易程度將分為“車位有限”、“中等”和“容易”三個等級。

如果谷歌預測到你所去的目的地可能有停車難的風險,地圖上會出現彩色的點,且附帶字母P。

谷歌的一篇官方博客稱,這一功能目前已經向25個美國最大的城市地區開放。但谷歌公司正尋求在未來將該功能推廣至更多的城市和國家,以及打破平臺限制,延伸至蘋果iPhone設備上的谷歌地圖應用。

谷歌平臺上的另一個地圖應用Waze也為美國許多大城市提供類似服務,但谷歌地圖采用的方式略有不同。Waze預估停車位時采用了INRIX公司整合的停車數據信息,但谷歌聲稱其停車預測是基于用戶主動共享地理位置歷史,從而獲得的匿名數據。

2月3日,谷歌的軟件工程師James Cook、Yechen Li和研究員Ravi Kumar聯合發布了一份研究報告,詳細論述了此項應用的原理。

要提供這一停車預測功能,工程師們需要解決許多問題——停車情況復雜多變,幾乎沒有實時的停車位信息;即使有些地區有聯網的停車計時器,這些數據也不包括非法停車、許可停車和提前離開等信息;道路只能提供二維圖像,但停車場本身結構更為復雜;停車位的供需即時變動,即使是最好的系統都很可能無法及時更新。

為了解決這些問題,谷歌的團隊結合了眾包和機器學習來建立能夠提供停車難度信息的系統,甚至還能幫助用戶決策采用何種方式出行。在預發布的實驗中,他們發現出行模式按鈕的點擊量大增,這表明用戶獲得了停車難度信息之后,會更傾向于考慮公共出行方式,以取代開車。【編注:眾包,即crowdsourcing,指的是一個公司或機構把過去由員工執行的工作任務,以自由自愿的形式外包給非特定的(而且通常是大型的)大眾網絡的做法。】

要為解決停車難的問題設計算法,需要三方面技術——通過眾包的方法獲得地面實況數據、一個合適的機器學習模型,以及一個用以訓練模型的強大特征集。

地面實況數據

在機器學習解決方案中,收集高質量的實況數據一直是個關鍵挑戰。谷歌團隊采用的方法是,問司機是否遇到了停車難的問題。但是,他們很快發現,面對這樣主觀的問題,通常會得到相互矛盾的答案:對同一時間段的同一地點,有的人回答“容易”找到停車位,有的人的回答卻是“難”。換成“多久能找到停車位?”這樣的客觀問題,答案的可信度就有了很大的提高,從而能眾包產生高質量的、超過10萬個回答的實況數據集。

模型特征

有了可用數據,接下來就是選擇用來訓練模型的特征。該項目利用的是喜歡分享定位的用戶提供的匿名聚合信息,以此作為評估實時交通狀況、高流通時間段、訪問時長的關鍵信息源。

谷歌研究員在報告中稱,他們很快便發現,即便有了所需數據,還是會遇到一些獨特的挑戰。比如,如果有人在自己門前或者私人的停車位停車,系統不該錯誤地認為這里的停車位是可用的。用戶搭乘出租車到達,可能會造成門前停車很多的假象,與此類似,公共交通用戶可能會被系統認為是在公交車站停車。這些錯誤的認知,都會誤導機器學習系統。

因此,系統的設計需要更強大的聚合特征。其中一個功能的靈感就來自谷歌所在的Mountain View地區。如果谷歌導航發現大量用戶在午餐時間開著車在市中心繞圈,這就表明停車位很難找。

如果谷歌導航發現大量用戶在午餐時間開著車在市中心繞圈,這就表明停車位很難找。

谷歌的研究員在思考,如何把這些關于停車難的“蛛絲馬跡”作為一個特征來進行訓練。研究員把用戶直接到達目的地時間與繞圈、停車、步行這樣實際到達目的地的時間進行了對比,聚合了二者之間的不同。如果多數用戶在二者之間所用的時間存在顯著差異,就被認為是遇到了停車難的問題。

之后,谷歌團隊繼續開發了更多的特征:特定的目的地、散步的停車地點、停車的時間點與日期(例如,用戶在早晨會停得離目的地很近,在高峰時間會很遠,這怎么辦?)、歷史停車數據等等。最后,他們得到了大約20個不同的特征。之后,就是調整模型的表現了。

模型選擇和訓練

針對上述特征,研究員使用了一個標準的回歸機器學習模型。這種選擇有幾個原因:首先,邏輯回歸的原理是大家所熟知的,并且,在訓練數據中,它對噪音是有彈性的;第二,可以將這些模型的輸出解釋為停車難的概率,然后可以將其映射成描述性術語,如“停車位有限”或“輕松停車”;第三,很容易理解每個特定特征的影響,這使得驗證模型是否合理更加容易。例如,當研究員開始訓練時,許多人認為上述“蛛絲馬跡”的功能將是最好的方法,可以解決所遇到的難題。但實際情況并非如此,事實上,基于車位位置分散的特征才是停車難度最強大的預測因素之一。

結論

使用谷歌的模型,研究員們能夠為任何位置和時間的停車難度生成一個估算值。下圖是該系統輸出的幾個例子,用于提供給定目的地的停車難度估計。比如,星期一早上對整個城市來說都停車困難,尤其是最繁忙的金融和零售區。在星期六晚上,又會再次變得繁忙,但卻主要集中在餐廳和景點等區域。

停車難度模型在舊金山金融區和聯合廣場地區上的輸出。紅色表示有更高置信度的停車困難。上排:一個典型周一的上午8點(左)和9點(右)。下排:一個典型周六的相同時間。
    校對:余承君
    澎湃新聞報料:021-962866
    澎湃新聞,未經授權不得轉載
    +1
    收藏
    我要舉報
            查看更多

            掃碼下載澎湃新聞客戶端

            滬ICP備14003370號

            滬公網安備31010602000299號

            互聯網新聞信息服務許可證:31120170006

            增值電信業務經營許可證:滬B2-2017116

            ? 2014-2025 上海東方報業有限公司

            反饋
            澳门百家乐论谈| 好运来百家乐官网的玩法技巧和规则 | tt娱乐城注册| 玩百家乐新2娱乐城| 缅甸百家乐官网赌博现场下载 | 澳门百家乐官方网址| bet365注册哪家好 | 百家乐官网已破解的书籍| 湄潭太阳城房价| 百家乐天下第一缆| 百家乐官网赌场策略论坛| 澳门美高梅娱乐| 百家乐策略网络游戏信誉怎么样| 富二代百家乐官网的玩法技巧和规则 | 网络百家乐公式打法| 誉博百家乐官网327589| 石渠县| e利博娱乐城开户| 大发888游戏网页版| 澳门玩百家乐的玩法技巧和规则 | 易赢百家乐官网软件| 赌场百家乐官网欺诈方法| 永利高娱乐场| 百家乐赌场论坛博客| 百家乐游戏真人游戏| 百家乐制胜方法| 百家乐官网棋牌辅助| 称多县| 南通棋牌游戏中心| 百家乐筹码套装100片| 百家乐桌手机套| 属猪的人做生意摆放什么聚财| 线上百家乐官网试玩| 大理市| 宽城| 24分金| 百家乐开户百家乐技巧| 哪个百家乐玩法平台信誉好| 百家乐博彩平台| 百家乐是如何骗人的| 百家乐庄闲的概率|