互聯網地圖是如何產生的?
互聯網地圖是如何產生的?
一北京市民在交通高峰期從二里莊開車前往大望路,按常規行駛路線行走,耗時將超過1小時;某天道路 發生事故,環路堵死,在“準確”的道路上行駛,耗時未定……很顯然,地圖的“準”已不僅限于路線無誤,還須能實時動態地提醒用戶,走一條更快更省時的道 路。“準”的極致是實時,實時的基礎是動態數據,而利用動態數據則需滲入應用、云端服務、軟件、數據等地圖產業全層面。凡是“準”的地圖,必經四重境界: 數據發現、數據采集、數據處理、數據發布。
數據發現:眾里尋他千百度
大數據的一大悖論是,一款地圖產品越成熟,數據發現 的難度越高。數據越來越多,面積數據中所需成分越來越小,存精程度成倍增加。十余年,從起步到多年盤踞國內手機市場,高德逐漸形成了多種信息發現方式,包 括情報搜集平臺LSE、API軌跡分析、衛星影像自動識別、UGC反饋以及浮動車等多種方式。
在移動互聯網時代,高德地圖獨創國內眾包的 數據采集形式,主要包括浮動車和UGC反饋。安裝了車載GPS定位裝置并行駛在城市主干道上的公交汽車和出租車則是主要的浮動車。目前高德在全國擁有幾十 萬輛出租車及幾百萬輛物流車的行業浮動車數據,發現和反饋道路交通中的實時狀況。對于難以通過浮動車采集路況數據信息的城際高速,高德地圖則可以通過眾包 的力量來解決。
數據采集:千里之行 始于足下
每個采集員,都在用腳步丈量世界。不管是車輛采集、步行采集、互聯網采集,還是企業用戶、航空攝影測量及衛星影像、呼叫中心,千里之行都始于足下。目前高德擁有幾十輛數據采集車,能夠收集電子眼、方向信息、道路名稱、車道數、行車標線等道路信息。
最 原始的采集方式是步行采集,工作人員手持PDA和相機前往商廈、學校、商場、銀行等場所拍攝照片,再錄入到數據采集系統。雖然高德擁有國家甲級導航電子地 圖測繪資質,但采集員在進行步行采集時仍會面臨“轟出門”的遭遇,比如銀行,他們甚至誤以為采集員是要打劫銀行。
由于新浪微博、阿里巴巴 等企業LBS業務均采用高德地圖數據,通過這張撒在互聯網上的“網”,高德得以收到大量來自用戶的反饋——這是基于互聯網的采集方式。據了解,每位高德 “增值事業部”員工每天能夠處理150條左右的報錯反饋,每月可處理約2300條報錯反饋。
通過物流公司運輸車輛上的GPS導航儀,同樣可以發回數據,這是企業用戶數據采集。如今有30多萬輛物流車在給高德回傳數據,使得高德能夠及時更新數據,讓地圖數據更加準確;與此同時,北京有6萬輛出租車使用高德導航服務,并傳回大量數據。
租借飛機進行航空攝影測量是采集中最高端的做法,目前市場上提供商用的三維地圖主要是衛片(衛星拍攝),其分辨率近50公分。目前高德已經為56個城市繪制了超過7500平方公里的三維模型,精度為厘米級別,通過航拍和實采完成。
數據處理:千錘萬鑿出深山
所 有道路數據都是高德采集員一個一個跑出來的?;蛟S,用一些令人嘆為觀止的數據更能讓你感受到這個過程的艱巨。目前,高德累計生產了超過400種道路屬性信 息、超過7500平方公里三維模型數據、近5000萬個POI地標信息,以及近520萬公里導航道路數據——可環繞地球赤道達130周之多。
數 據處理可分為導航數據生產和增值數據生產。在導航數據生產中,值得一提的是背景生產。“背景”是指除了道路和建筑之外的山、河、湖、水等“為導航作背景襯 托”的物體。增值數據生產包括了運營POI和深度動態信息。所謂運營 POI是指給相關POI信息做專頁,比如在地圖上集中展示北京的中國銀行,這可以幫 助POI更直接地展示信息。而深度動態信息,則指詳細展示POI點的信息,比如對于一家酒店,不僅僅是導航到這里,而且展示其文字介紹、房價、電話等,同 時也展示基于位置的優惠等服務信息。
數據發布:輕舟已過萬重山
地圖的極致是實時更新。每分鐘用戶正在行駛的道路發生什么變化,會對我的行駛有何影響,這都是需要基于快速的數據迭代才能實現。面向車廠,高德主要月度發布;面向互聯網,這種數據迭代已經需要小時級發布;面對移動互聯網,甚至能做到以分鐘級更新。
經過眾里尋他的“發現”、始于足下的“收集”、千錘萬鑿的“處理”,等到發布過程,發現輕舟已過萬重山——數據分秒流逝,車輛行人分秒流逝。高德發布的數據主要面對車載/前裝、無線位置服務、移動導航、互聯網位置服務以及政府及企業應用等市場。
在移動導航領域,用戶需要數據夠重、產品夠輕,尤其是面向消費級的移動App。易觀數據顯示,截至2014年第二季度,高德地圖標注以33.4%的份額穩居手機地圖市場第一,這是高德地圖標注繼2011年第四季度超越谷歌地圖標注后,連續十一個季度領跑中國手機地圖市場。