9月5日,國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》(簡稱《綱要》),系統(tǒng)部署大數(shù)據(jù)發(fā)展工作,并提出:率先在交通等領(lǐng)域,實現(xiàn)公共數(shù)據(jù)資源合理適度向社會開放,帶動社會公眾開展大數(shù)據(jù)增值性、公益性開發(fā)和創(chuàng)新應(yīng)用,充分釋放數(shù)據(jù)紅利。
近年來,隨著智能交通、智慧城市等概念的不斷推進(jìn),城市交通領(lǐng)域已經(jīng)具有較為成熟的數(shù)據(jù)采集和應(yīng)用技術(shù)基礎(chǔ)。促進(jìn)大數(shù)據(jù)發(fā)展,為 “互聯(lián)網(wǎng) +”時代下城市交通提供了發(fā)展新思路:一方面,大數(shù)據(jù)技術(shù)的應(yīng)用為提升公共服務(wù)水平、促進(jìn)產(chǎn)業(yè)創(chuàng)新提供了新的機遇;另一方面,大數(shù)據(jù)技術(shù)也為政府提升交通治理能力、緩解城市交通資源壓力提供了新途徑。
數(shù)據(jù)為城市交通“畫像”
今年5月,羅蘭貝格管理咨詢公司發(fā)布了《移動互聯(lián)下的城市綜合出行變革》報告,對中國城市交通現(xiàn)狀尤其是移動互聯(lián)技術(shù)帶來的出行變革進(jìn)行了解讀。報告中提到,預(yù)計到 2020 年,中國出租車數(shù)量將達(dá)到 138 萬輛,公交車數(shù)量達(dá)到 57 萬輛,私家車數(shù)量達(dá)到 1.76 億輛。
海量的交通參與者也將帶來海量的交通數(shù)據(jù)。在大數(shù)據(jù)時代,由于信息搜集、處理和分析技術(shù)的進(jìn)步,可以更為快捷地獲取或分析規(guī)劃所需要的各項傳統(tǒng)基礎(chǔ)數(shù)據(jù)。城市交通所需要的各項基礎(chǔ)數(shù)據(jù)將以“月”、“天”、“小時”甚至是“秒”為單位而被獲取、分析和呈現(xiàn)。
另一方面,隨著移動互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,以及個性化、差異化的交通出行不斷增多,城市交通蘊含的數(shù)據(jù)也將從單一的數(shù)據(jù)模式向更多層次、多元化的模式轉(zhuǎn)變。6 月,滴滴快的成立了大數(shù)據(jù)機器學(xué)習(xí)研究院,在用戶畫像系統(tǒng)、智能匹配、需求預(yù)測系統(tǒng)和運能預(yù)測系統(tǒng)等方面做了大量研究。該研究院高級研究員胡堯表示,對數(shù)據(jù)的分析,這是數(shù)據(jù)交通產(chǎn)業(yè)鏈的關(guān)鍵。
滴滴出行副總裁張貝
其中,“用戶畫像”是移動互聯(lián)網(wǎng)企業(yè)津津樂道的一項技能。對出行類 APP 而言,通過對用戶出行習(xí)慣、消費習(xí)慣、評價行為等多維度數(shù)據(jù)進(jìn)行分析,實現(xiàn)精準(zhǔn)營銷。
同樣,源自不同方式、不同層次的交通數(shù)據(jù)可以為城市交通的組織運行規(guī)律“畫像”,從而實現(xiàn)精準(zhǔn)地服務(wù)與管理。例如,結(jié)合地鐵與公交的運營數(shù)據(jù),合理安排不同交通方式銜接;結(jié)合突發(fā)事件下道路交通的運營規(guī)律,妥善安排交通管制措施等。
滴滴:深諳數(shù)據(jù)與城市交通的淵源
提及滴滴出行,大多數(shù)人都會先想到網(wǎng)約出租車,事實上在背后支撐這一新事物發(fā)展的卻是體量龐大的交通大數(shù)據(jù)。正如滴滴出行副總裁張貝所說,滴滴出行發(fā)展到今天,擁有七千名員工,其中大半都是產(chǎn)品、技術(shù)研發(fā)人員,尤其是大數(shù)據(jù)分析師等?吹贸鰜,滴滴出行一直很重視大數(shù)據(jù)的運用,并堅持發(fā)展大數(shù)據(jù)構(gòu)建技術(shù),只為可以讓司機提供給乘客更加美好的乘車體驗。
“從最早用 80 萬人民幣創(chuàng)業(yè)起,滴滴那時并談不上什么大數(shù)據(jù)技術(shù),甚至連基本功能都不完善。經(jīng)常司機搶單都沒反應(yīng),動不動手機就死機,后來整個推翻重做,重寫軟件架構(gòu),不斷優(yōu)化,先是解決了司機搶單的問題。當(dāng)然那會還有各種不完善,比如流量問題。前兩年 3G、4G 技術(shù)并不完善,司機一天在軟件上就要用掉 40M 流量,滴滴被司機們說是流量騙子,雖然有各種各樣的不足,正因為有這些教訓(xùn),滴滴認(rèn)識到未來一定是技術(shù)驅(qū)動大數(shù)據(jù)應(yīng)用。”張貝說到,“當(dāng)時很多投資人問各種打車軟件的創(chuàng)業(yè)者,你們認(rèn)為打車軟件未來的核心競爭力是什么?有人說搶占司機資源,形成壁壘;有人說補貼用戶,贏得市場。這些都很重要,但滴滴一直堅定認(rèn)為,未來核心競爭力在技術(shù)和大數(shù)據(jù)。”
事實上,滴滴出行一直都面臨著大數(shù)據(jù)領(lǐng)域中世界級的難題和挑戰(zhàn),但有難度就有機遇。
對此,張貝認(rèn)為難題解決好就是技術(shù)優(yōu)勢,也是競爭優(yōu)勢!澳壳,滴滴有 4 億的注冊用戶,超過 1500 萬的司機,每天超過 2000 萬的訂單。每個司機、用戶 3 秒鐘上傳一次位置數(shù)據(jù),每天有 130 億次定位數(shù)據(jù)存儲,原始的數(shù)據(jù)存儲量是 70TB,經(jīng)過轉(zhuǎn)存、處理之后的數(shù)據(jù)還要乘以 10,達(dá)到 700TB,還有超過 90 億次的路徑規(guī)劃計算?傮w用戶規(guī)模從中美對比來看,中國人多、用戶多,超過百萬的城市我們有 140 個,美國只有 9 個,相差 16 倍。而且中國打車人多,公交發(fā)展不適應(yīng)用戶需求,而打車很便宜,開車反而成本更高,還有限行、限購的限制。中國現(xiàn)在每天兩千萬訂單,美國和加拿大的出行市場每天 125 萬訂單,也是相差 16 倍。因此滴滴大數(shù)據(jù)處理面臨的問題是世界級的,要求瞬時處理海量的數(shù)據(jù),并且在非常復(fù)雜的城市路網(wǎng)上解決不平衡供需匹配的問題,要求有很高的處理能力。”
從交通領(lǐng)域看,滴滴的訂單量已經(jīng)是全球最大的移動出行平臺。從跨領(lǐng)域比較來看,滴滴出行的訂單量僅次于淘寶,已經(jīng)超過京東;從復(fù)雜度來比較,淘寶的雙十一購物節(jié)會產(chǎn)生龐大的數(shù)據(jù)量,同時也需要有瞬時海量處理大數(shù)據(jù)的能力。這一點是滴滴出行需要認(rèn)真學(xué)習(xí)的。
然而,將電商和出行進(jìn)行對比的話,電商的每一單計算量其實是比較小的。人們在網(wǎng)上下單,賣家接單,數(shù)據(jù)庫里這個產(chǎn)品庫存減 1,然后記錄用戶的地址,線下配送,完成交易。而在移動出行領(lǐng)域,每個司機、每個用戶都是拿著手機不斷移動,且這種移動將會影響滴滴出行派單。 “每天兩千萬訂單簡單除一下,每秒要處理幾百個訂單。每個訂單分給哪個司機?在大城市,如果司機在第一時間錯過了派單地址,也許這會讓他兜回來很遠(yuǎn)的路才能繞回目的地,這樣一來,再給他派單就沒有任何意義,可以說這是復(fù)雜的動態(tài)問題,也是超 Np-hard 問題。我們后來發(fā)現(xiàn)每個訂單的計算量相比于電商是它的 10 倍,每個訂單背后有復(fù)雜的算法,體現(xiàn)模型優(yōu)化的結(jié)果,而且是短短一兩秒之內(nèi)實現(xiàn)的!睋(jù)張貝所言,交通領(lǐng)域的大數(shù)據(jù)可謂是龐大而復(fù)雜,但又意義重大。 “
舉例來說,出租車司機一般都會挑機場比較遠(yuǎn)的單,短途一般沒有人響應(yīng)。后來,我們利用上線滴米規(guī)則,即司機接長途訂單就減滴米分,搶短途單就獎勵滴米分,這樣便解決了問題。此外,滴滴還經(jīng)歷了從搶單到派單的演變過程。從最早上線搶單,相比優(yōu)步的派單法,滴滴認(rèn)為適應(yīng)實際情況更好的方式才能走得更遠(yuǎn)。從數(shù)據(jù)來看,在用戶需求區(qū)域 2 公里附近畫個圈,讓圈里50~100名司機搶單就OK,其實完全不是這樣。我們發(fā)現(xiàn)一開始司機喜歡搶單,因為他比較自由,自己掌握。我們也嘗試派單,我們給司機端加一個按鈕,他可以選擇搶單或者派單。后來,越來越多司機發(fā)現(xiàn),系統(tǒng)優(yōu)化比自己搶單效率更高。多等 10 分鐘不見得能搶到更好的訂單,還浪費了時間。通過大數(shù)據(jù)分析,滴滴能夠?qū)Τ丝瓦M(jìn)行有效識別,有的司機每天早上 8 點固定接送孩子上學(xué),就在這個幼兒園或者小學(xué)附近。我們在前一天晚上就把這個幼兒園或者小學(xué)附近早上 8 點的訂單精準(zhǔn)推送給他,這就實現(xiàn)了系統(tǒng)最優(yōu)和個體最優(yōu)的結(jié)合,司機也很喜歡,美好一天從滴滴接第一單開始。隨著大數(shù)據(jù)技術(shù)的提高,精準(zhǔn)派單,司機越來越信任平臺,80%~90% 的司機自發(fā)接受派單。后來我們改成全部派單,再后來改成急速接單,只派給一個司機,只需要 3 秒,司機端自動響應(yīng)。乘客更加便利,司機信任平臺,我們都信任大數(shù)據(jù)計算,這就是最優(yōu)的結(jié)果,實現(xiàn)系統(tǒng)最優(yōu)和個體最優(yōu)的結(jié)果。”張貝指出。
為了幫助司機提高效率,滴滴出行制作出了司機可以看到的實時供需熱力圖,并實時推送給司機,讓大家了解哪個地方的需求更多,最終主動實現(xiàn)供需平衡。簡單來說,通過智能分單技術(shù)實現(xiàn)平臺效率提升和優(yōu)化。
滴滴大數(shù)據(jù)得以充分利用,目前滴滴出行已發(fā)展到計算分析出智能推薦上車點來預(yù)測用戶的行為,并且同步告訴司機。“現(xiàn)在超過 50% 的叫車都是在室內(nèi),大部分乘客是等車到了才出門。因此,我們預(yù)測用戶到哪里等車,是小區(qū)西門還是東門,這樣司機和乘客之間不用總是打電話,你知道準(zhǔn)確的上車地點就好。我們看到現(xiàn)在有 23% 的訂單是不打電話的,比以前下降了 3%(以前是 26%)!睆堌愓f到,另一方面,滴滴滴出行還可以智能預(yù)測出用戶的目的地點。當(dāng)乘客打開滴滴時,預(yù)測地點將直接放到菜單第一列,減少輸入時間,方便乘客使用,一鍵實現(xiàn)打車叫滴滴!斑@些數(shù)據(jù)是動態(tài)的,在不同的地點,根據(jù)你的出行情況,你想去的地點是不一樣的。對于用戶常用的地址,對高頻用戶我們第一列可以猜中 35%,對低頻用戶我們第一列可以猜中 25%,再加上第二列或者第三列,我們能夠預(yù)測用戶 90% 的常用地點。所有這些都是基于大數(shù)據(jù)的預(yù)測,讓用戶更加方便,也節(jié)省用戶的時間。”
最后,張貝還介紹了滴滴服務(wù)分制度,并在今年 6 月份上線使用。滴滴出行將接單、接駕、送客行程后的評價分為四大維度、100 多個細(xì)項、 24 小時更新,轉(zhuǎn)化為服務(wù)分。服務(wù)分越高,系統(tǒng)就越優(yōu)先派單,這是總體的原則。“實際上,這其中包含了非常復(fù)雜的數(shù)據(jù)算法,我們知道就派單規(guī)則而言,并不是簡單地將訂單派給最近的司機,這里面還主要考慮了服務(wù)分因素。比如較遠(yuǎn)的訂單(并不是很遠(yuǎn)的那種),服務(wù)分越高的司機,乘客便更喜歡。但是,必須將其控制在一定度范圍內(nèi),太遠(yuǎn)的訂單會導(dǎo)致接駕時間過長,這樣一來司機的被取消率升高。那這究竟該如何平衡?此時大數(shù)據(jù)便起到非常重要的作用。我們構(gòu)建多個機器學(xué)習(xí)的模型,輸入不同的維度,讓機器來平衡,通過不同的模型讓大數(shù)據(jù)自動優(yōu)化。服務(wù)分高一點,但是又不能太遠(yuǎn),我們找 1 萬個訂單、100 萬個訂單,讓機器按照不同模型學(xué)習(xí),根據(jù)這個結(jié)果優(yōu)化!睆堌愓f道。
總而言之,滴滴出行效率的提升,也將大幅提升整座城市的交通效率。而這其中的效率變化,是由大數(shù)據(jù)的運用與分析直接影響形成的。
讓公交出行更科學(xué)、更合理
優(yōu)先發(fā)展公共交通已經(jīng)成為國家發(fā)展戰(zhàn)略,但是,傳統(tǒng)公交車不準(zhǔn)點、乘車擁擠等問題影響了市民的出行體驗。為了滿足市民對公共交通不同層次的需要,深圳鼓勵推出了“協(xié)議定制班車”,而滴滴巴士等“互聯(lián)網(wǎng)+”公交產(chǎn)生的新型公交形式,提升了公共交通的吸引力。
106 路要優(yōu)化線路、107 路要減少平峰車輛班次、105 路要增加站點……從今年年初開始,余姚市交通運輸管理所優(yōu)化配置公交資源,調(diào)整 36 條公交線路,一年預(yù)計節(jié)約運營投入 100 余萬元,而這一切都有科學(xué)依據(jù) -- 一本匯集了每一輛公交車“作息安排”數(shù)據(jù)的調(diào)研報告。
自 2012 年余姚城鄉(xiāng)客運一體化改革以來,到 2014 年,余姚公交線路運營相對成熟,較好滿足城鄉(xiāng)居民出行需求,但也出現(xiàn)些許問題。比如,據(jù)統(tǒng)計,有些城鄉(xiāng)公交每天的載客率不到 50%,更有甚者,如 612 路,從天下玉苑—雙溪口水庫,日發(fā) 2 班次客流量基本為 0,部分公交資源過度浪費,亟待解決。
于是,余姚市交管所積極發(fā)動所有公交司機的力量,對全市 105 條公交線路實際運行情況進(jìn)行了摸底調(diào)查,記錄下每條公交線路的道路狀況、站點設(shè)置、運力投放、班次安排、高低峰時間客流、各站點客流等基礎(chǔ)資料,形成了《運營線路擬優(yōu)化調(diào)整報告》,為科學(xué)規(guī)劃公交線路、合理安排車輛、班次,提高公交資源利用率,提供決策依據(jù)。
用數(shù)據(jù)說話,更有說服力,效果也更有保障。比如從大嵐發(fā)往龍?zhí)兜?632 路公交車,原本是 2 輛營運車,10 個班次,但載客率不到 30%,而現(xiàn)在減少一輛營運車,優(yōu)化發(fā)車時間后,不但不影響居民出行,反而提升了載客率,公交運力資源得到高效利用。再如,山區(qū)乘坐公交車的大多都是老年人,而且出行時間主要集中在早晚高峰,一般都是去鎮(zhèn)里買菜,所以這些線路的班次就充分根據(jù)事實規(guī)律,減少平峰班次,滿足群眾高峰出行的實際需求。
“公交是一種大眾化的交通出行工具,任何一條公交線路都不可能滿足該線路上每個乘車群眾的出行需求,所以每條公交線路投入的資源都應(yīng)該是科學(xué)高效的,我們一直在努力優(yōu)化調(diào)整公交線路,擴(kuò)大公交覆蓋區(qū)域,使公交線路運行更優(yōu)化、更全面、更科學(xué)。”余姚市交管所相關(guān)負(fù)責(zé)人表示。
除此之外,北京公交集團(tuán)運營的 1020 條線路將更加“智能”,通過大數(shù)據(jù)進(jìn)行線路優(yōu)化,根據(jù)客流情況安排運力,減少乘客等待時間,提高準(zhǔn)點率。
北京公交集團(tuán)目前已在所有公交車上安裝了 GPS,通過數(shù)據(jù)共享,可以通過手機 APP 進(jìn)行公交查詢,未來將更多基于“互聯(lián)網(wǎng)+”提升公交服務(wù)。
線路設(shè)計方面,將利用大數(shù)據(jù)輔助分析客流情況。北京市每天有超過 1000 萬公交客流,乘客上下車刷卡的記錄可以研判客流出行規(guī)律。集團(tuán)會根據(jù)客流規(guī)律布局或者調(diào)整線路。
運力安排方面,通過公交車實時運行數(shù)據(jù)調(diào)整運營時間和計劃。比如,某路車過去計劃單程運行時間是 50 分鐘。但因為堵車,可能 60 分鐘才能到,運力在堵車中自然消失了。今后將可以根據(jù)實時大數(shù)據(jù)情況,按照 60 分鐘來配備運力、增加車次,使乘客等候時間減少。
“智能化公交”成為集團(tuán)的關(guān)鍵詞。一是依據(jù)海量公交 IC 卡資源,建立“公交信息云平臺”,為乘客提供出行信息服務(wù)。二是運用互聯(lián)網(wǎng)提供智能化服務(wù)。三是引入手機、手環(huán)等支付方式,使公交移動支付方式更加多樣。
|