跟央视合作的百度地图“百度迁徙”的数据从何而来?

人浏览 | 条讨论 | 次分享 | 添加时间:2014-03-04 14:18:33

 

杨大兴

跟央视合作的百度地图“百度迁徙”的数据从何而来?

 

1.数据从哪里来?

数据是从百度地图开放平台上得来的,所有使用百度地图API的移动应用,都是其中的一分子,这里面可能有墨迹天气等应用。

 

2.样本量有多大?

具体数字不方便说,但是绝对是亿级。并且因为并没有特别一致的标签能将所有用户分类,所以用的是全量数据,因此用户手机每一次定位请求都在分析的范围内。大家能看到这个地图上有着“八小时数据迁徙地图”,其实最开始是想做半个小时内的数据变化,后来发现连百度地图自己的服务器都扛不住如此大规模的全样分析。一步步的妥协,考虑到效果和带宽,最后才定格在了八小时。

 

3.它是怎么挖掘出迁徙数据的?

这个产品的核心在于数据量的扎实,覆盖面很广,采用了全量分析而非抽样分析。同一个手机如果上一次请求在北京,下一次请求在东莞,那么就是地图上的一条线。

 

——快刀青衣

收藏文章
分享到:

本期封面COVER

封面故事:98期
98期
出版日期:2015-12-28