大数据应用案例:迅雷年度下载报告,百度人口迁移
“大数据”是最近几年才流行起来的一个关键字,大数据离我们并非那么遥远,看看大数据的应用。
近日,中国互联网下载及云计算服务领域巨头迅雷对外发布了《迅数榜2013年度中国互联网下载报告》,并公布了全国各省级行政区下载峰值速度排行。据报告称,2013年全国整体的平均下载峰值速度为737.4KB/S,较2013年年初提升了14%,其中港、澳、台下载峰值速度仍然居于全国前列,香港以2974.5 KB/S夺得第一,台湾以1668 KB/S 位居第二,上海则以1190.3 KB/S 的速度在内地省级地区中继续移居第一,北京以970.2 KB/S 紧追其后。
迅雷年度下载报告
另外,在运营商方面,中国电信和联通加起来占据了全国90% 的用户量,但是在下载速度上,中国联通和中国电信分别以725.6 KB/S 和723.9 KB/S 的下载峰值速度落后于长城宽带等区域性运营商,以长城宽带为代表的区域性运营商整体平均下载峰值速度领先于三大全国性运营商,这其中有全国性运营商用户量庞大但区域发展不均衡、实施普惠性政策等的原因,也有区域性运营商地区运营力度大、提速降价的市场策略的原因。
迅雷年度下载报告
而从全国大区域下载峰值速度对比来看,南北方下载峰值速度相差不大,电信、联通下载峰值速度趋向均衡。在北方,中国移动宽带后发优势明显,起点较高,同时加大了光纤入户的市场推广,网络下载平均速度暂时明显领跑。从东、中、西部的地域走势来看,下载峰值速度呈顺序递减走势,这与三个地区的经济发展水平紧密相关。移动的下载峰值速度是个例外,由于移动的用户基数少,且其基础网络比较新,大多使用 LAN 或者光纤方式接入,所以从数据上看下载峰值速度明显偏高。
从用户单次下载行为数据分析来看,人均单次下载的文件大小,超过100MB的有16个省级行政区,而超过200MB的省级行政区有5个,全国的人均单次下载文件大小为113MB,其中山西的人均单次下载文件大小为651MB,为全国之最。
根据对迅雷下载视频资源的数据分析,目前标清视频资源的下载文件数量占62%,而低清仍占26% 多,高清及全高清资源已占12%。从去年12月份的数据与2013年度数据的对比可以发现,高清和全高清视频的占比已稳步提升,这说明随着网络带宽的增长,用户对高清视频等为代表的大容量数据的需求愈来愈明显。
“百度迁徙”技术揭秘:利用LBS大数据定位功能
迁徙人群绝大多数是手机网民,可以通过LBS定位技术实现对其迁徙路径的追踪。
1月25日晚间,央视与百度合作,启用百度地图定位可视化大数据播报春节人口迁徙情况,该项目利用百度LBS定位数据进行计算分析,展现春节前后人口大迁徙轨迹与特征。
春运是全球范围内最大规模短期人口迁移活动之一,通讯则是人们在迁徙过程中最基本需求之一,迁徙人群绝大多数是手机网民,因此手机网民与迁徙人群重合度极高。百度通过云计算平台数据处理能力,加上精准定位,能实现全面、即时反映人口迁徙状况。
那么,“百度迁徙”具体如何实现,迁徙过程中有哪些特点?百度LBS技术总监顾维灏对腾讯科技解读,称可直接看到全国包括铁路、公路和航空在内的线路,点击图上任何一个点,如成都,可看到成都迁入、迁出最热的城市及成都迁入与迁出最热城市排行榜。
“百度迁徙”技术功能包括几方面,第一个是全国迁徙的区域带,第二是热门线路分析,包括迁入迁出和热省分析、选定城市分析、时间维度分析。移动地图的价值是通过知道每个人的位置,提供差异化服务。“百度迁徙”是定位数据中创新出来的新产品。
地图应用第二个价值是商圈分析,比如中关村的商圈,通过地图可以看到一些购物中心人非常多,一些购物中心的人流量并不是很大,这些数据可以帮助优化商圈更好配置资源。
地图应用第三个价值是驾车导航轨迹的挖掘。比如从百度到国家会议中心有三条路,这三条路的驾驶时间不一样。两条蓝色的路基本驾驶时间是20分钟,红色的路是18分钟,通过对地图数据进行对比分析后,可以帮助用户挖掘出最优出行道路,避开拥堵。
顾维灏指出,百度能做出“百度迁徙”产品,很重要的原因是,百度过去几年大规模对云计算的投入,拥有很大的数据中心、有自主设计服务器,能把数以亿级,数以千亿级的数据实时、安全存储下来,在这些基础上建立云计算,有海量数据处理大规模的调度软件。
“大数据真正价值是我们能在数据里发现知识,发现信息。”顾维灏说,百度LBS部门会在百度大数据分析基础上,挖掘LBS特有数据和特有知识,如挖掘POI知识库,挖掘路网信息,挖掘路况预测、智能导航。交通变动只是大数据的一个开始。
据悉,《晚间新闻》节目报道播出后,“百度迁徙”已于今日正式上线对普通网民开放,所有网民都可以访问该专题页面,通过可视化大数据的方式了解全国春运的最新动态,包括当前全国春运最热的线路,最热门的迁出城市、迁入城市等等,百度已开放这些数据。