你好,游客 登录
rss订阅 手机访问 
技术资料
联通大数据能力开放平台容器化实践
中国联通大数据能力开放平台为支撑公司内部数据运营和外部数据合作提供了丰富的框架资源、数据资源、多样化的组件和工具以及应用部署环境。
日期:12/02/2016 14:50:26 作者:
基于用户画像的实时异步化视频推荐系统
前言
这个月做的事情还是蛮多的。上线了一个百台规模的ES集群,还设计开发了一套实时推荐系统。 标题有点长,其实是为了突出该推荐系统的三个亮点,一个是实时,一个是基于用户画像去做的,一个是异步化。
实时主要体现在三个层面:
用户画像中的的短期兴趣模型实时构建。
也就是你看完一个视频,这个视频几秒内就影响了你的短期兴趣模型,并且反应...
日期:12/02/2016 14:50:05 作者:
数据可视化工具总结
作者:温如
链接:https://zhuanlan.zhihu.com/p/24089938
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
提要: plotly R ggplot2 无需编程语言的工具(7个) 基于JavaScript实现的工具(8个) 基于其他语言的工具(5个) 地图数据可视化工具(8个) 金融(股票)数据可视化工具(2个) 时间轴数据可视化工具(2个)...
日期:12/02/2016 14:49:31 作者:
基于 DevOps 理念的私有 PaaS 平台实践
作者简介:
刘亚丹  YY 互动娱乐事业部运维经理
负责YY互娱事业部的基础运维平台建设管理工作,8年互联网运维从业经验、经历服务器从数百到数千的规模,走过从手工运维到自动化平台化运维方式转变,积极拥抱云计算大潮,推行 Web 类业务迈向虚拟化云化的基础设施,致力于 PaaS运维平台的 ITIL理念与 DevOps 理念融合、对云形态下的互联网企业运维平台建设管理有...
日期:12/02/2016 14:41:23 作者:
微服务框架的存储架构
web应用从单点向高并发架构演变时往往遇到最大的问题就是数据库的分布式存储。因为web应用本身就可以集群部署,但其所使用的数据库确是单点的。如果一个web应用开始的时候没有考虑数据库的分布式架构,那么等到要进行数据库集群改造时会发现困难重重,此时通常的做法是将原系统拆分成多个子系统,然后每个子系统访问一个数据库,这几乎重写了整个系统(如果这还不能满足需求...
日期:12/02/2016 14:40:20 作者:
盘点十大隐藏在Python中的彩蛋
正则表达式是Python的一大特色,但是调试起来会很痛苦,很容易得出一个bug。幸运的是,Python可以打印出正则表达式的解析树,通过re.debug来显示re.compile的完整过程。
日期:12/02/2016 14:39:52 作者:
基于容器的后端服务架构
在探索kubernetes的应用时,调研了几个gateway,发现fabio支持发现服务,自动生成路由,结合consul,registrator, 可以很容易的部署一套服务,比较轻量,很容易玩起来。结构大致为:
日期:12/02/2016 14:39:34 作者:
饱汉不知饿汉饥、会编程的不懂初学者的苦
黄哥为啥写这么吸引眼球的标题,其实要说清楚下面的事。
日期:12/02/2016 14:39:10 作者:
你应该知道的9款流行 Web 框架及其优缺点
对于 Web 开发人员来说,找到一些合适的工具,能让工作轻松许多。这其中,Web 框架更是提升工作效率的“利器”。但因为可选的 Web 框架非常多,如何选择也是一件令人头疼的事情。
日期:12/02/2016 14:38:36 作者:
如何评价 MXNet 被亚马逊AWS 选为官方深度学习平台
昨日,亚马逊 CTO Werner Vogels 在博文中写到 MXNet 被 AWS 正式选择成为其云计算的官方深度学习平台。Vogels 表示:
日期:11/25/2016 14:00:28 作者:
6个用于大数据处理分析的最好工具
大数据是一个含义广泛的术语,是指数据集,如此庞大而复杂的,他们需要专门设计的硬件和软件工具进行处理。该数据集通常是万亿或EB的大小。这些数据集收集自各种各样的来源:传感器,气候信息,公开的信息,如杂志,报纸,文章。大数据产生的其他例子包括购买交易记录,网络日志,病历,军事监控,视频和图像档案,及大型电子商务。
日期:11/25/2016 14:00:13 作者:
【揭秘】腾讯云数智98.8秒完成100TB数据排序的架构和算法
上周,腾讯云大数据联合团队以98.8秒的成绩完成100TB数据排序,摘得2016 Sort Benchmark全球排序竞赛冠军。在这次竞赛中,腾讯云数智分布式计算平台分别夺得Sort Benchmark大赛GraySort和Minutesort的冠军,创造了四项世界纪录。(了解详情请点击《全球计算奥运冠军花落腾讯,腾讯云数智打破4项世界纪录》)
日期:11/25/2016 13:59:55 作者:
流动的推荐系统——兴趣Feed技术架构与实现
引用
作者:陈开江@刑无刀,金融科技公司天农科技CTO,曾任新浪微博资深推荐算法工程师,考拉FM算法主管,先后负责微博反垃圾、基础数据挖掘、智能客服平台、个性化推荐等产品的后端算法研发,为考拉FM从零构建了个性化音频推荐系统。
本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2017年《程序员》
流动的推荐系统
我们经常谈论的...
日期:11/25/2016 13:46:27 作者:
优步工程团队对容器化MySQL的应用
优步工程团队的Schemaless存储系统驱动着优步内部一些最大规模的服务,例如Mezzanine。Schemaless是一种基于MySQL[1]集群的可缩放、高可用数据存储。当我们最初只有16个集群时,这些集群的管理工作相当简单,但是目前我们有超过1000个集群,其中承载了超过4000个数据库服务器,我们的管理工具也需要与时俱进了。
日期:11/25/2016 13:44:57 作者:
用Node.js实现机器学习中的K最近邻分类算法
1. 简介
源于数据挖掘的一个作业, 这里用Node.js来实现一下这个机器学习中最简单的算法之一k-nearest-neighbor算法(k最近邻分类法)。 k-nearest-neighbor-classifier
还是先严谨的介绍下。急切学习法(eager learner)是在接受待分类的新元组之前就构造了分类模型,学习后的模型已经就绪,急着对未知的元组进行分类,所以称为急切学习法,诸如决策树归纳,贝叶斯...
日期:11/25/2016 13:44:29 作者: