你好,游客 登录
rss订阅 手机访问 
技术资料
IndexR,一个千亿级别的实时分析数据库
舜飞的各个业务线对接全网的各大媒体及APP,从而产生大量数据,实时分析这些数据不仅仅用于监控业务的发展,还会影响产品的服务质量,直接创造价值。比如优化师要时刻关注活动的投放质量,竞价算法会根据投放数据实时调整策略,网站主会进行流量分析和快速事故反馈等等。
日期:11/07/2016 09:50:00 作者: Flow Wei
Hadoop入门扫盲:hadoop发行版介绍与选择
Hadoop发行版非常多,有Intel发行版,华为发行版、Cloudera发行版(CDH)、Hortonworks版本等,所有这些发行版均是基于Apache Hadoop衍生出来的,之所以有这么多的版本,是由于Apache Hadoop的开源协议决定的:任何人可以对其进行修改,并作为开源或商业产品发布/销售。
日期:11/04/2016 11:12:03 作者:
谷歌新论文提出神经符号机:使用弱监督在Freebase上学习语义解析器
 将深度神经网络的成功扩展到自然语言理解和符号推理上需要复杂的运算和外部的记忆。最近的神经程序诱导方法已经在尝试解决这个问题了,但这种方法通常受限于可微分的记忆
日期:11/03/2016 16:14:22 作者:
如何利用 Scoring Alias 和 AB 关联规则高效管理数据挖掘模型
随着社会的飞速发展、各行各业的商业越发激烈,为提高企业生产效率、保证其在日益激烈的环境中稳步发展,越来越多的企业借助于商业分析软件对其自身的业务进行商业挖掘以获得更好的发展,IBM SPSS 预测分析软件提供了一系列先进、易用的数据挖掘产品使得企业能够快速建立数据挖掘模型,并将其部署于实际生产环境中。
日期:11/03/2016 16:01:16 作者:吴雪丽和邵哲
Java虚拟机学习(2):垃圾收集算法
跟踪收集器采用的为集中式的管理方式,全局记录对象之间的引用状态,执行时从一些列GC Roots的对象做为起点,从这些节点向下开始进行搜索所有的引用链,当一个对象到GC Roots 没有任何引用链时,则证明此对象是不可用的。
日期:11/03/2016 15:52:36 作者:
微软重磅论文提出LightRNN:高效利用内存和计算的循环神经网络
循环神经网络(RNN)已经在许多自然语言处理任务上取得了最出色的表现,比如语言建模和机器翻译。然而当词汇量很大时,RNN 模型会变得很大(可能超过 GPU 最大的内存能力),这样训练将变得很低效。
日期:11/02/2016 11:14:56 作者:
路由追踪程序Traceroute分析与科普
 Traceroute是Linux和Mac OS等系统默认提供的路由追踪小程序,Tracert是Windows系统默认提供的路由追踪小程序。二者的功能相同,都能探测数据包从源地址到目的地址经过的路由器的IP地址。
日期:11/02/2016 11:09:44 作者:ArkTeam/YSYY
运行MongoDB微服务
 想尝试在笔记本电脑上运行MongoDB么?希望通过执行一个简单的命令,然后就有一个轻量级、自组织的沙盒么?并可再通过一条命令就可以移除所有的痕迹么?
日期:11/02/2016 09:20:01 作者:陈杰
重新思考 LinkedIn 的认证模块架构
 如果你是 LinkedIn 的用户,你一定知道它的认证系统。目前为止全球已经有数千万专业人员点击了“认证”按钮,通过他们的关系连接分享了超过100亿个技能认证。LinkedIn 上线认证系统的目的很简单——创造一种让其他人辨认人们的技能的方式。
日期:11/02/2016 09:15:08 作者:
2016年7个顶级JavaScript框架
当涉及到Web开发时,JavaScript框架往往是一些开发人员和企业最受欢迎的平台。可能,你有机会尝试过一两个顶级的JavaScript框架,但你仍然有点不确定哪个才是最佳的最值得掌握的,或者哪个值得你建议你的开发人员选择用于下一个web开发项目。
日期:11/01/2016 09:27:49 作者:mengyidan1988
【技术干货】日志漫谈:不同规模下的日志运维与优化
 企业规模不同,日志运维的方式就有所不同。在WOT2016移动互联网技术峰会上,来自新浪微博的资深系统开发工程师于炳哲,同与会者深入分析了小企业与大企业的日志运维问题,手机微博日志系统架构相关的调优,以及自己对日志运维的反思。
日期:11/01/2016 08:59:47 作者:杜美洁
基于 IBM BigInsights 的 Hadoop 多租户实践
 传统上企业内每个部门都有它自己的私有集群满足计算资源,这通常会导致平均利用率较差,也有管理多个独立的集群的负担。
日期:10/28/2016 13:21:06 作者:吴敏达
HBase 数据读写流程
 HBase的表是按行拆分为一个个 region 块儿,这些块儿被放置在各个 regionserver 中假设现在想在用户表中获取 row key 为 row0001 的用户信息,要想取得这条数据,就需要先找到含有此条记录的 region
日期:10/28/2016 10:47:01 作者:
深度增强学习实践:让Python小程序玩一款游戏,来训练神经网络
 增强学习[RL]技术是一种可用于提高效玩游戏效率的学习算法。与督导机器学习[ML]方法一样,增强学习是从数据——这里是指过去玩游戏的数据——中进行学习。
日期:10/28/2016 09:27:28 作者:readygo
MongoDB高可用集群配置
 高可用性即HA(High Availability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。
日期:10/28/2016 09:12:34 作者:邴越