自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

姜兴琪的博客

种一棵树最好的时间是十年前,其次是现在

  • 博客(20)
  • 资源 (3)
  • 论坛 (4)
  • 收藏
  • 关注

原创 漫画:什么是加密算法?

程序员小灰一群喜爱编程技术和算法的小仓鼠。加密算法的历史加密算法最早诞生在什么时候?是在计算机出现之后吗?不不不,早在古罗马时期,加密算法就被应用于战争当中。在大规模的战争中,部队之间常常需要信使往来,传递重要的军事情报。可是,一旦信使被敌军抓获,重要的军事情报就完全暴露给了敌...

2019-12-31 21:09:28 3662

转载 10亿计算下的合约广告,如何做个性化投放?

一、导言合约保量广告(Guaranteed Delivery)是一种常见的品牌展示广告采买方式,现有的技术解决方案通常是在人群粒度上对问题进行抽象和建模,这种建模方式一方面忽略了相同人群下用户行为的差异,另一方面无法对用户粒度的约束进行精确的控制。目前学术界关于合约广告流量分配问题的研究,通常会将这个问题抽象为合约侧-供给侧的二部图匹配问题,但目前的分配策略是停留在人群和标签粒度上,这要求...

2019-12-31 15:23:24 2983

转载 优酷 DSP 广告投放系统架构实践

导读:随着 RTB 网络在线展现广告交易模式的兴起,各大公司都纷纷搭建自己的 DSP ( Demand-Side Platform ) 广告投放系统进行获客。优酷在近几年也搭建 DSP 系统,并且在持续迭代。在这一过程中,经历哪些技术探索?趟过哪些坑?有怎样的技术方案沉淀?下面我将从技术视角分享出来,希望对大家有启发。——业务目标——DSP 的核心目标就是用户增长,通过广告拉新和召回,提升...

2019-12-30 11:28:57 2585

转载 快手7亿用户增长实践

导读:用户增长近年成为非常火热的方向,但目前业内关于短视频领域的用户增长的公开实践资料却凤毛麟角。在 QCon 上海 2019 的演讲中,快手资深研发工程师叶邦宇首次系统地披露快手作为短视频领域巨头在用户增长方面的实践, 并着重介绍快手用户增长的技术体系和技术沉淀。用户增长的方法论可以简单概括为开源 + 节流, 也就是促拉新 + 提留存。而促拉新中,触达是前提,分享和裂变是重点。提留...

2019-12-27 15:22:58 3827 1

原创 如何从零起步学习AI

所谓万丈高楼平地起,搞数据科学、机器学习或深度学习,一开始至少得学会跟计算机打交道吧,怎么跟计算机打交道呢?编程。第一步:学习编程 实话说,计算机体系很庞大,除了语言、数据机构、算法之外,计算机体系结构、操作系统、网络、数据库等等领域庞大。但不管怎样,学习如何编写代码、如何编程是必需的。学完语言、数据结构、算法等基础知识后,如何更进一步提高编程能力呢?上LeetCode刷题成为很多人...

2019-12-27 11:07:21 2074

原创 什么是人工智能?人工智能、机器学习、深度学习三者之间有什么关系吗?

说起人工智能,我们总能听到一些其他的关键词,例如:机器学习、深度学习、数据挖掘、数据分析等等。那么到底什么是人工智能?人工智能又与这些词有什么直接或间接的关系呢?今天小编将就这个问题给大家献上一波涨姿势科普,让大家对这个近年来大火的科技有一个初步的了解。首先,我们来说说人工智能、机器学习、深度学习三者的关系先上一张图,概括一下它们三者的关系:从图片上我们可以发现,就范围而言:人...

2019-12-26 14:44:04 6502

转载 十分钟搞懂HTTP和HTTPS协议

什么是协议?网络协议是计算机之间为了实现网络通信而达成的一种“约定”或者”规则“,有了这种”约定“,不同厂商的生产设备,以及不同操作系统组成的计算机之间,就可以实现通信。HTTP协议是什么?HTTP协议是超文本传输协议的缩写,英文是Hyper Text Transfer Protocol。它是从WEB服务器传输超文本标记语言(HTML)到本地浏览器的传送协议。设计HTTP最初的目的...

2019-12-25 19:39:43 1554 4

原创 特征工程之特征预处理

在前面我们分别讨论了特征工程中的特征选择与特征表达,本文我们来讨论特征预处理的相关问题。主要包括特征的归一化和标准化,异常特征样本清洗与样本数据不平衡问题的处理。1. 特征的标准化和归一化由于标准化和归一化这两个词经常混用,所以本文不再区别标准化和归一化,而通过具体的标准化和归一化方法来区别具体的预处理操作。z-score标准化:这是最常见的特征预处理方式,基本所有的线性模型在拟合的时...

2019-12-24 19:36:38 1833

转载 海归王垠 V.S. 阿里P10赵海平,不对等面试所引起的争议

近日,“阿里P10赵海平面试王垠”引发程序员业内争议。此前,王垠受邀请去阿里巴巴面试,面试官是P10(研究员)的赵海平。王垠称在整个面试的过程,赵海平根本不是在发掘一个人的才能,而是质疑简历,同时贬损其博客内容,并且在面试中大谈“P vs NP”(计算机领域的超级难题)的说教。最终由于负面反馈,没能入职阿里。但是赵海平则称,王垠应该把自己最拿手最出彩的工作分享给面试官,详细解释为什么难,为什么...

2019-12-23 21:11:40 15209 7

原创 Spark运行第一个Scala程序WordCount

1、前置条件安装hadoop:https://blog.csdn.net/jxq0816/article/details/78736449scala:https://www.runoob.com/scala/scala-install.html2、Idea安装Scala插件3、代码object ScalaWordCount { def main(args: Array[St...

2019-12-23 17:37:26 1818

原创 XGBoost算法原理小结

在两年半之前作过梯度提升树(GBDT)原理小结,但是对GBDT的算法库XGBoost没有单独拿出来分析。虽然XGBoost是GBDT的一种高效实现,但是里面也加入了很多独有的思路和方法,值得单独讲一讲。因此讨论的时候,我会重点分析和GBDT不同的地方。本文主要参考了XGBoost的论文和陈天奇的PPT。1. 从GBDT到XGBoost作为GBDT的高效实现,XGBoost是一个上限特别...

2019-12-12 18:13:44 1841 1

原创 化繁为简:推荐算法三视角

关于推荐系统,如果在忘掉所有的公式和代码,忘记所有的语言描述,脑海里就剩下几张图景,会是什么?一张二维表格,一个拓扑图,一条时间线。这三幅图景,是我看待推荐算法的三种视角。视角一:矩阵视角在脑中想象一个二维的表格,每一行代表一个用户,每一列代表一个物品,表格里的每一个点代表用户对物品的操作,这个操作可以是评分,点击,点赞。其中,有些格子记录了行为,有些格子是空的。到这里,我们就建立了基本的...

2019-12-12 18:12:54 2356

转载 腾讯信息流内容理解技术实践

导读:目前信息流推荐中使用的内容理解技术,主要有两部分构成:1. 门户时代和搜索时代遗留的技术积累:分类、关键词以及知识图谱相关技术;2. 深度学习带来的技术福利:embedding。但是分类对于兴趣点刻画太粗,实体又容易引起推荐多样性问题,而 embedding 技术又面临难以解释的问题。这次主要介绍在信息流推荐中,腾讯是如何做内容理解克服上述问题的。主要包括: 项目背景 ...

2019-12-12 14:04:54 2138

原创 化繁为简:推荐算法三视角

关于推荐系统,如果在忘掉所有的公式和代码,忘记所有的语言描述,脑海里就剩下几张图景,会是什么?一张二维表格,一个拓扑图,一条时间线。这三幅图景,是我看待推荐算法的三种视角。视角一:矩阵视角在脑中想象一个二维的表格,每一行代表一个用户,每一列代表一个物品,表格里的每一个点代表用户对物品的操作,这个操作可以是评分,点击,点赞。其中,有些格子记录了行为,有些格子是空的。到这里,我们就建立了基本的...

2019-12-09 19:10:59 1762

原创 机器学习实战 | 特征选择

简 介据《福布斯》报道,每天大约会有 250 万字节的数据被产生。然后,可以使用数据科学和机器学习技术对这些数据进行分析,以便提供分析和作出预测。尽管在大多数情况下,在开始任何统计分析之前,需要先对最初收集的数据进行预处理。有许多不同的原因导致需要进行预处理分析,例如: 收集的数据格式不对(如 SQL 数据库、JSON、CSV 等) 缺失值和异常值 标准化 ...

2019-12-06 22:16:40 1553

转载 在线学习在爱奇艺信息流推荐业务中的探索与实践

概述爱奇艺的信息流推荐业务每天会产生数十亿规模的feed浏览,如此大规模的数据给模型训练带来了很大的挑战。同时,信息流这类用户与推荐系统的强交互场景也引入了很多有趣的研究课题。对于信息流推荐产品来说,用户和产品交互性高,用户兴趣变化也很快。若模型不能及时更新,排序模型部署上线后,性能会缓慢下降。而对于排序模型来说,如何用较低成本完成百亿样本、千亿参数DNN排序模型的及时更新是需要解决的首要问题...

2019-12-06 20:56:39 1825

原创 XGBoost类库使用小结

在XGBoost算法原理小结中,我们讨论了XGBoost的算法原理,这一片我们讨论如何使用XGBoost的Python类库,以及一些重要参数的意义和调参思路。本文主要参考了XGBoost的Python文档和XGBoost的参数文档。1. XGBoost类库概述XGBoost除了支持Python外,也支持R,Java等语言。本文关注于Python的XGBoost类库,安装使用"pip...

2019-12-05 12:25:35 1554 1

原创 使用中文维基百科语料库训练一个word2vec模型并使用说明

本篇主要介绍如何通过中文维基百科语料库来训练一个word2vec模型。相关资料下载:中文维基百科下载地址:https://dumps.wikimedia.org/zhwiki/WikiExtractor项目git地址:https://github.com/attardi/wikiextractorOpenCC项目git地址:https://github.com/BYVoid/Ope...

2019-12-04 11:02:59 1864

原创 NLP自然语言处理中句子相似度计算

在做自然语言处理的过程中,现在智能对话比较火,例如智能客服,智能家电,智能音箱等,我们需要获取用户说话的意图,方便做出正确的回答,这里面就涉及到句子相似度计算的问题,那么本节就来了解一下怎么样来用 Python 实现句子相似度的计算。相似度方法编辑距离编辑距离,英文叫做 Edit Distance,又称 Levenshtein 距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作...

2019-12-03 21:37:32 1576

原创 浅析Hbase

无论是 NoSQL,还是大数据领域,HBase 都是非常"炙热"的一门数据库。本文将对 HBase 做一些基础性的介绍,旨在入门。一、简介HBase 是一个开源的、面向列的非关系型分布式数据库,目前是Hadoop体系中非常关键的一部分。在最初,HBase是基于谷歌的 BigTable 原型实现的,许多技术来自于Fay Chang在2006年所撰写的Google论文"BigTable"。与 ...

2019-12-02 11:33:05 1577

astah破解工具

MAC:右键选择【astah professional.app】,选择显示包内容,然后依次进入【Contents】-【Java】文件夹,直接将原有文件替换掉即可,

2018-12-26

navicate 破解补丁最新版本

2017-01-16

navicate 破解补丁

1、将该文件copy到 navicate.exe的同一文件夹 2、点击patchNavicate.exe 3、选择navicate.exe文件 4、成功破解

2016-01-20

weekingqi的留言板

发表于 2020-01-02 最后回复 2020-01-22

文本框只能输入数字

发表于 2014-02-15 最后回复 2014-02-16

java 文字旋转

发表于 2012-12-20 最后回复 2012-12-26

骑士游历

发表于 2012-08-10 最后回复 2012-12-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除