自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shiter编写程序的艺术

大数据生态圈,计算机视觉,机器学习,高端技术的爱好者,话不多说,上代码!!!...

原创 老王和他的IT界朋友们----交流渠道

既然 来了就都是我们的朋友,一路都在狂奔不止,感谢大家能花费宝贵的时间在这里驻足停留,老王会不遗余力的带给你美好。 也许,我们会有停杯投箸不能食的时候,也有拔剑四顾心茫然的时候,干啥啥不顺,调啥啥不通,仿佛生活欺骗了你,此时此刻,彼时彼刻,脑海中只要浮现几个词:坚持,不忘初心。

2020-08-02 22:29:06 246 0

原创 《自然语言处理实战入门》 文本检索与信息抽取 ---- 信息抽取初探

文章目录基本介绍一、传统信息抽取关键词抽取关键句子抽取二、深度学习信息抽取总结 基本介绍 信息抽取 (Information Extraction) 是把文本中包含的信息进行结构化处理,变成表格一样的组织形式。 信息抽取的主要任务是将各种各样的信息点从文档中抽取出来。然后以统一的形式集成在一起...

2020-08-26 23:52:02 199 0

原创 手把手教你买基金----读书笔记

基金投资要诀: 他强由他强,清风拂山岗; 他横由他横,明月照大江; 他自狠来他自恶,我自一口真气足。

2020-08-21 00:45:51 1317 1

原创 《自然语言处理实战入门》文本检索与信息抽取 ---- 关键词抽取

文章大纲章节目录参考文档 章节目录 《自然语言处理实战入门》 文本检索---- 初探 常用的检索算法有根据余弦相似度进行检索,Jaccard系数,海灵格-巴塔恰亚距离和BM25相关性评分。 (1)余弦(cosine)相似度,用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比...

2020-08-14 13:12:11 117 0

原创 PCA主成分分析(完结)

人有时候走着走着,放不下的东西太多,就会迷失自己。其实回归初心,换一个角度去看待问题,一切就变得豁然开朗了。PCA的思想是把过度关联在一起事务视为“噪声”,认为它们干扰试听,并占据不必要...

2020-08-13 12:40:41 168 0

原创 《自然语言处理实战入门》第三章 :中文分词原理及相关组件简介 ---- 分词算法原理(HMM)

文章大概序列标注概率图模型隐马尔可夫模型(Hidden Markov Model,HMM)维特比算法参考文献 序列标注 作为序列标注算法系列文章的第一篇,我们首先看看什么是序列标注问题? “数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。 在自然语言...

2020-08-08 08:09:11 145 0

原创 过去的日子我们这样娱乐过8.0

从前有一个程序员,在他上学的时候,不好好看书,在他毕业的时候也就只能成天写点hello world,后来他希望能做点大事,于是总是抬头仰望星空,别人以为他在祈求上苍赐予机会,但我想,可能...

2020-08-07 14:12:08 161 0

原创 那是一次不俗的旅程

2013年8月的早些时候,我跟组长说我不干了,要去上学。组长当时的表情好像中了500万又被告知彩票过期了一样尴尬。公司公费旅游去张家界,不去还要扣工资,我于是只好辞职收拾好行囊踏上了这...

2020-08-07 13:58:11 259 1

原创 PCA主成分分析(下)

美,是在高潮处陡然消逝,不落凡尘。数学中的美,是不是也是寻找那个导数为零的极值点?实际问题中,我们认为凸型函数是函数中是相对完美而且最容易求极值点的。哦……可惜数学实际上没那么多想象的浪...

2020-08-06 07:07:50 106 0

提示
确定要删除当前文章?
取消 删除