自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shiter编写程序的艺术

大数据生态圈,计算机视觉,机器学习,高端技术的爱好者,话不多说,上代码!!!...

原创 老王和他的IT界朋友们----交流渠道

既然 来了就都是我们的朋友,一路都在狂奔不止,感谢大家能花费宝贵的时间在这里驻足停留,老王会不遗余力的带给你美好。 也许,我们会有停杯投箸不能食的时候,也有拔剑四顾心茫然的时候,干啥啥不顺,调啥啥不通,仿佛生活欺骗了你,此时此刻,彼时彼刻,脑海中只要浮现几个词:坚持,不忘初心。

2020-08-02 22:29:06 246 0

原创 从前有一个程序员,成天写代码,后来。。。

每天你都有机会和很多人擦身而过,而你或者对他们一无所知,不过也许有一天他会变成你的朋友或是知己……先来看看老王和他的IT界朋友们吧p.s 经常有人问我,老王,你明明可以穿的挺帅,为什么总是穿的很随意呢?其实道理很简单,我是做技术活的,打扮太好人家会以为我技术不行。从前有一个程序员,成天写代码,后来...

2019-10-20 21:35:09 20615 59

原创 《自然语言处理实战入门》第三章 :中文分词原理及相关组件简介 ---- 工业级词法分析组件百度LAC2.0

文章大纲简介工具介绍安装与使用安装说明功能与使用分词词性标注与实体识别定制化功能增量训练1. 分词训练2. 词法分析训练文件结构效果原理参考文献 简介 LAC全称Lexical Analysis of Chinese,是百度NLP(自然语言处理部)研发的一款词法分析工具,可实现中文分词、词性标注...

2020-11-27 00:41:19 23 0

原创 项目管理学习 ---- 项目管理沟通技巧

文章大纲什么是有效沟通 什么是有效沟通 有效的沟通:以正确的形式、在正确的时间把信息提供给正确的受众,并且使信息产生正确的影响。 项目经历要用75% - 90% 的时间进行沟通。 沟通管理 为确保项目信息及时且恰当地规划、收集、生成,发布、存储、检索、管理、控制、监督和最终处置所需的各个过程...

2020-11-19 00:28:12 34 0

原创 项目管理学习 ---- 理解项目管理思维框架

文章大纲STACEY 矩阵项目管理过程和过程组十大领域之间的逻辑关系 STACEY 矩阵 项目管理过程和过程组 十大领域之间的逻辑关系

2020-11-17 23:55:21 50 0

原创 项目管理学习 ---- 认识项目管理及发展趋势

文章大纲项目管理工作中面临的7大难点什么是项目项目管理的行业演变 项目管理工作中面临的7大难点 1.工作分出去,收不回来。就像肉包子打狗,又去无回 2.项目千头万绪,计划扑朔迷离 3.沟通隔靴搔痒,管控鞭长莫及 4.需求变换莫测,变更层出不穷 5.传统工具专业高冷,普及应用困难重重 6.日志、记...

2020-11-16 19:28:40 30 0

原创 《自然语言处理实战入门》第三章 :中文分词原理及相关组件简介 ---- 结构化感知机

文章大纲参考文献 参考文献 结构化感知器 结构化感知器(Structured Perceptron, SP)是由Collins 在 (“Discriminative training methods for hidden markov models: Theory and experiment...

2020-11-02 23:25:23 82 0

原创 1024 向逝去的时间问好!

今天1024 程序员节,向逝去的时间问好!

2020-10-25 00:21:20 292 2

原创 《自然语言处理实战入门》第三章 :中文分词原理及相关组件简介 ---- 分词算法原理(CRF)

概率图模型,即在概率模型的基础上,用图的形式表达概率分布的模型

2020-10-24 18:29:49 61 0

原创 《自然语言处理实战入门》 文本检索 ---- Kibana 基本操作

文章大纲简介Dev tools参考文献 简介 Kibana 是一款开源的数据分析和可视化平台,它是 Elastic Stack 成员之一,设计用于和 Elasticsearch 协作。您可以使用 Kibana 对 Elasticsearch 索引中的数据进行搜索、查看、交互操作。您可以很方便的利...

2020-10-18 00:06:22 58 0

原创 《自然语言处理实战入门》 文本检索 ---- ElasticSearch 基本操作

文章大纲数据录入类型自动生成数据查询参考文献 《自然语言处理实战入门》 文本检索 ---- 初探 数据录入 类型自动生成 数据查询 query-dsl Query DSLedit Elasticsearch provides a full Query DSL (Domain Specific...

2020-10-11 13:52:01 768 8

原创 大数据ETL实践探索 ---- 笔试面试考点

解释MapReduce中的Partition和Shuffle? 在MapReduce过程中需要将任务进行分片,Shuffle:是描述数据从map端输入到reduce的过程,在hadoop中,大部分map task和reducetask是在不同的node执行,重要开销是网络开销和磁盘IO开销,因...

2020-10-05 23:47:24 283 0

原创 《自然语言处理实战入门》NLP 可视化 ---- 词向量可视化

文章大纲词向量简介t-SNE 可视化tensorboard 可视化参考文献 《自然语言处理实战入门》NLP可视化---- python可视化初步 matplotlib 相关设置 《自然语言处理实战入门》NLP 可视化 ---- 文本分析基础 《自然语言处理实战入门》NLP 可视化 ---- 文...

2020-09-20 23:37:31 91 0

原创 《自然语言处理实战入门》 文本检索与信息抽取 ---- 信息抽取初探

文章目录基本介绍一、传统信息抽取关键词抽取关键句子抽取二、深度学习信息抽取总结 基本介绍 信息抽取 (Information Extraction) 是把文本中包含的信息进行结构化处理,变成表格一样的组织形式。 信息抽取的主要任务是将各种各样的信息点从文档中抽取出来。然后以统一的形式集成在一起...

2020-08-26 23:52:02 199 0

原创 手把手教你买基金----读书笔记

基金投资要诀: 他强由他强,清风拂山岗; 他横由他横,明月照大江; 他自狠来他自恶,我自一口真气足。

2020-08-21 00:45:51 1317 1

原创 《自然语言处理实战入门》文本检索与信息抽取 ---- 关键词抽取

文章大纲章节目录参考文档 章节目录 《自然语言处理实战入门》 文本检索---- 初探 常用的检索算法有根据余弦相似度进行检索,Jaccard系数,海灵格-巴塔恰亚距离和BM25相关性评分。 (1)余弦(cosine)相似度,用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比...

2020-08-14 13:12:11 117 0

原创 PCA主成分分析(完结)

人有时候走着走着,放不下的东西太多,就会迷失自己。其实回归初心,换一个角度去看待问题,一切就变得豁然开朗了。PCA的思想是把过度关联在一起事务视为“噪声”,认为它们干扰试听,并占据不必要...

2020-08-13 12:40:41 168 0

原创 《自然语言处理实战入门》第三章 :中文分词原理及相关组件简介 ---- 分词算法原理(HMM)

文章大概序列标注概率图模型隐马尔可夫模型(Hidden Markov Model,HMM)维特比算法参考文献 序列标注 作为序列标注算法系列文章的第一篇,我们首先看看什么是序列标注问题? “数学上,序列是被排成一列的对象(或事件);这样每个元素不是在其他元素之前,就是在其他元素之后。 在自然语言...

2020-08-08 08:09:11 145 0

原创 过去的日子我们这样娱乐过8.0

从前有一个程序员,在他上学的时候,不好好看书,在他毕业的时候也就只能成天写点hello world,后来他希望能做点大事,于是总是抬头仰望星空,别人以为他在祈求上苍赐予机会,但我想,可能...

2020-08-07 14:12:08 161 0

原创 那是一次不俗的旅程

2013年8月的早些时候,我跟组长说我不干了,要去上学。组长当时的表情好像中了500万又被告知彩票过期了一样尴尬。公司公费旅游去张家界,不去还要扣工资,我于是只好辞职收拾好行囊踏上了这...

2020-08-07 13:58:11 259 1

原创 PCA主成分分析(下)

美,是在高潮处陡然消逝,不落凡尘。数学中的美,是不是也是寻找那个导数为零的极值点?实际问题中,我们认为凸型函数是函数中是相对完美而且最容易求极值点的。哦……可惜数学实际上没那么多想象的浪...

2020-08-06 07:07:50 106 0

原创 《自然语言处理实战入门》基础知识 ---- NLP开源工具包与云服务提供商

文章大纲NLTKGensimStanfordNLPSpacy参考文档 在1.3小结我们已经简要介绍了一些知名中文NLP开源组件与服务提供商,目的是直观认识NLP的常用技术手段和应用场景进行概述知识导入。本小节针对NLP 常见处理流程中经常用到的开源包与云服务提供商进行介绍。 图 自然语言处理一...

2020-07-20 00:39:09 194 0

原创 PCA主成分分析(上)
原力计划

人的悲欢并不相通,我只觉得他们吵闹——鲁迅写这篇文章之前,脑海里鬼使神差般的浮出这句话,于是决定把它加在开篇之前。不知道你记得不记得凌晨杂货店门前卸货的年轻人,或者傍晚地铁口赶着公交上车...

2020-07-16 09:59:04 203 0

原创 《自然语言处理实战入门》基础知识 ----机器学习与深度学习组件

文章大纲numpywhat is numpyArray objectpandasWhat kind of data does pandas handle?参考本人文章sklearnmatplotlib常见问题TensorFlowkeraspytorch numpy The fundamenta...

2020-07-02 00:24:46 340 0

原创 《自然语言处理实战入门》 深度学习组件TensorFlow2.0---- 初探

文章大纲简介TensorFlow 2.0 升级的主要内容升级的主要内容如何升级代码参考文档官方基础性材料TensorFlow 2.0 相关资料 简介 TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图...

2020-06-26 01:16:12 511 0

原创 《自然语言处理实战入门》 文本检索 ---- 初探

文章大纲文本搜索原理搜索引擎的选择Elastic SearchSolrES VS SolrElastic Search索引安装kibana 可视化 文本搜索原理 搜索引擎的选择 Elastic Search Elasticsearch 是一个分布式的开源搜索和分析引擎,适用于所有类型的数据,包...

2020-06-19 09:46:37 357 0

原创 大数据ETL实践探索(9)---- 使用pandas sqlalchemy进行多进程百万级数据入库postgresSQL
原力计划

文章大纲基础性工作连接类sqlclchemy 基础操作类sqlalchemy 数据库shema 表 样例psycopg2 原生 apipgAdmin 导入pandas 数据清洗与to_sql方法录入数据数据清洗to_sql 数据录入使用 sqlalchemy 批量录入方法 最近有个需求,需要将2...

2020-06-15 01:43:35 631 0

原创 如何快速部署静态页面?
原力计划

文章大纲静态页面静态页面的几种方式1. linux 主机的 httpd 服务2. Nginx 反向代理自动化部署的几种方式 朋友圈大神胡老师说过,都2020年了,写代码实现不是实现的唯一方式,天下武功唯快不破。如何快速构建,持续交付才是王道。比如经常有这样的场景, 静态页面 静态页面的几种方式 ...

2020-06-07 18:20:13 418 0

原创 《自然语言处理实战入门》NLP 可视化 ---- 文本内容可视化
原力计划

文章大纲基于关键词的文本内容可视化标签云文档散(DocuBurst)文档卡片时序性的文本内容可视化主题河流(ThemeRiver)历史流(History Flow)文本弧(TextArc)文献指纹(Literature Fingerprinting)文本特征透镜(Feature Lens) 文本...

2020-06-01 00:07:44 663 0

原创 《黑客与画家:硅谷创业之父Paul Graham文集》----读书笔记

文章大纲保罗·格雷厄姆其人其事人物经历个人作品编辑译者序为什么书呆子不受欢迎黑客与画家不能说的话你是一个随大流的人吗真话异端邪说时空差异机制为什么这样做守口如瓶笑脸相迎?永远质疑良好的坏习惯另一条路设计与研究点评 保罗·格雷厄姆其人其事 人物经历 保罗·格雷厄姆以Lisp方面的工作而知名,也是...

2020-05-23 14:06:14 370 0

转载 做项目一定用得到的NLP资源

原文链接:https://github.com/fighting41love/funNLP 最近需要从文本中抽取结构化信息,用到了很多github上的包,遂整理了一下,后续会不断更新。 涉及内容包括:中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、...

2020-05-23 01:27:53 2604 0

原创 《周鸿祎自述:我的互联网方法论》---- 读书笔记

周鸿祎个人简介: 周鸿祎这个人比较有争议,如果不是他,中国互联网的免费文化可能还不会像今天这样,免费,共享等等概念满天飞。周教主的核心理念是说,如果使用软件的用户足够多,那么软件成本分摊到每位用户就是近似免费的,而软件完全可以通过赞助商,广告商的出资抵消这部分成本费用。所以对于软件产业来说,用户...

2020-05-14 11:23:23 2408 0

原创 《自然语言处理实战入门》 第二章:NLP 前置技术----爬取本人CSDN博客

文章大纲1对象关系映射1.1 简介1.2 博客相关信息与对象映射2. 博客爬虫的编写2.1 爬虫爬取逻辑回顾2.2 爬取本人CSDN 博客 爬虫逻辑 1对象关系映射 1.1 简介 ORM框架的作用就是把数据库表的一行记录与一个对象互相做自动转换。 正确使用ORM的前提是了解关系数据库的原理。 ...

2020-05-08 09:17:30 498 0

原创 《自然语言处理实战入门》第二章: NLP前置技术----网络爬虫简介

我们平时做自然语言处理,机器学习,都是希望能够有丰富的训练数据集,这样才能获取质量上乘的模型。在大数据时代,处理数据已经不再是是问题了,spark,hadoop ,Elastic search提供了海量甚至巨量的分布式数据处理方法。问题是没有数据怎么办?在合理合法 的前提下自然语言处理 的语料和其...

2020-05-07 09:46:00 334 0

原创 《自然语言处理实战入门》NLP可视化---- python可视化初步 matplotlib 相关设置

文章大概matplotlib 可视化相关设置matplotlib seaborn 绘图加载中文字体CentOS 安装中文字体查看matplotlib 字体目录查看系统可用的中英文字体matplotlib 设置中文字体seaborn设置中文字体其他解决 matplotlib 中文显示的思路 ma...

2020-05-05 09:29:48 502 0

原创 《自然语言处理实战入门》NLP 可视化 ---- 文本分析基础

文章大纲可视化,大数据最完美的呈现方式 推荐一本书,《数据之美》一本书学会可视化设计。 可视化,大数据最完美的呈现方式 大数据若是一种无形的土壤,那可视化就是浇水、施肥,让其开出美丽之花的工具。 大数据若是一种新型的石油,那可视化就是开发这种石油不可缺的设备 大数据若是烹饪的食材,那可视化就是将...

2020-05-04 15:53:50 430 0

原创 《AI进化论:解码人工智能商业场景与案例》----读书笔记

AI进化论:解码人工智能商业场景与案例 作者:亿欧智库 文章大纲业内人士力荐序第一章 跨越AI商业化“奇点”第二章 金融狂欢下的泡影第三章 积重难返?医疗AI的颠覆之路第四章 智慧安防:罪恶无处遁形第五章 自动驾驶:定义未来出行第七章 内容不再是人的专利第八章 AI赋能下的法律新格局第九章 AI进...

2020-04-25 23:46:04 1138 0

原创 大数据ETL实践探索 ---- 使用python 进行 快速EDA综合可视化

文章大纲使用pandas 对数据进行处理非结构化数据可视化结构化数据可视化cubesuperset 使用pandas 对数据进行处理 非结构化数据可视化 结构化数据可视化 cube superset docker 方式安装 ...

2020-04-14 01:28:19 828 0

原创 《自然语言处理实战入门》---- 如何成为一名 NLP 工程师?

文章大纲名企需求实际需求总体情况知识体系提升计划核心能力提升题库资源优秀博文 名企需求 想要成为一名NLP 工程师,我们先要看看 # 美团 NLP 方向 优先任职资格: 1、有Tensorflow、Caffe2、 Theano等深度学习框架与自然语言处理结合实际项目经验者优先; 2、熟悉面向文本...

2020-04-01 00:01:40 453 0

转载 《硅谷钢铁侠》---- 读书笔记

目录第一章 马斯克的世界:跨领域创造第二章 出生地非洲:冒险无极限的基因第三章 挺进加拿大:追寻太阳的人第四章 第一次创业:征服网络世界第五章 PayPal黑帮大佬:发动国际金融革命第六章 太空召唤:建立SpaceX创新大军第七章 全电动车:超酷超快的特斯拉第八章 痛苦、磨难与新生:现实版钢铁侠的...

2020-03-22 13:59:28 755 0

提示
确定要删除当前文章?
取消 删除