自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shiter编写程序的艺术

大数据生态圈,计算机视觉,机器学习,高端技术的爱好者,话不多说,上代码!!!...

原创 《黑客与画家:硅谷创业之父Paul Graham文集》----读书笔记

文章大纲保罗·格雷厄姆其人其事人物经历个人作品编辑译者序为什么书呆子不受欢迎黑客与画家不能说的话你是一个随大流的人吗真话异端邪说时空差异机制为什么这样做守口如瓶笑脸相迎?永远质疑良好的坏习惯另一条路设计与研究点评 保罗·格雷厄姆其人其事 人物经历 保罗·格雷厄姆以Lisp方面的工作而知名,也是...

2020-05-23 14:06:14 370 0

转载 做项目一定用得到的NLP资源

原文链接:https://github.com/fighting41love/funNLP 最近需要从文本中抽取结构化信息,用到了很多github上的包,遂整理了一下,后续会不断更新。 涉及内容包括:中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、...

2020-05-23 01:27:53 2604 0

原创 《周鸿祎自述:我的互联网方法论》---- 读书笔记

周鸿祎个人简介: 周鸿祎这个人比较有争议,如果不是他,中国互联网的免费文化可能还不会像今天这样,免费,共享等等概念满天飞。周教主的核心理念是说,如果使用软件的用户足够多,那么软件成本分摊到每位用户就是近似免费的,而软件完全可以通过赞助商,广告商的出资抵消这部分成本费用。所以对于软件产业来说,用户...

2020-05-14 11:23:23 2408 0

原创 《自然语言处理实战入门》 第二章:NLP 前置技术----爬取本人CSDN博客

文章大纲1对象关系映射1.1 简介1.2 博客相关信息与对象映射2. 博客爬虫的编写2.1 爬虫爬取逻辑回顾2.2 爬取本人CSDN 博客 爬虫逻辑 1对象关系映射 1.1 简介 ORM框架的作用就是把数据库表的一行记录与一个对象互相做自动转换。 正确使用ORM的前提是了解关系数据库的原理。 ...

2020-05-08 09:17:30 498 0

原创 《自然语言处理实战入门》第二章: NLP前置技术----网络爬虫简介

我们平时做自然语言处理,机器学习,都是希望能够有丰富的训练数据集,这样才能获取质量上乘的模型。在大数据时代,处理数据已经不再是是问题了,spark,hadoop ,Elastic search提供了海量甚至巨量的分布式数据处理方法。问题是没有数据怎么办?在合理合法 的前提下自然语言处理 的语料和其...

2020-05-07 09:46:00 334 0

原创 《自然语言处理实战入门》NLP可视化---- python可视化初步 matplotlib 相关设置

文章大概matplotlib 可视化相关设置matplotlib seaborn 绘图加载中文字体CentOS 安装中文字体查看matplotlib 字体目录查看系统可用的中英文字体matplotlib 设置中文字体seaborn设置中文字体其他解决 matplotlib 中文显示的思路 ma...

2020-05-05 09:29:48 502 0

原创 《自然语言处理实战入门》NLP 可视化 ---- 文本分析基础

文章大纲可视化,大数据最完美的呈现方式 推荐一本书,《数据之美》一本书学会可视化设计。 可视化,大数据最完美的呈现方式 大数据若是一种无形的土壤,那可视化就是浇水、施肥,让其开出美丽之花的工具。 大数据若是一种新型的石油,那可视化就是开发这种石油不可缺的设备 大数据若是烹饪的食材,那可视化就是将...

2020-05-04 15:53:50 430 0

提示
确定要删除当前文章?
取消 删除