自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

shiter编写程序的艺术

大数据生态圈,计算机视觉,机器学习,高端技术的爱好者,话不多说,上代码!!!...

原创 2018 初入IT十年(上)----成为一名优秀的程序员

文章大纲忙碌的一年大公司如何处理一个 bug 魏超 说 他很期待老王我的年终总结,我有点激动的不能自已,而且骤然发现2018年是我踏入IT 的第十个年头了,值得大书特书。于是决定将这篇年中总结分成两个部分,在2018年年底,和2019年年初分别发布 忙碌的一年 今年是非常忙碌的一年,身体...

2018-12-09 02:11:32 9404 38

原创 简单NLP分析套路(3)---- 可视化展现初步

文章大纲可视化词云主题模型行业语料库保险行业语料库医学健康类语料库 可视化 词云 主题模型 行业语料库 保险行业语料库 https://github.com/Samurais/insuranceqa-corpus-zh/wiki 医学健康类语料库 中国疾病知识图谱 htt...

2018-12-09 01:44:34 3256 5

原创 大数据ETL实践探索(4)---- 搜索神器Elastic search

3.本地文件导入aws elastic search 修改访问策略,设置本地电脑的公网ip,这个经常会变化,每次使用时候需要设置一下 安装anancota https://www.anaconda.com/download/ 初始化环境,win10下打开Anaconda Promp...

2018-12-09 01:33:06 2008 0

原创 大数据ETL实践探索(3)---- 大数据ETL利器之pyspark

5.spark dataframe 数据导入Elasticsearch 5.1 dataframe 及环境初始化 初始化, spark 第三方网站下载包:elasticsearch-spark-20_2.11-6.1.1.jar http://spark.apache.org/third-p...

2018-12-09 01:29:03 1806 0

原创 大数据ETL实践探索(2)---- python 与aws 交互

文章大纲 本文主要使用python基于oracle和aws 相关组件进行一些基本的数据导入导出实战,oracle使用数据泵impdp进行导入操作,aws使用awscli进行上传下载操作。本地文件上传至aws es,spark dataframe录入ElasticSearch等典型数据ETL功能的...

2018-12-09 01:25:45 1415 1

原创 大数据ETL实践探索(1)---- python 与oracle数据库导入导出

文章大纲

2018-12-09 01:21:01 2616 0

提示
确定要删除当前文章?
取消 删除