七周成为数据分析师:Excel 技巧大揭秘

七周成为数据分析师:Excel 技巧大揭秘
2021年08月04日21:15:37 0 1038

七周成为数据分析师:Excel 技巧大揭秘

 

上一篇文章《数据分析:常见的 Excel 函数全部涵盖在这里了》教了大家常用的函数,今天讲解 Excel 的技巧。

本次讲解依然是提纲,图文部分引用自百度经验。如果有疑问或建议,可以留言给我,也可以网上搜索。内容方面照旧会补充 SQL 和 Python。

 

快捷键

Excel 的快捷键很多,以下主要是能提高效率:

Crtl+方向键,对单元格光标快速移动,移动到数据边缘(空格位置)。Crtl+Shift+方向键,对单元格快读框选,选择到数据边缘(空格位置)。Ctrrl+空格键,选定整列。

Shift+空格键,选定整行。Ctrl+A,选择整张表内容。Alt+Enter,换行。

Ctrl+Enter,以当前单元格为始,往下填充数据和函数。Ctrl+S,快读保存,你懂的。

Ctrl+Z,撤回当前操作。

如果是效率达人,可以学习更多快捷键。Mac 用户的 ctrl 一般需要用 command 替换。

 

格式转换

Excel 的格式及转换很容易忽略,但格式会如影随形伴随数据分析者的一切场景,是后续 SQL 和 Python 数据类型的基础。

通常我们将 Excel 格式分为数值、文本、时间。

数值常见整数型 Int 和小数/浮点型 Float。两者的界限很模糊。在 SQL 和 Python 中,则会牵扯的复杂,涉及运算效率,计算精度等。

文本分为中文和英文,存储字节,字符长度不同。中文很容易遇到编码问题,尤其是 Python2。Win 和 Mac 环境也有差异。大家遇到的乱码一般都属于中文编码错误。

时间格式在 Excel 中可以和数值直接互换,也能用加减法进行天数换算。

时间格式有不同表达。例如 2016 年 11 月 11 日,2016/11/11,2016-11-11 等。当数据源多就会变得混乱。我们可以用自定义格式规范时间。

 

这里了解一下时间格式的概念,列举是一些较通用的范例(不同编程语言还是有差异的)。

YYYY 代表通配的四位数年格式MM 代表通配的两位数月格式DD 代表通配的两位数日格式

HH 代表通配的的两位数小时(24 小时)格式hh 代表通配的两位数小(12 小时制)格式mm 代表通配的两位数分格式

ss 代表通配的两位数秒格式

例如 2016/11/11 可以写成:yyyy/MM/dd

2016-11-11 23:59:59 可以写成:yyyy-MM-dd HH:mm:ss

 

 
 
 

 

 

数组

数组很多人都不会用到,甚至不知道有这个功能。依旧是数据分析越往后用到越多,它类似 R 语言的 Array 和

Python 的 List。

数组由多个元素组成。普通函数的计算结果是一个值,数组类函数的计算结果返回多个值。数组用大括号表示,当函数中使用到数组,应该用 Ctrl+Shift+Enter 输入,不然会报错。

先看数组的最基础使用。选择 A1:D1 区域,输入={1,2,3,4}。记住是大括号。然后 Ctrl+Shift+Enter。我们发现数组里的四个值被分别传到四个单元格中,这是数组的独有用法。

 

 

 

我们再来看一下数组和函数的应用。利用{},我们能做到 1 匹配 a,2 匹配 b,3 匹配 c。也就是一一对应。专业说法是 Mapping。

=lookup(查找值,{1,2,3},{"a","b","c"})

Excel 的数组有同样强大的玩法,大家可以搜索学习,提高一定的效率。但是 Python 的数组更为强大,重点就不放在这块了。

 

分列

Excel 可以将多个单元格的内容合并,但是不擅长拆分。分列功能可以将某一列按照特定规则拆分。常常用来进行数据清洗。

 

 
 
 

 

 

上文我有一列地区的数据,我想要将市和区分成两列。通常做法是可以用 mid 和 find 函数查找市截取字符。但最快做法就是用市分列。

 

 
 
 

 

 

出一个思考题,如果市和区都存在应该如何分列?

SQL 和 Python 中有类似的 spilt ( )函数。

 

合并单元格

单元格作为报表整理使用,除非是最终输出格式,例如打印。否则不要随意合并单元格。

一旦使用合并单元格,绝大多数函数都不能正常使用,影响批量的数据处理和格式转换。合并单元格也会造成

Python 和 SQL 的读取错误。

 

数据透视表

数据透视表是非常强大的功能,当初学会时惊为天人。

数据透视表的主要功能是将数据聚合,按照各子段进行 sum( ),count( )的运算。下图我选择我选择想要计算的数据,然后点击创建透视表。

 

 

 

此时会新建一个 Sheet,这是数据透视表的优点,将原始数据和汇总计算数据分离。数据透视表的核心思想是聚合运算,将字段名相同的数据聚合起来,所谓数以类分。

列和行的设置,则是按不同轴向展现数据。简单说,你想要什么结构的报表,就用什么样的拖拽方式。

 

 
 
 

 

 

聚合功能有一点类似 SQL 中的 gorup by,python 中则有更为强大的 pandas.pivot_table( )。

 

删除重复项

一种数据清洗和检验的快速方式。想要验证某一列有多少个唯一值,或者数据清洗,都可以使用。

 

 
 
 

 

功能类似 SQL 中的 distinct ,python 中的 set。

 

条件格式

条件格式可以当作数据可视化的应用。如果我们要使用函数在大量数据中找出前三的值,可能会用到 rank( )函数,排序,然后过滤出 1,2,3。

用条件格式则是另外一种快速方法,直接用颜色标出,非常直观。

 

 
 
 

 

 

 

 

 

冻结首行首列

Excel 的首行一般是各字段名 Header,俗称表头,当行数和列数过多的时候,观察数据比较麻烦。我们可以通过固定住首行,方便浏览和操作。

Header 是一个较为重要的概念。在 Python 和 R 中,read_csv 函数,会有一个专门的参数 header=true,来判断是否读取表头作为 columns 的名字。

 

自定义下拉菜单(数据有效性)

数据有效性是一种约束,针对单元格限制其输入,也就是让其只能固定几个值。下拉菜单是一种高阶应用,通过允许下拉箭头即可。

 

 
 
 

 

 

 

 

自定义名称

自定义名称是一个很好用的技巧,我们可以为一个区域,变量、或者数组定义一个名称。后续要经常使用的话,直接引用即可,无需再次定位。这是复用的概念。

 

 
 
 

 

 

我们将 A1:A3 区域命名为 NUM。

直接使用=sum(NUM) ,等价于 sum(A1:A3)。

 

 
 
 

 

 

新手们理解数据库,可以将其想象成无数张表 sheet。每一张表都有自己唯一的名字,就像上图的 NUM 一样。数据库操作就是引用表名进行查找、关联等操作。使用 sum,count 等函数。

 

查找公式错误

公式报错也不知道错在哪里时候可以使用该功能,尤其是各类 IF 嵌套或者多表关联,逻辑复杂时。查找公式错误是逐步运算的,很方便定位。

 

 
 
 
 
 

 

 

 

分组和分级显示

分组和分级显示,常用在报表中,在报表行数多到一定程度时,通过分组达到快速切换和隐藏的目的。越是专业度的报表(咨询、财务等),越可以学习这块。在数据菜单下。

 

 
 
 

 

 

分析工具库

分析工具库是高阶分析的利器,包含很多统计计算,检验功能等工具。Excel 是默认不安装的,要安装需要加载项,在工具菜单下(不同版本安装方式会有一点小差异)。

 

 
 
 

 

 

分析工具库是统计包,规划求解是计算最优解,类似决策树。这两者的分析方法以后详细论述。

 

 
 
 

 

 

Mac 似乎有阉割。

 

第三方应用

Excel 是支持第三方插件的,第三方插件拥有非常强大的功能。甚至完成 BI 的工作。

 

 

 

应用商店里微软官方的 Power 系列都挺好。下图就是 Power Map。

 

 
 
 

 

 

第三方应用商店 Mac 没有,非常可惜。Win 用户请用最新版本,2010 以前是没有插件的。第三方应用是可以深学的,如果是传统行业的数据分析师,需要专注学习,互联网分析就不需要了。

 

点赞(0) 打赏
weinxin
投诉&咨询
文章名+链接地址,发送到此微信:tourism52
老人言,体制内的伪经验,老人,体制,内的,伪经,千万,分清 职场天地

老人言:体制内的伪经验,千万要分清!

老人言:体制内的伪经验,千万要分清!正所谓“不听老人言,吃亏在眼前”,在体制内工作,以他人的经验,可以明得失,一般能够让我们少走很多的弯路。但凡事无绝对,也会有些不合时宜、不切实际...
投递简历时间 职场天地

投递简历时间

投递简历时间: 不要再周六周天投递简历啦? 周六还在上班看简历的,那大概不就是996么,不上班的,周一这不是石沉大海吗! 要么白天工作时间投递,可能会被即时查看到。 要么就一早上班...
恋爱技巧,恋爱,技巧,8个,方法,喜欢,的人对你,动心 职场天地

恋爱技巧:8个方法让喜欢的人对你动心

恋爱技巧:8个方法让喜欢的人对你动心看到男生,很多女孩子会不由自主的脸红说话结巴,导致男生对其印象较差。不管是恋爱中的情侣还是准备要恋爱的男女,都来看看谈恋爱技巧之八个方法让男人对...
LED广告合同,LED显示屏广告协议,广告发布合同,LED显示屏广告合同,户外,led,广告,合同 职场天地

户外LED广告合同

LED显示屏户外媒体广告发布合同合同编号____NO________甲方(委托方):地址:____________________________乙方(受托方):地址:甲乙双方根据...

评论列表 共有 0 条评论

暂无评论