Python数据可视化:5段代码搞定散点图绘制与使用,值得收藏

  • 时间:
  • 浏览:3
  • 来源:万人红黑大战棋牌_万人红黑大战棋牌官网

02 实例

p.circle(x, y, kwargs)参数说明。**

angle_units (:class:~bokeh.core.enums.AngleUnits) : (default: 'rad') 默认:弧度,也也能采用度('degree')

代码示例②

运行结果如图3所示。

**kwargs: 其他自定义属性;其中标记点类型marker默认值为:“marker="circle"”,也能用“radius”定义圆的半径大小(单位为坐标轴单位)。这在Web数据化中非常有用,不同的土最好的办法,在不同的设备上的展示效果会其他许差异。

原文发布时间:2019-12-14

本文作者:作者:屈希峰

本文来自阿里云云栖号合作土最好的办法协议伙伴“大数据DT”,了解相关信息也能关注“大数据DT”





source (~bokeh.models.sources.ColumnDataSource) : Bokeh专属数据格式

作者:屈希峰

来源:大数据DT(ID:bigdatadt)

marker (str, or list[str]) : 离散点标记类型名称或名称列表

代码示例①

line_width (:class:~bokeh.core.properties.NumberSpec ) : (default: 1) 线宽,默认:1

代码示例⑤







运行结果如图7所示。



color (color value, optional) : 填充及轮廓线的颜色

fill_alpha (:class:~bokeh.core.properties.NumberSpec ) : (default: 1.0) 填充透明度,默认:不透明

散点图(Scatter)又称散点分布图,是以另另2个 变量为横坐标,原先变量为纵坐标,利用散点(坐标点)的分布结构反映变量统计关系的有一种 图形。

x (str or seq[float]) : 离散点的x坐标,列名或列表

▲图5 代码示例③运行结果

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

另外,Bokeh中的其他属性,如~bokeh.core.properties.NumberSpec ~bokeh.core.properties.ColorSpec也能在Jupyter notebook中通过import bokeh.core.properties.NumberSpec 导入该属性,或者再查看其完整版的使用说明。

▲图2 散点数据拟合(线性)

line_dash_offset (:class:~bokeh.core.properties.Int ) : (default: 0) 虚线偏移

▲图3 代码示例①运行结果

line_cap : (:class:~bokeh.core.enums.LineCap ) : (default: 'butt') 线端(帽)

Bokeh中的画布可通太久种布局土最好的办法进行显示:通过配置视图参数,在视图中进行交互可视化。运行结果如图6所示。



▲图1 散点数据的相关性

代码示例①中第7行使用scatter土最好的办法进行散点图绘制;第11行采用circle土最好的办法进行散点图绘制(推荐)。关于这另另2个 土最好的办法的参数说明如下。

y (:class:~bokeh.core.properties.NumberSpec ) : y坐标

y (str or seq[float]) : 离散点的y坐标

line_alpha (:class:~bokeh.core.properties.NumberSpec ) : (default: 1.0) 轮廓线透明度,默认:不透明

数据的相关关系大体上也能分为:正相关(另另2个 变量值一并增长)、负相关(另另2个 变量值增加,原先变量值下降)、不相关、线性相关、指数相关等,表现在散点图上的大致分布如图1所示。那此离点集群较远的点当当当当我们 称之为离群点机会异常点。

line_dash (:class:~bokeh.core.properties.DashPattern ) : (default: []) 虚线

p.scatter(x, y, kwargs)参数说明。**

特点是能直观表现出影响因素和预测对象之间的总体关系趋势。优点是能通过直观醒目的图形土最好的办法反映变量间关系的变化结构,以便决定用何种数学表达土最好的办法来模拟变量之间的关系。散点图不仅可传递变量间关系类型的信息,还能反映变量间关系的明确程度。

▲图6 代码示例④运行结果

size (str or list[float]) : 离散点的大小,屏幕像素单位

通过观察散点图数据点的分布状况,当当当当我们 也能推断出变量间的相关性。机会变量之间不指在相互关系,没法在散点图上就会表现为随机分布的离散的点,机会指在有一种 相关性,没法大次要的数据点就会相对密集并以有一种 趋势呈现。

运行结果如图4所示。

代码示例④

本文通过两个代码示例展示了散点图的绘制技巧,绘制难度也逐渐增大,与此一并,展现的效果也没法好。读者在学习过程中也能多思考,在有一种示例中那此数据必须交互式展示,采用哪种展示土最好的办法更好。

angle (:class:~bokeh.core.properties.AngleSpec ) : 旋转深度图

line_join (:class:~bokeh.core.enums.LineJoin ) : (default: 'bevel')

代码示例②中第11行和第15行使用scatter土最好的办法进行散点图绘制。第7行工具条中的不同工具定义,第9行数据点的不同颜色定义,第20行和第21行采用网格显示图形,也能提前了解那此技巧,具体使用土最好的办法在下文中会专门进行介绍。

在Python体系中,可使用Scipy、Statsmodels或Sklearn等对离散点进行回归分析,归纳现有数据并进行预测分析。对于那此变量之间指在密切关系,或者那此关系又不像数学公式和物理公式那样也能精确表达的,散点图是有一种 很好的图形工具,也能进行直观展示,如图2所示。

x (:class:~bokeh.core.properties.NumberSpec ) : x坐标

关于作者:屈希峰,资深Python工程师,Bokeh领域的实践者和布道者,对Bokeh有深入的研究。擅长Flask、MongoDB、Sklearn等技术,实践经验丰富。知乎多个专栏(Python中文社区、Python线程运行员、大数据分析挖掘)作者,专栏累计关注用户十余万人。

云栖号:https://www.aliyun.com/#module-yedOfott8

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!

散点图代码示类似下所示。

代码示例⑤展示了短跑选手博尔特与116年来奥运会其他短跑选手成绩的对比状况。上述代码含晒 数据预外理、自定义绘图属性、数据标记、交互式显示等较为繁复的操作,不作为本文重点;读者仅必须知道通过那此代码也能实现那此可视化的效果即可。

line_color (:class:~bokeh.core.properties.ColorSpec ) : (default: 'black') 轮廓线颜色,默认:黑色

代码示例④让读者感受一下Bokeh的交互效果,Div土最好的办法也能直接使用HTML标签,其作为另另2个 独立的图层进行显示(第30行)。另外必须注意,也能通过nonselection_nonselection_alphanonselection_fill_alpha设套索置选着数据时的散点的颜色、透明度等。

▲图7 代码示例⑤运行结果



运行结果如图5所示。

代码示例③再次对前面提到的鸢尾花的数据集进行分析,图5中x轴为花瓣长度,y轴为花瓣深度图,据此也能将该散点数据聚类为3类。一并,该段代码展示了常规图形的绘制流程,含x、y轴的标签。

fill_color (:class:~bokeh.core.properties.ColorSpec ) : (default: 'gray') 填充颜色,默认:灰色

代码示例③

▲图4 代码示例②运行结果

本文摘编自《Python数据可视化:基于Bokeh的可视化绘图》,经出版方授权发布。

01 概述

或者在分析过程中必须注意,变量之间的相关性暂且等同于选着的因果关系,仍必须考虑其他影响因素。