当前位置:首页 > Python > 正文

Plotly Express教程:Python数据可视化神器 | 完全指南

Plotly Express数据可视化教程

掌握Python中最简洁强大的交互式可视化库

什么是Plotly Express?

Plotly Express是Python中一个高级的、声明式的数据可视化库,基于Plotly构建。它提供了简洁的API,只需一行代码就能创建丰富的交互式图表。

主要优势

  • 简洁易用的API
  • 丰富的图表类型支持
  • 高度可定制的样式
  • 自动生成图例和颜色方案
  • 交互式图表(缩放、平移、悬停)
  • 轻松导出为HTML或图片

适用场景

  • 数据探索与分析
  • 创建交互式数据报告
  • 构建数据可视化仪表盘
  • 学术研究与论文图表
  • 商业智能与数据展示

安装与导入

安装Plotly Express

使用pip安装:

pip install plotly express

或者使用conda安装:

conda install -c plotly plotly express

导入库

在Python代码中导入Plotly Express:

import plotly.express as px

核心功能与图表类型

散点图 (Scatter Plot)

用于展示两个连续变量之间的关系,支持颜色、大小和符号编码。

折线图 (Line Plot)

展示数据随时间或其他连续变量的变化趋势。

条形图 (Bar Chart)

比较不同类别的数值大小,支持水平/垂直方向。

直方图 (Histogram)

展示数值数据的分布情况,可添加多个分组。

箱线图 (Box Plot)

展示数据分布的五数概括,便于识别异常值。

热力图 (Heatmap)

用颜色矩阵展示两个分类变量之间的关系。

Plotly Express示例代码

1. 散点图示例

import plotly.express as px

# 加载内置数据集
df = px.data.iris()

# 创建散点图
fig = px.scatter(df, x="sepal_width", y="sepal_length",
                color="species", size="petal_length",
                hover_data=["petal_width"],
                title="鸢尾花数据集散点图")

# 显示图表
fig.show()

2. 折线图示例

import plotly.express as px

# 加载内置数据集
df = px.data.stocks()

# 创建折线图
fig = px.line(df, x="date", y=["GOOG", "AAPL", "AMZN"],
             title="科技巨头股票价格走势",
             labels={"value": "股票价格", "variable": "公司"},
             line_dash="variable")

# 自定义布局
fig.update_layout(
    xaxis_title="日期",
    yaxis_title="价格 (USD)",
    legend_title="公司",
    hovermode="x unified"
)

# 显示图表
fig.show()

3. 条形图示例

import plotly.express as px

# 加载内置数据集
df = px.data.tips()

# 创建分组条形图
fig = px.bar(df, x="day", y="total_bill", color="sex",
            barmode="group", 
            title="每日小费总额(按性别分组)",
            labels={"total_bill": "总金额", "day": "星期", "sex": "性别"})

# 自定义悬停信息
fig.update_traces(hovertemplate="星期%{x}: %{y:.2f}美元")

# 显示图表
fig.show()

高级技巧与最佳实践

1. 使用内置数据集

Plotly Express提供多个内置数据集,方便快速开始:

  • iris: 鸢尾花数据集
  • tips: 餐厅小费数据集
  • gapminder: 全球发展数据
  • stocks: 股票价格数据

2. 自定义主题

使用内置主题快速改变图表风格:

fig.update_layout(template="plotly_dark")

可用主题:plotly, plotly_white, plotly_dark, ggplot2, seaborn等

3. 导出图表

多种导出选项:

# 保存为HTML
fig.write_html("chart.html")

# 保存为静态图片
fig.write_image("chart.png")

4. 添加交互控件

使用参数增加交互功能:

# 添加动画
px.scatter(df, x="gdp", y="lifeExp", 
           animation_frame="year", 
           size="pop", color="continent")

# 添加分面
px.scatter(df, x="x", y="y", 
           facet_col="category", 
           facet_col_wrap=3)

开始使用Plotly Express

Plotly Express是Python数据科学家的强大工具,通过简洁的API创建专业级交互式可视化图表。

立即开始探索数据可视化

发表评论