百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

商业智能开源分析工具Superset介绍和安装

liuian 2024-12-19 14:46 47 浏览

1. 什么是Superset?

Apache Superset是一个现代的、企业级的商业智能(BI)网页端的应用程序,我们可以简单的理解成它是一个开源的数据可视化工具。所谓可视化,简单的说就是把数据转换成图表,以一种更直观的方式来展现数据。其支持丰富的数据源连接,如:MySQL、DB2、SQL Server、Oracle等,支持多种可视化方式,并能够对用户实现细粒度的权限控制。该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询等。Superset基本架构:前端基于JavaScript,后端基于Python。

2. 环境搭建

2.1 Conda 安装

这里我们以Linux(Centos 7)的操作系统为例,个人建议还是使用Linux系统,Windows系统可能坑比较多,由于Superset的后端是基于Python的,所以我们首先需要安装Python,为了方便我们对不同版本的Python进行管理,这里我们使用conda来搭建Python的环境,conda默认随miniconda或anaconda发行,因此要安装conda,只需要安装miniconda或anconda即可,我们这里使用miniconda,安装步骤如下:

  1. 首先从官网找到conda下载链接,然后使用wget命令下载,代码如下:
wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
  1. 文件下载完成后,使用chmod命令为文件赋权:
chmod 777 Miniconda3-latest-Linux-x86_64.sh #给执行权限
  1. 执行文件,一路安装即可
bash Miniconda3-latest-Linux-x86_64.sh #运行

安装完成后,我们可以通过conda -V,查看版本:

(base) [root@iZ8vb15btme7rdyvwu43dyZ bin]# conda -V
conda 4.10.3

下面我们开始创建python的环境,这里我们我们使用的python版本为3.6,常用的conda命令如下:

# 查看已有的虚拟环境
conda env list 
# 创建一个conda环境
conda create -n env_name python=x.x
# 删除一个conda环境
conda remove -n env_name --all
# 激活conda环境
conda activate env_name
# 退出conda环境
conda deactivate

当我们进入某一个虚拟环境后,我们可以使用如下的命令,进行包的安装、更新等操作:

# 查看已安装的package
conda list
# 安装某个package
conda install [package]
# 删除某个package
conda remove [package]
# 更新某个package
conda update [package]
# 更新conda,保持conda最新
conda update conda

2.2 虚拟环境安装

Python 应用有时需要依赖特定的包或者库的版本,所以不能有一个能适应所有 Python 应用的软件环境,很多时候不同的 Python 应用所依赖库的版本是冲突的,此时我们可以通过虚拟环境来解决这类问题。首先先通过conda activate env_name命令的方式,切换到我们的Python3.5 的版本,然后通过pip install virtualenv命令安装virtualenv,最后我们通过virtualenv myvenv指令创建一个虚拟环境。创建完成后会在当前目录下生成一个目录,然后进入到该目录下的bin目录下,执行source ./activate命令激活环境即可。

2.3 Superset的安装

Python环境安装完成后,打开终端,在命令行中输入如下命令,安装Superset,安装成功即可。

pip install apache-superset

3. 初始化数据库

执行如下命令,初始化一下数据库

superset db upgrade

有的时候可能会遇到一些包不存在的报错,这个时候,我们可以手动的安装一下,我在安装的过程中,报了如下的错:

Traceback (most recent call last):
  File "superset", line 5, in <module>
    from superset.cli import superset
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/__init__.py", line 21, in <module>
    from superset.app import create_app
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/app.py", line 45, in <module>
    from superset.security import SupersetSecurityManager
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/security/__init__.py", line 17, in <module>
    from superset.security.manager import SupersetSecurityManager  # noqa: F401
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/security/manager.py", line 44, in <module>
    from superset import sql_parse
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/sql_parse.py", line 18, in <module>
    from dataclasses import dataclass
ModuleNotFoundError: No module named 'dataclasses'

由于缺少了dataclasses模块,手动执行一下命令pip install dataclasses就安装即可。

4. 创建管理员账户

数据库初始化完成后,我们需要创建一个登录的账户,执行如下命令,创建一个账户superset fab create-admin,执行命令后,输入用户名、邮箱、密码即可创建成功,如下:

INFO:superset.utils.screenshots:No PIL installation found
Username [admin]: admin
User first name [admin]: admin
User last name [user]: admin
Email [admin@fab.org]: admin@fab.org
Password: 123456
Repeat for confirmation: 
Recognized Database Authentications.
Admin User admin created.

5. 初始化角色和权限

账户创建完成后,可以通过superset init命令,初始化角色和权限,执行结果如下:

INFO:superset.security.manager:Syncing role definition
Syncing Admin perms
INFO:superset.security.manager:Syncing Admin perms
Syncing Alpha perms
INFO:superset.security.manager:Syncing Alpha perms
Syncing Gamma perms
INFO:superset.security.manager:Syncing Gamma perms
Syncing granter perms
INFO:superset.security.manager:Syncing granter perms
Syncing sql_lab perms
INFO:superset.security.manager:Syncing sql_lab perms
Fetching a set of all perms to lookup which ones are missing
INFO:superset.security.manager:Fetching a set of all perms to lookup which ones are missing
Creating missing datasource permissions.
INFO:superset.security.manager:Creating missing datasource permissions.
Creating missing database permissions.
INFO:superset.security.manager:Creating missing database permissions.
Creating missing metrics permissions
INFO:superset.security.manager:Creating missing metrics permissions
Cleaning faulty perms
INFO:superset.security.manager:Cleaning faulty perms

6. 载入示例数据

Superset提供了一些实例数据,可以通过superset load_examples载入,不过由于服务器在国外,可能会出现导入失败的情况,可以尝试多导入几次,如果实在导入不了也没事,影响不大。

7. 启动服务

当上面内容完成后,我们就可以执行如下命令superset run -p 8000 --with-threads --reload --debugger来启动Supserset了,我们可以通过-p的参数来改变端口,如果不指定的话,默认端口为5000。

值得注意的是,如果是本地安装,通过以上命令启动,没有问题,但是如果是在云服务器上安装,当你用外网加端口的方式访问的时候,就无法访问,此时可以使用如下命令启动:superset run -h 0.0.0.0 -p 8000 --with-threads --reload --debugger

如果想要让superset在后台运行,可以使用如下命令启动:nohup superset runserver -d -p 8088

8. Superset 简单汉化

  1. 我们首先进入superset的安装目录,比如我的是这个目录:/BigDataEnv/bigdataEnv/lib/python3.8/site-packages/superset
  2. 找到这个config.py文件,将BABEL_DEFAULT_LOCALE = "en"中的en改为zh
  3. 从GitHub上下载汉化文件messages.po,并将其覆盖该目录的同名文件:/BigDataEnv/bigdataEnv/lib/python3.8/site-packages/flask_appbuilder/translations/zh/LC_MESSAGES/messages.po
  4. 执行如下命令,重新编译pybabel compile -d translations
  5. 重启superset即可。

值得注意的是,这种方式的汉化,其实只是汉化了一小部分的内容,大部分的东西都没有汉化完整,不过英文看着也还好,暂时先不管。

9. 附录

  • [Conda官网链接](https://conda.io/miniconda.html)
  • [虚拟环境参考文章链接](https://blog.csdn.net/qq_39241986/article/details/106654549)
  • [messages.po地址](https://github.com/ApacheInfra/superset/blob/master/superset/translations/zh/LC_MESSAGES/messages.po)

更多内容,也可以微信搜索我们的公众号【郑大钱呀】,风里雨里,一直等你。

相关推荐

赶紧收藏!编程python基础知识,本文给你全部整理好了

想一起学习编程Python的同学,趁我粉丝少,可以留言、私信领编程资料~Python基础入门既然学习Python,那么至少得了解下这门编程语言,知道Python代码执行过程吧。Python的历...

创建绩效改进计划 (PIP) 的6个步骤

每个经理都必须与未能达到期望的员工抗衡,也许他们的表现下降了,他们被分配了新的任务并且无法处理它们,或者他们处理了自己的任务,但他们的行为对他人造成了破坏。许多公司转向警告系统,然后在这些情况下终止。...

PI3K/AKT信号通路全解析:核心分子、上游激活与下游效应分子

PI3K/AKT/mTOR(PAM)信号通路是真核细胞中高度保守的信号转导网络,作用于促进细胞存活、生长和细胞周期进程。PAM轴上生长因子向转录因子的信号传导受到与其他多条信号通路的多重交叉相互作用的...

互联网公司要求签PIP,裁员连N+1都没了?

2021年刚画上句号,令无数互联网公司从业者闻风丧胆的绩效公布时间就到了,脉脉上已然炸了锅。阿里3.25、腾讯二星、百度四挡、美团绩效C,虽然名称五花八门,实际上都代表了差绩效。拿到差绩效,非但不能晋...

Python自动化办公应用学习笔记3—— pip工具安装

3.1pip工具安装最常用且最高效的Python第三方库安装方式是采用pip工具安装。pip是Python包管理工具,提供了对Python包的查找、下载、安装、卸载的功能。pip是Python官方提...

单片机都是相通的_单片机是串行还是并行

作为一个七年的从业者,单片机对于我个人而言它是一种可编程的器件,现在长见到的电子产品中几乎都有单片机的身影,它们是以单片机为核心,根据不同的功能需求,搭建不同的电路,从8位的单片机到32位的单片机,甚...

STM32F0单片机快速入门八 聊聊 Coolie DMA

1.苦力DMA世上本没有路,走的人多了,便成了路。世上本没有DMA,需要搬运的数据多了,便有了DMA。大多数同学应该没有在项目中用过这个东西,因为一般情况下也真不需要这个东西。在早期的单片机中...

放弃51单片机,直接学习STM32开发可能会面临的问题

学习51单片机并非仅仅是为了学习51本身,而是通过它学习一种方法,即如何仅仅依靠Datasheet和例程来学习一种新的芯片。51单片机相对较简单,是这个过程中最容易上手的选择,而AVR单片机则更为复杂...

STM32串口通信基本原理_stm32串口原理图

通信接口背景知识设备之间通信的方式一般情况下,设备之间的通信方式可以分成并行通信和串行通信两种。并行与串行通信的区别如下表所示。串行通信的分类1、按照数据传送方向,分为:单工:数据传输只支持数据在一个...

单片机的程序有多大?_单片机的程序有多大内存

之前一直很奇怪一个问题,每次写好单片机程序之后,用烧录软件进行烧录时,能看到烧录文件也就是hex的文件大小:我用的单片机芯片是STM32F103C8T6,程序储存器(flash)只有64K。从...

解析STM32单片机定时器编码器模式及其应用场景

本文将对STM32单片机定时器编码器模式进行详细解析,包括介绍不同的编码器模式、各自的优缺点以及相同点和不同点的应用场景。通过阅读本文,读者将对STM32单片机定时器编码器模式有全面的了解。一、引言...

两STM32单片机串口通讯实验_两个32单片机间串口通信

一、实验思路连接两个STM32单片机的串口引脚,单片机A进行发送,单片机B进行接收。单片机B根据接收到单片机A的指令来点亮或熄灭板载LED灯,通过实验现象来验证是否通讯成功。二、实验器材两套STM32...

基于单片机的智能考勤机设计_基于51单片机的指纹考勤机

一、设计背景随着科技水平的不断发展,在这么一个信息化的时代,智能化信息处理已是提高效率、规范管理和客观审查的最有效途径。近几年来,国内很多公司都在加强对企业人员的管理,考勤作为企业的基础管理,是公司...

STM32单片机详细教学(二):STM32系列单片机的介绍

大家好,今天给大家介绍STM32系列单片机,文章末尾附有本毕业设计的论文和源码的获取方式,可进群免费领取。前言STM32系列芯片是为要求高性能、低成本、低功耗的嵌入式应用设计的ARMCortexM...

STM32单片机的 Hard-Fault 硬件错误问题追踪与分析

有过单片机开发经验的人应该都会遇到过硬件错误(Hard-Fault)的问题,对于这样的问题,有些问题比较容易查找,有些就查找起来很麻烦,甚至可能很久都找不到问题到底是出在哪里。特别是有时候出现一次,后...