百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

商业智能开源分析工具Superset介绍和安装

liuian 2024-12-19 14:46 72 浏览

1. 什么是Superset?

Apache Superset是一个现代的、企业级的商业智能(BI)网页端的应用程序,我们可以简单的理解成它是一个开源的数据可视化工具。所谓可视化,简单的说就是把数据转换成图表,以一种更直观的方式来展现数据。其支持丰富的数据源连接,如:MySQL、DB2、SQL Server、Oracle等,支持多种可视化方式,并能够对用户实现细粒度的权限控制。该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询等。Superset基本架构:前端基于JavaScript,后端基于Python。

2. 环境搭建

2.1 Conda 安装

这里我们以Linux(Centos 7)的操作系统为例,个人建议还是使用Linux系统,Windows系统可能坑比较多,由于Superset的后端是基于Python的,所以我们首先需要安装Python,为了方便我们对不同版本的Python进行管理,这里我们使用conda来搭建Python的环境,conda默认随miniconda或anaconda发行,因此要安装conda,只需要安装miniconda或anconda即可,我们这里使用miniconda,安装步骤如下:

  1. 首先从官网找到conda下载链接,然后使用wget命令下载,代码如下:
wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
  1. 文件下载完成后,使用chmod命令为文件赋权:
chmod 777 Miniconda3-latest-Linux-x86_64.sh #给执行权限
  1. 执行文件,一路安装即可
bash Miniconda3-latest-Linux-x86_64.sh #运行

安装完成后,我们可以通过conda -V,查看版本:

(base) [root@iZ8vb15btme7rdyvwu43dyZ bin]# conda -V
conda 4.10.3

下面我们开始创建python的环境,这里我们我们使用的python版本为3.6,常用的conda命令如下:

# 查看已有的虚拟环境
conda env list 
# 创建一个conda环境
conda create -n env_name python=x.x
# 删除一个conda环境
conda remove -n env_name --all
# 激活conda环境
conda activate env_name
# 退出conda环境
conda deactivate

当我们进入某一个虚拟环境后,我们可以使用如下的命令,进行包的安装、更新等操作:

# 查看已安装的package
conda list
# 安装某个package
conda install [package]
# 删除某个package
conda remove [package]
# 更新某个package
conda update [package]
# 更新conda,保持conda最新
conda update conda

2.2 虚拟环境安装

Python 应用有时需要依赖特定的包或者库的版本,所以不能有一个能适应所有 Python 应用的软件环境,很多时候不同的 Python 应用所依赖库的版本是冲突的,此时我们可以通过虚拟环境来解决这类问题。首先先通过conda activate env_name命令的方式,切换到我们的Python3.5 的版本,然后通过pip install virtualenv命令安装virtualenv,最后我们通过virtualenv myvenv指令创建一个虚拟环境。创建完成后会在当前目录下生成一个目录,然后进入到该目录下的bin目录下,执行source ./activate命令激活环境即可。

2.3 Superset的安装

Python环境安装完成后,打开终端,在命令行中输入如下命令,安装Superset,安装成功即可。

pip install apache-superset

3. 初始化数据库

执行如下命令,初始化一下数据库

superset db upgrade

有的时候可能会遇到一些包不存在的报错,这个时候,我们可以手动的安装一下,我在安装的过程中,报了如下的错:

Traceback (most recent call last):
  File "superset", line 5, in <module>
    from superset.cli import superset
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/__init__.py", line 21, in <module>
    from superset.app import create_app
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/app.py", line 45, in <module>
    from superset.security import SupersetSecurityManager
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/security/__init__.py", line 17, in <module>
    from superset.security.manager import SupersetSecurityManager  # noqa: F401
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/security/manager.py", line 44, in <module>
    from superset import sql_parse
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/sql_parse.py", line 18, in <module>
    from dataclasses import dataclass
ModuleNotFoundError: No module named 'dataclasses'

由于缺少了dataclasses模块,手动执行一下命令pip install dataclasses就安装即可。

4. 创建管理员账户

数据库初始化完成后,我们需要创建一个登录的账户,执行如下命令,创建一个账户superset fab create-admin,执行命令后,输入用户名、邮箱、密码即可创建成功,如下:

INFO:superset.utils.screenshots:No PIL installation found
Username [admin]: admin
User first name [admin]: admin
User last name [user]: admin
Email [admin@fab.org]: admin@fab.org
Password: 123456
Repeat for confirmation: 
Recognized Database Authentications.
Admin User admin created.

5. 初始化角色和权限

账户创建完成后,可以通过superset init命令,初始化角色和权限,执行结果如下:

INFO:superset.security.manager:Syncing role definition
Syncing Admin perms
INFO:superset.security.manager:Syncing Admin perms
Syncing Alpha perms
INFO:superset.security.manager:Syncing Alpha perms
Syncing Gamma perms
INFO:superset.security.manager:Syncing Gamma perms
Syncing granter perms
INFO:superset.security.manager:Syncing granter perms
Syncing sql_lab perms
INFO:superset.security.manager:Syncing sql_lab perms
Fetching a set of all perms to lookup which ones are missing
INFO:superset.security.manager:Fetching a set of all perms to lookup which ones are missing
Creating missing datasource permissions.
INFO:superset.security.manager:Creating missing datasource permissions.
Creating missing database permissions.
INFO:superset.security.manager:Creating missing database permissions.
Creating missing metrics permissions
INFO:superset.security.manager:Creating missing metrics permissions
Cleaning faulty perms
INFO:superset.security.manager:Cleaning faulty perms

6. 载入示例数据

Superset提供了一些实例数据,可以通过superset load_examples载入,不过由于服务器在国外,可能会出现导入失败的情况,可以尝试多导入几次,如果实在导入不了也没事,影响不大。

7. 启动服务

当上面内容完成后,我们就可以执行如下命令superset run -p 8000 --with-threads --reload --debugger来启动Supserset了,我们可以通过-p的参数来改变端口,如果不指定的话,默认端口为5000。

值得注意的是,如果是本地安装,通过以上命令启动,没有问题,但是如果是在云服务器上安装,当你用外网加端口的方式访问的时候,就无法访问,此时可以使用如下命令启动:superset run -h 0.0.0.0 -p 8000 --with-threads --reload --debugger

如果想要让superset在后台运行,可以使用如下命令启动:nohup superset runserver -d -p 8088

8. Superset 简单汉化

  1. 我们首先进入superset的安装目录,比如我的是这个目录:/BigDataEnv/bigdataEnv/lib/python3.8/site-packages/superset
  2. 找到这个config.py文件,将BABEL_DEFAULT_LOCALE = "en"中的en改为zh
  3. 从GitHub上下载汉化文件messages.po,并将其覆盖该目录的同名文件:/BigDataEnv/bigdataEnv/lib/python3.8/site-packages/flask_appbuilder/translations/zh/LC_MESSAGES/messages.po
  4. 执行如下命令,重新编译pybabel compile -d translations
  5. 重启superset即可。

值得注意的是,这种方式的汉化,其实只是汉化了一小部分的内容,大部分的东西都没有汉化完整,不过英文看着也还好,暂时先不管。

9. 附录

  • [Conda官网链接](https://conda.io/miniconda.html)
  • [虚拟环境参考文章链接](https://blog.csdn.net/qq_39241986/article/details/106654549)
  • [messages.po地址](https://github.com/ApacheInfra/superset/blob/master/superset/translations/zh/LC_MESSAGES/messages.po)

更多内容,也可以微信搜索我们的公众号【郑大钱呀】,风里雨里,一直等你。

相关推荐

home键是什么意思苹果手机(home键是苹果手机哪个键)

就是手机屏幕正下方的那个圆形的按钮,就是苹果手机的home键,home键的作用比较大,可以用来设置指纹解锁,单机home键可以返回主屏幕界面,双击home键可以弹出后台应用程序可以进行清楚,还可以通过...

tplink说明书图片(tp-link路由器说明书步骤图)

第一步连接路由器WIFI在手机获取IP地址里找到路由器网关地址,第二步在浏览器地址栏输入路由器网关地址,之后会跳转到路由器管理员登录界面,输入账号密码就可以进入路由后台管理路由,如果提示路由器密码错误...

如何不安装flash玩4399(现在4399不提供flash如何玩游戏)

没有flash是玩不了的,需要开启flash才可以。1、首先打开浏览器,进入4399的游戏页面。2、进入游戏页面后,点击【已被屏蔽】文字。3、然后右上角会出现窗口,点击【管理】按钮。4、进入管理页面后...

chrome download apk(chromedownloadapk in english)

手机下载安装的第三方应用出现问题,无法正常使用,建议按照以下方法操作:1.关闭重新启动该应用。2.建议将此软件卸载重新安装尝试。3.更换其他版本尝试。4.更新下手机系统版本后安装尝试5.备份手机数据(...

qq空间官网手机登录网页版(qq空间官网登陆入口)
qq空间官网手机登录网页版(qq空间官网登陆入口)

z.qq.com可以通过以下方式登录手机QQ空间:1、使用手机登录手机腾讯网3g.qq.com,点击“空间”,根据提示QQ号码和QQ密码就可以登录;2、通过手机直接输入手机QQ空间网址z.qq.com,根据提示操作即可登录;3、下载手机Q...

2025-12-22 13:55 liuian

windows11我的电脑在哪里打开

1/6通过“开始”进入“设置”-“时间和语言”。2/6在“时间和语言”界面选择“区域”3/6这里我们将区域更改位“新加披”,退出。4/6打开微软自带的市场,搜索“你的手机”获取并下载。5/6安装完成后...

win10怎么取消开机自启动(win10如何关闭开机自动启动)

要关闭Windows10的开机自动启动程序,你可以按下Win+R键,输入"msconfig"并按回车键打开系统配置工具。在"启动"选项卡中,你可以看到所有开机自动...

手机cpu排名2025(手机cpu排名榜)

一、2022手机CPU性能综合排名前八名手机CPU:1、型号:苹果A16---综合分数:暂无2、型号:骁龙8gen1---综合分数:42333、联发科天玑9000---综合分数:38724、...

论坛系统(论坛系统数据流图)

BBS是电子布告栏系统的简称,一种网站系统,也是目前流行网络论坛的前身。它允许用户使用终端程序通过调制解调器拨接或者因特网来进行连接,BBS站台提供布告栏、分类讨论区、新闻阅读、软件下载与上传、游戏、...

hp1020plus打印机无法打印(惠普1020plus打印机突然不能打印了)

 删除惠普打印机驱动和软件:1.如果你的打印机已通过USB连接到电脑,断开USB连接;2.打开控制面板—程序和功能(卸载或更改应用程序);3.在软件列表中找到惠普打印机,将其卸载;4.重启电脑...

wifi密码破解器电脑版(wifi密码破解工具电脑版)

肯定不是万能钥匙这种“破解”wifi的东西。不是一两次见到把万能钥匙当做破解wifi用的人了,但实际上那玩意就是个分享wifi的软件。你连上一个wifi,密码就会被分享到云端(可以不分享),别...

手机临时文件夹在哪个位置(手机临时文件夹在哪个位置找)

1.手机文件临时文件是指在手机使用过程中产生的临时文件。2.手机应用程序在运行时需要产生一些临时文件,如缓存文件、日志文件、临时下载文件等,这些文件可以提高应用程序的运行效率和用户体验。但是,这些...

安卓10系统下载(安卓10 下载)

方法及步骤:  其实使用安卓车机下载歌曲的方法十分的简单,具体操作步骤和安卓手机一模一样。  首先我们需要在车机的应用商店上,下载一个音乐播放器,例如网易云音乐或者QQ音乐等。  下载完成后点击进入...

华硕人工客服24小时吗(华硕售后人工客服)

华硕服务中心广东省惠州市惠东县城平深路(创富斜对面)惠东同心电脑城1L11(1.3km)笔记本电脑,平板电脑华硕服务中心广东省惠州市惠东县平山镇同心电脑城1F26(1.3km)笔记本电脑,平...

电脑音量小喇叭不见了(电脑声音喇叭图标不见了怎么办)

如果您电脑上的小喇叭(扬声器)不见了,可以尝试以下方法找回:1.检查设备管理器:在Windows下,右键点击“我的电脑”(或此电脑)->点击“属性”->点击“设备管理器”,查看“声音、视...