百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

商业智能开源分析工具Superset介绍和安装

liuian 2024-12-19 14:46 35 浏览

1. 什么是Superset?

Apache Superset是一个现代的、企业级的商业智能(BI)网页端的应用程序,我们可以简单的理解成它是一个开源的数据可视化工具。所谓可视化,简单的说就是把数据转换成图表,以一种更直观的方式来展现数据。其支持丰富的数据源连接,如:MySQL、DB2、SQL Server、Oracle等,支持多种可视化方式,并能够对用户实现细粒度的权限控制。该工具主要特点是可自助分析、自定义仪表盘、分析结果可视化、用户/角色权限控制,还集成了一个SQL编辑器,可以进行SQL编辑查询等。Superset基本架构:前端基于JavaScript,后端基于Python。

2. 环境搭建

2.1 Conda 安装

这里我们以Linux(Centos 7)的操作系统为例,个人建议还是使用Linux系统,Windows系统可能坑比较多,由于Superset的后端是基于Python的,所以我们首先需要安装Python,为了方便我们对不同版本的Python进行管理,这里我们使用conda来搭建Python的环境,conda默认随miniconda或anaconda发行,因此要安装conda,只需要安装miniconda或anconda即可,我们这里使用miniconda,安装步骤如下:

  1. 首先从官网找到conda下载链接,然后使用wget命令下载,代码如下:
wget -c https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh
  1. 文件下载完成后,使用chmod命令为文件赋权:
chmod 777 Miniconda3-latest-Linux-x86_64.sh #给执行权限
  1. 执行文件,一路安装即可
bash Miniconda3-latest-Linux-x86_64.sh #运行

安装完成后,我们可以通过conda -V,查看版本:

(base) [root@iZ8vb15btme7rdyvwu43dyZ bin]# conda -V
conda 4.10.3

下面我们开始创建python的环境,这里我们我们使用的python版本为3.6,常用的conda命令如下:

# 查看已有的虚拟环境
conda env list 
# 创建一个conda环境
conda create -n env_name python=x.x
# 删除一个conda环境
conda remove -n env_name --all
# 激活conda环境
conda activate env_name
# 退出conda环境
conda deactivate

当我们进入某一个虚拟环境后,我们可以使用如下的命令,进行包的安装、更新等操作:

# 查看已安装的package
conda list
# 安装某个package
conda install [package]
# 删除某个package
conda remove [package]
# 更新某个package
conda update [package]
# 更新conda,保持conda最新
conda update conda

2.2 虚拟环境安装

Python 应用有时需要依赖特定的包或者库的版本,所以不能有一个能适应所有 Python 应用的软件环境,很多时候不同的 Python 应用所依赖库的版本是冲突的,此时我们可以通过虚拟环境来解决这类问题。首先先通过conda activate env_name命令的方式,切换到我们的Python3.5 的版本,然后通过pip install virtualenv命令安装virtualenv,最后我们通过virtualenv myvenv指令创建一个虚拟环境。创建完成后会在当前目录下生成一个目录,然后进入到该目录下的bin目录下,执行source ./activate命令激活环境即可。

2.3 Superset的安装

Python环境安装完成后,打开终端,在命令行中输入如下命令,安装Superset,安装成功即可。

pip install apache-superset

3. 初始化数据库

执行如下命令,初始化一下数据库

superset db upgrade

有的时候可能会遇到一些包不存在的报错,这个时候,我们可以手动的安装一下,我在安装的过程中,报了如下的错:

Traceback (most recent call last):
  File "superset", line 5, in <module>
    from superset.cli import superset
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/__init__.py", line 21, in <module>
    from superset.app import create_app
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/app.py", line 45, in <module>
    from superset.security import SupersetSecurityManager
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/security/__init__.py", line 17, in <module>
    from superset.security.manager import SupersetSecurityManager  # noqa: F401
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/security/manager.py", line 44, in <module>
    from superset import sql_parse
  File "/root/env/bigdataEnv/env_superset/lib/python3.6/site-packages/superset/sql_parse.py", line 18, in <module>
    from dataclasses import dataclass
ModuleNotFoundError: No module named 'dataclasses'

由于缺少了dataclasses模块,手动执行一下命令pip install dataclasses就安装即可。

4. 创建管理员账户

数据库初始化完成后,我们需要创建一个登录的账户,执行如下命令,创建一个账户superset fab create-admin,执行命令后,输入用户名、邮箱、密码即可创建成功,如下:

INFO:superset.utils.screenshots:No PIL installation found
Username [admin]: admin
User first name [admin]: admin
User last name [user]: admin
Email [admin@fab.org]: admin@fab.org
Password: 123456
Repeat for confirmation: 
Recognized Database Authentications.
Admin User admin created.

5. 初始化角色和权限

账户创建完成后,可以通过superset init命令,初始化角色和权限,执行结果如下:

INFO:superset.security.manager:Syncing role definition
Syncing Admin perms
INFO:superset.security.manager:Syncing Admin perms
Syncing Alpha perms
INFO:superset.security.manager:Syncing Alpha perms
Syncing Gamma perms
INFO:superset.security.manager:Syncing Gamma perms
Syncing granter perms
INFO:superset.security.manager:Syncing granter perms
Syncing sql_lab perms
INFO:superset.security.manager:Syncing sql_lab perms
Fetching a set of all perms to lookup which ones are missing
INFO:superset.security.manager:Fetching a set of all perms to lookup which ones are missing
Creating missing datasource permissions.
INFO:superset.security.manager:Creating missing datasource permissions.
Creating missing database permissions.
INFO:superset.security.manager:Creating missing database permissions.
Creating missing metrics permissions
INFO:superset.security.manager:Creating missing metrics permissions
Cleaning faulty perms
INFO:superset.security.manager:Cleaning faulty perms

6. 载入示例数据

Superset提供了一些实例数据,可以通过superset load_examples载入,不过由于服务器在国外,可能会出现导入失败的情况,可以尝试多导入几次,如果实在导入不了也没事,影响不大。

7. 启动服务

当上面内容完成后,我们就可以执行如下命令superset run -p 8000 --with-threads --reload --debugger来启动Supserset了,我们可以通过-p的参数来改变端口,如果不指定的话,默认端口为5000。

值得注意的是,如果是本地安装,通过以上命令启动,没有问题,但是如果是在云服务器上安装,当你用外网加端口的方式访问的时候,就无法访问,此时可以使用如下命令启动:superset run -h 0.0.0.0 -p 8000 --with-threads --reload --debugger

如果想要让superset在后台运行,可以使用如下命令启动:nohup superset runserver -d -p 8088

8. Superset 简单汉化

  1. 我们首先进入superset的安装目录,比如我的是这个目录:/BigDataEnv/bigdataEnv/lib/python3.8/site-packages/superset
  2. 找到这个config.py文件,将BABEL_DEFAULT_LOCALE = "en"中的en改为zh
  3. 从GitHub上下载汉化文件messages.po,并将其覆盖该目录的同名文件:/BigDataEnv/bigdataEnv/lib/python3.8/site-packages/flask_appbuilder/translations/zh/LC_MESSAGES/messages.po
  4. 执行如下命令,重新编译pybabel compile -d translations
  5. 重启superset即可。

值得注意的是,这种方式的汉化,其实只是汉化了一小部分的内容,大部分的东西都没有汉化完整,不过英文看着也还好,暂时先不管。

9. 附录

  • [Conda官网链接](https://conda.io/miniconda.html)
  • [虚拟环境参考文章链接](https://blog.csdn.net/qq_39241986/article/details/106654549)
  • [messages.po地址](https://github.com/ApacheInfra/superset/blob/master/superset/translations/zh/LC_MESSAGES/messages.po)

更多内容,也可以微信搜索我们的公众号【郑大钱呀】,风里雨里,一直等你。

相关推荐

苹果ios打包的ipa应用APP怎么不能安装?多种安装不上的原因排查

亲爱的同学们,非常高兴能和同学们一起探讨关于苹果应用安装失败的问题。作为一个开发者,我们很可能会遇到这样的情况:开发好一个应用,兴致勃勃地想把它运行到手机上去测试,结果发现安装失败了。而此时,定位问题...

Flutter 系列 - 环境搭建

#头条创作挑战赛#本文同步本人掘金平台的文章:https://juejin.cn/post/7002401225270362143Flutter作为火热的跨端工具包,在github上超过12...

XV6 操作系统入门系列-01-环境配置

xv6是一个用于教育目的的简单Unix操作系统,基于Unix第六版(Version6,V6)开发,运行在RISC-V处理器上。它由麻省理工学院(MIT)开发,用于操作系统课程(Ope...

速递|已获2000万美元融资,苹果前高管携Unblocked挑战代码理解“黑箱难题”

图片来源:Unblocked每位开发者都有自己独特的编码风格。尽管公司制定了最佳实践并编写了文档,开发者要理解他人的代码库仍非易事。为解决这一问题,DennisPilarinos开发了一款名为U...

C语言之编译器集合

C语言有多种不同的编译器,以下是常见的编译工具及其特点:一、主流C语言编译器1.GCC(GNUCompilerCollection)特点:开源、跨平台,支持多种语言(C、C++、Fortran...

Xamarin for Visual Studio v4.0正式发布

XamarinforVisualStudio让开发者可以在Windows上用VisualStudio开发原生iOS,Android和Windows应用程序。XamarinforVis...

macOS/iOS开发必备:Dylib文件的深度解析与安全防护

在macOS和iOS开发中,dylib文件是开发者们不可或缺的工具。它不仅能够实现代码复用、减少内存占用,还能支持程序的模块化更新。然而,随着技术的发展,dylib文件的安全性也面临着诸多挑战,例如被...

微软Islandwood项目启动:iOS应用轻松移植至Win10

IT之家讯5月1日消息,在昨天的Build2015开发者大会上,微软详细阐述了iOS应用程序移植到Win10平台的更多细节信息。现在,微软正式开启了ProjectIslandwood,该项目旨在搭...

macOS26中被库克删掉的启动台,有开源的项目实现了

这是一个第三方实现的,只实现了最基本的功能,包括:启动台应用程序文件夹打开应用删除应用为什么要做这个macOS26版本中,自带的启动台功能被库克老小子删除了,导致使用起来很不习惯。所以就自己做了...

环境配置劝退?Rust + Slint开发环境搭建全攻略,手把手教你避坑!

各位对科技充满好奇,又跃跃欲试想亲手写代码的朋友们!是不是每次下定决心要学习一门新语言、尝试一个新框架时,都会被“环境配置”这第一道坎儿给劝退?下载一堆软件,安装各种工具,然后面对一堆看不懂的错误提示...

MyEclipse移动开发教程:构建可分发的PhoneGap应用程序

本教程将用PhoneGap远程构建服务(remotebuildservices)去构建一个PhoneGap应用程序。当然,你也可以在本地构建PhoneGap应用程序。需要多说一句的是,Phone...

Android和iOS应用可以快速移植到Win10

|责编:刘菲菲在今天凌晨的Build2015开发者大会上,微软宣布所有Android和iOS应用,都可以通过简单的修改代码,直接生成适用于Win10的应用。也就是说,开发者们不需要学习更多内容,就...

Injection for Xcode:成吨的提高开发效率

本文为投稿文章,作者:@没故事的卓同学直接放demo演示动图:我很久以前就希望有这么一种功能,直接修改某行代码,F5一下就能刷新这个实例,而不用重写build整个项目。靠夭,我不是在说前端!没想居然有...

抖音品质建设 - iOS启动优化《原理篇》

前言启动是App给用户的第一印象,启动越慢用户流失的概率就越高,良好的启动速度是用户体验不可缺少的一环。启动优化涉及到的知识点非常多面也很广,一篇文章难以包含全部,所以拆分成两部分:原理和实践。本...

蓝鸥郑州iOS培训老师分享的iOS支付知识

最近常用朋友问iOS支付方面的问题,郑州iOS培训老师就和大家分享一些关于iOS支付方面的知识,希望对大家有所帮助。支付宝iOS使用支付宝进行一个完整的支付功能,大致有以下步骤:1>先与支付宝...