当前位置：网站首页 > IT知识 > 正文

从Blob storage中导入大量json文件到ADX进行数据分析

liuian 2024-12-26 15:03 48 浏览

在对一个产品的商业行为和表现进行分析时，我们经常需要用到很多日志作为数据源。目前很多系统通用的做法是每天会写一个日志文件，并且保存在Azure Blob Storage中，这样成本很低，同时也支持任何语言直接存取，包括后续加工利用。

本例中，我们需要对一共Blob container下面超过10万个日志文件进行分析，他们都是json格式的文件，格式相同，但每个文件中的数据会有多又少。

我们希望ADX来进行强大的分析，这里可以利用一个独立的工具来实现数据导入，无需编写代码。

官方参考文档 https://learn.microsoft.com/en-us/azure/data-explorer/lightingest。下面是我的这个例子，用了大约3个小时，处理了106361个文件，过程丝滑，结果令人满意。

今日福利，再赠送一个数据处理技巧，因为json数据中可能会有数组，你可能会在导入后需要展平数据，这里会用到一个特殊的操作符（mv-expand)，和一个扩展插件（bag_unpack)，很好很强大，你值得拥有。

.set-or-replace competitors <| archives | project competitors, id | mv-expand competitors | evaluate bag_unpack(competitors)

blob转json

上一篇：Blob-对象介绍 blob类型对应java里的什么
下一篇：Java中toString该如何转json呢? java tojsonstring

相关推荐

4000台式电脑最好的组装配置: 四千元价格组装电脑主机与五千元组装电脑主机的价格类似，因为电脑主机就几个大部件，电脑主机主板是多少代的产品？主板内存的插槽数？电脑处理器等如果是自己组装，都可以配置到十二代产品，电脑硬盘可以分为256G固态硬盘做系统盘，1T机械硬盘作为工作...; 2025-11-06 20:05 liuian

linux是一种什么系统（linux属于什么系统）: Linux，全称GNU/Linux，是一种免费使用和自由传播的类UNIX操作系统，是一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。其内核由林纳斯·本纳第克特·托瓦兹于1991年1...

手机管理大师免费版（手机管理大师极速版）: 使用手机“文件管理”打开文件夹时提示访问受限，需要前往“文件”应用查看1.进入手机设置——安全——应用权限——权限/应用2.在手机桌面找到手机管家——权限隐私——应用权限——权限/应用?当然，相对于被...

电脑能开机但是进不去桌面怎么办: 打开任务管理器按Ctrl+Shift+Esc打开任务管理器。文件中运行新任务点击文件，运行新任务。输入指令重启桌面输入explorer.exe，点击确定，等待桌面重启完成就可以了。电脑已经是我们生活中...

怎样解除自动关机模式（怎样解除自动开关机）: 1、打开手机主界面，找到系统自带的“时钟”应用，点击打开它。2、点击进入时钟后，点击右下角的“计时器”。3、进入到计时器后，点击“在计时结束启用雷达”这个选项。4、然后在这里，下拉到最下面，勾选“停...

电脑最高配置是什么配置2025: 一，2023最新主流电脑装机配置如下。二，处理器可以使用十二代的i512400或者i512490f，内存16gb双通道，显卡rtx3060，主板可以使用b660m或者h610m。三，如果十三代酷睿...

MySQL慢查询优化:从explain到索引，DBA手把手教你提升10倍性能: 数据库性能是应用系统的生命线，而慢查询就像隐藏在系统中的定时炸弹。某电商平台曾因一条未优化的SQL导致订单系统响应时间从200ms飙升至8秒，最终引发用户投诉和订单流失。今天我们就来系统学习MySQL...

一文读懂SQL五大操作类别(DDL/DML/DQL/DCL/TCL)的基础语法: 在SQL中，DDL、DML、DQL、DCL、TCL是按操作类型划分的五大核心语言类别，缩写及简介如下：DDL（DataDefinitionLanguage，数据定义语言）：用于定义和管理数据库结构...

闲来无事，学学Mysql增、删，改，查: Mysql增、删，改，查1“增”——添加数据1.1为表中所有字段添加数据1.1.1INSERT语句中指定所有字段名语法：INSERTINTO表名（字段名1，字段名2，…）VALUES（值1...

数据库:MySQL 高性能优化规范建议: 数据库命令规范所有数据库对象名称必须使用小写字母并用下划线分割所有数据库对象名称禁止使用MySQL保留关键字（如果表名中包含关键字查询时，需要将其用单引号括起来）数据库对象的命名要能做到见名识意，...

下载工具合集_下载工具手机版: 迅雷，在国内的下载地位还是很难撼动的，所需要用到的地方还挺多。缺点就是不开会员，软件会限速。EagleGet，全能下载管理器，支持HTTP(S)FTPMMSRTSP协议，也可以使用浏览器扩展检测...

mediamtx v1.15.2 更新详解:功能优化与问题修复: mediamtxv1.15.2已于2025年10月14日发布，本次更新在功能、性能优化以及问题修复方面带来了多项改进，同时也更新了部分依赖库并提升了安全性。以下为本次更新的详细内容：...

声学成像仪:泄露监测 “雷达” 方案开启精准防控: 声学成像仪背景将声像图与阵列上配装的摄像实所拍的视频图像以透明的方式叠合在一起，就形成了可直观分析被测物产生状态。这种利用声学、电子学和信息处理等技术，变换成人眼可见的图像的技术可以帮助人们直观地认识...

最稳存储方案:两种方法将摄像头接入威联通Qu405，录像不再丢失: 今年我家至少被4位邻居敲门，就是为了查监控！！！原因是小区内部监控很早就停止维护了，半夜老有小黄毛掰车门偷东西，还有闲的没事划车的，车主损失不小，我家很早就配备监控了，人来亮灯有一定威慑力，不过监控设...

离岗检测算法_离岗检查内容: 一、研发背景如今社会许多岗位是严禁随意脱离岗位的，如塔台、保安室、监狱狱警监控室等等，因为此类行为可能会引起重大事故，而此类岗位监督管理又有一定困难，因此促生了智能视频识别系统的出现。二、产品概述及工...

一周热门

最近发表

首页
收录
顶部