百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Amazon Kinesis Firehose-简单,高扩展性的数据摄入

liuian 2025-04-29 02:06 42 浏览

两年前,我们引入了 Amazon Kinesis,现在我们称之为Kinesis Streams,使你能够构建应用,以很高的吞吐量来收集,处理和分析流数据。我们想使你不用考虑构建和运行摄入服务器舰队或担忧监控,伸缩或交付可靠性。

Amazon Kinesis Firehose是为特定用途构建的,旨在使你能够更轻松地将流数据加载到AWS中。你仅仅创建一个交付流,将其路由到一个Amazon Simple Storage Service (S3)桶中和/或一个Amazon Redshift表中,将记录(每条记录最大1000KB)写入到流中。在这些场景背后,Firehose 将会为你料理好监控,伸缩,和数据管理所有这些方面。

再一次(我从不厌烦说这句),你可以花费更多的时间聚焦于你的应用,耗费较少的时间在基础设施上。

Firehose 内部机制

为了使事情保持简单,Firehose 不以任何方式对原始数据进行翻译或处理。你仅仅创建一个交付流,将数据记录写入该流中。在任何应要求而进行的压缩(客户端侧)和加密(服务器侧)后,记录被写入你指定的一个S3桶中。正如我的同事 James Hamilton(在其他语境中)喜欢说的那样,“它是那样地简单。”如果有必要,你甚至可以控制数据流缓冲区大小和缓冲间隔。

如果你的客户端代码在将记录送到Firehose 前对单个的逻辑记录进行隔离,它可以添加一个分隔符。否则,你可以稍后,一旦数据进入到云中,再识别记录的界限。

你的数据在S3中存储后,你有多种选择对其进行分析和处理。例如,你可以将一个 AWS Lambda函数附加到桶中,在对象到达桶中时对其进行处理。或者,你可以将你既存的Amazon EMR任务指向该桶,不需对任务做任何改动即可使其处理最新数据。

你也可以使用Firehose ,将你的数据路由到一个 Amazon Redshift集群。在Firehose 将你的原始数据存储到S3对象中后,它可以在每一个对象中调用一个RedshiftCOPY命令。这一命令很灵活,使你能够导入和处理多种格式(CVS,JSON,AVRO等等)的数据,仅隔离和存储筛选的列,将数据从一种类型转换为另一种类型,等等。

Firehose特性在控制台中的使用

你可以在 AWS Management Console(AWS管理控制台),AWS Command Line Interface (CLI,AWS命令行界面),或通过Firehose API完成以上功能。

让我们使用Firehose 控制台来创建一个交付流。我仅仅打开控制台,点击Create Delivery Stream。然后,我给我的交付流赋予了一个名称,选择了一个S3桶(或者创建一个新桶),创建一个IAM角色以便Firehose有权限向桶中写入数据:

我可以为交付流配置时延和压缩操作。我也可以选择使用我的一个 AWS Key Management Service(KMS,密钥管理业务)密钥加密数据:

一旦我的交付流创建完毕,我就可以在控制台中看到它了。

发布到一个交付流

下面是一些简单的Java代码,用来将一条记录(字符串“some data”)发布到我的流中:

PutRecordRequest putRecordRequest = new PutRecordRequest; 
putRecordRequest.setFirehoseName("incoming-stream"); 

String data = "some data" + "\n"; // add \n as a record separator 
Record record = new Record; 
record.setData(ByteBuffer.wrap(data.getBytes(StandardCharsets.UTF_8))); 

putRecordRequest.setRecord(record); 
firehoseClient.putRecord(putRecordRequest);

下面是在使用CLI环境下将记录发布到流中所使用的代码:

$ aws firehose put-record --delivery-stream-name incoming-stream --record Data="some data\n"

我们也提供了一个运行Linux 操作系统的代理。可以配置该代理监控另一个日志文件,并将它们路由到Firehose。

监控Kinesis Firehose 交付流

你可以在控制台中监控你的每一个交付流的CloudWatch 测量指标:

特性有关的数值

单个的交付流可以伸缩,每个小时可容纳多个十亿字节的数据。默认情况下,每一个流每秒可支持2500次对PutRecord或PutRecordBatch的调用,每个AWS账户你可以有多达五个流(这两个值都是管理者设置的限制,根据请求可以增加,所以只问问你是否需要设置更大的数值)。

该特性现在已可用了,你今天就可以开始使用它了。它是根据每个Firehose 摄入的数据量的大小定价的。

相关推荐

win10账户密码忘记了(win10账户密码忘记了进不去桌面了)

如果您忘记了Windows10账户的密码,可以尝试以下方法来恢复或重置密码:1.使用Microsoft账户重置密码:如果您使用的是Microsoft账户登录Windows10,则可...

win7电脑系统恢复(win7 恢复)
  • win7电脑系统恢复(win7 恢复)
  • win7电脑系统恢复(win7 恢复)
  • win7电脑系统恢复(win7 恢复)
  • win7电脑系统恢复(win7 恢复)
极速重装系统(极速重装系统安全吗)

1如果手机系统低无法安装巅峰极速,可以尝试升级手机系统或者寻找其他适配的版本。2低版本的手机系统可能不具备巅峰极速所需的硬件和软件要求,因此无法安装。升级手机系统可以获得更好的兼容性和性能,从而解...

电脑蓝屏怎么解决0x000000ed
电脑蓝屏怎么解决0x000000ed

电脑出现蓝屏,代码0X000000ED,首先可以尝试重启电脑,按F8进入安全模式,在安全模式下运行CMD命令窗口,之后在命令提示符下输入"chkdsk/f/r"按回车,然后按y,下次重新启动电脑时,操作系统会自动修复硬盘;如果安全模式...

2025-12-21 11:55 liuian

台式电脑能设置定时关机吗(台式电脑可以定时开机么)

找到“S3KBWake-UpFunction”或相似的选项(如“ResumeOnKBC”;2Mouse”等)、“ResumeOnPS/,可以进入BIOS主菜单的“PowerManag...

win7本地连接显示未识别的网络

可按以下方法操作:1、打开电脑“控制面板”,点击“网络连接”,选择本地连接,右键点击本地连接图标后选“属性”,在“常规”选项卡中双击“Internet协议(TCP/IP)”,选择“使用下面的IP地址...

怎么设置电脑自动锁屏时间(设置电脑自动锁屏时间并输入密码)

1、进入控制面板,选择系统与安全选项。2、点击更改计算机睡眠时间,即可设置自动锁屏时间,现在要设置30秒的锁屏,就选好30秒。3、设置好之后点击保存修改,保存好之后会进入电源计划界面,可以选择电源计划...

2025年wifi6路由器推荐(2021年wifi6路由器)

2021年性价比高的WIFI6千兆路由器是华为AX3Pro和小米AX6000。1.华为AX3Pro和小米AX6000在2021年的市场上价格相对于其他高端路由器来说更加亲民,而且它们都是目前市场上...

海马助手下载安装苹果(海马助手苹果版免费下载)

,苹果手机是可以下迅雷的,在一些助手(i4,海马,pp等)上可以下载到。但是已经很长时间没有维护,会不稳定,容易闪退。除了官方版,苹果其他服务器互通吧好像,只是不能换服务器登录...

路由器使用教程(路由器使用教程详细)

你先登录路由器,打开“高级设置”-“弹性端口”配置LAN口数大于或等于2个,然后打开“高级设置”-“端口镜像”,勾选“启用”,源端口选择连接内网的端口,镜像端口选择连接审请设备的端口,保存配置即可。他...

bios设置恢复出厂设置(bios怎么恢复出厂设置后果)

如果我们的BIOS主板设置有误,会造成某些硬件无法正常工作,这时我们就需要对BIOS进行恢复出厂设置。主要有两种方法:第一种方法:第一步:电脑开机时不停按Delete键(笔记本一般是F2键)进入BIO...

有线网络怎么连接(家里有网线怎么装wifi)

1.操作之前将机顶盒电视机连接好;2.用遥控器移动到设置的位置点击“OK”;3.进入设置界面后点击“网络设置”,如果WIFI有密码点击进入,如果没有密码只需要自动选择即可;4.进入以后点击“WIFI连...

新风系统如何安装图解(新风系统怎么安装效果好)
新风系统如何安装图解(新风系统怎么安装效果好)

新风系统怎么安装—新风系统主体安装1.主机吊装主机的安装位置一般是卫生间、阳台或厨房的吊顶内,安装时要注意其离风道不能太长,而且机器最好安装在风道,其通道还要避免弯口,这样就能减少阻力。主机安装时其吊杆螺母要有安全防松措施,使其安装牢固,...

2025-12-21 07:05 liuian

安卓最好的游戏模拟器(安卓最好用的游戏模拟器)

PPSSPP是安卓平台上最出色的PSP模拟器,该模拟器目前已可以正常运行大多数的PSP游戏,游戏内置中文,请在设置中开启。PPSSPP是由知名NGC/Wii模拟器Dolphin开发小组主要成员之一hr...

手机连不上wifi一直在获取ip地址

1.长按WIFI的SSID名,弹出菜单,选择修改网络。2.点击钩选显示高级选项。3.在IP设置里,默认是DHCP获取IP地址,现在改成静态。4.录入固定IP地址,都是192.168.0.XX或192....