[翻译]phoenix的配置项(phoenix framework)
liuian 2025-03-29 19:29 14 浏览
自己在工作中使用到了phoenix, 过程中也使用到了一些phoenix的基本配置项,发现配置的还挺多的,就把官网上的一些翻译了过来,权当记录吧
原文地址:
http://phoenix.apache.org/tuning.html
属性名称 | 属性描述 | 默认值 |
phoenix.query.timeoutMs | 查询超时时间,默认为10分钟,单位:毫秒 | 600000 |
phoenix.query.keepAliveMs | 当客户端的线程超过线程池的核心线程数量时,空闲线程等等待任务的默认时间。超过这个时间,空闲线程就会关闭,默认是60s | 60000 |
phoenix.query.threadPoolSize | 客户端线程池的线程数量,当集群扩大时,这个数量最好也增大 | 128 |
phoenix.query.queueSize | 线程池的队列最在深度,超过这个深度的任务就会被拒绝。当值为0的时候,就会使用 SynchronousQueue | 5000 |
phoenix.stats.guidepost.width | 服务器端参数,这个参数指定集群传输的字节指标,值较小时,会增加并行计算,但也增加客户端合并块的数量。(初步理解,当客户端数据数据到100MB时,就会发送到服务端。数值小的时候,可以多线程发送) | 100MB |
phoenix.stats.guidepost.per.region | 服务器端参数, 指定每个region的指标。如果这个值大于0,那么guidepost.width就会是 MAX_FILE_SIZE of table / phoenix.stats.guidepost.per.region. ,否则就会使用phoenix.stats.guidepost.width,没有默认值 | None |
phoenix.stats.updateFrequency | 服务器端参数, 指定 statistics table的统计信息的刷新频率,刷新后会通知客户端。默认是15分钟 | 900000 |
phoenix.stats.useCurrentTime | 服务器高级参数,为真:当hbase表发生合并或者compactions时,统计表会用服务器的当前时间作为行的时间戳。为false:就会使用表的被统计的最大的时间戳。除非你自己自己插入数据时,自己控制时间戳,最好使用默认。 | true |
phoenix.query.spoolThresholdBytes | 并行查询结果的阈值,超过这个阈值,就会溢出到硬盘。默认为20MB,单位:字节 | 20971520 |
phoenix.query.maxSpoolToDiskBytes | 并行查询结果最大的字节数,超过这个阈值,查询就会失败。默认是1GB | 1024000000 |
phoenix.query.maxGlobalMemoryPercentage | 所有线程使用的最大堆内存( Runtime.getRuntime().maxMemory())的百分比.只会对小的内存跟踪。主要是统计group by aggregation过程中产生的map内存的使用。当到达这个值的时候,会尝试获取更多的内存。主要就是节省内存的使用。默认是15% | 15 |
phoenix.query.maxGlobalMemorySize | 所有线程使用的最大内存的字节数。如果设置这个参数,就会使用phoenix.query.maxGlobalMemorySize和phoenix.query.maxGlobalMemoryPercentage的最小值 | |
phoenix.query.maxGlobalMemoryWaitMs | 当内存不够时,client就会被阻塞。这个参数是最大的等待时间。超过这个时间。就会抛出 InsufficientMemoryException 默认是10s | 10000 |
phoenix.query.maxTenantMemoryPercentage | 所有消费者能够占用phoenix.query.maxGlobalMemoryPercentage的最大的占用比例,超过这个值,就会抛出 InsufficientMemoryException 默认是100% | 100 |
phoenix.query.dateFormat | 默认时间格式。TO_CHAR( | yyyy-MM-dd HH:mm:ss |
phoenix.query.dateFormatTimeZone | 时区的ID,指定默认的时区。对date, time,timestamp,to_date()有效.可以简写为“PST”,也可以写为“ America/Los_Angeles”,或自定义偏移量如“ GMT-9:00”,“LOCAL”会使用当前的时区 | GMT |
phoenix.query.numberFormat | 数字和字符串互相转换的数字格式。 TO_CHAR( | #,##0.## |
phoenix.mutate.maxSize | commit或rollback前,一次批量处理的最大的行数 | 500000 |
phoenix.mutate.batchSize | 自动提交时。一次批处理的数量,这个参数会被 connect 参数UpsertBatchSize 覆盖。注意,当这 UPSERT SELECT or DELETE 在服务器使用 coprocessor执行时。connect参数对bathcsize无效 | 1000 |
phoenix.coprocessor.maxServerCacheTimeToLiveMs | 服务器缓存的最大存活时间(毫秒)。从最后一次访问到现在的过期时间。当服务器端发生 IOException(“Could not find hash cache for joinId”) 时,可以考虑调整这个参数。当服务器端 有像“Earlier hash cache(s) might have expired on servers”这样的警告时,就是一个调大这个参数的信号。 | 30000 |
phoenix.query.useIndexes | 查询时是否作用索引 | True |
phoenix.index.mutableBatchSizeThreshold | Number of mutations in a batch beyond which index metadata will be sent as a separate RPC to each region server as opposed to included inline with each mutation. Defaults to 5. | 5 |
phoenix.schema.dropMetaData | 删除一张phoenix表时,是否删除对应的Hbase表。默认是True | True |
phoenix.groupby.spillable | 在regionServer上 是否一个大量不重复的数据是否允许溢出到磁盘上(Group By 也不例外)。为False时,抛出 InsufficientMemoryException | True |
phoenix.groupby.spillFiles | 溢出文件的数量( Number of memory mapped spill files to be used when spilling GROUP BY distinct values to disk. Default is 2) | 2 |
phoenix.groupby.maxCacheSize | groupBy 溢出 时最大的缓存字节数。默认是100Mb | 102400000 |
phoenix.groupby.estimatedDistinctValues | 当一个group by执行时预估的不同值的数量,( Used to perform initial sizing with growth of 1.5x each time reallocation is required) | 1000 |
phoenix.distinct.value.compress.threshold | 使用聚合函数时。跟踪的不同值数量的阈值。超过这个数量后就会使用 Snappy压缩,默认是1MB | 1024000 |
phoenix.index.maxDataFileSizePerc | 共享索引表MAX_FILESIZE对于数据表MAX_FIELSIZE的百分比。这个值应该根据索引行和数据行的预计平均大小来估算,默认是50% | 50% |
phoenix.coprocessor.maxMetaDataCacheTimeToLiveMs | 服务器端元数据缓存的过期时间。默认是30分钟。单位:毫秒 | 180000 |
phoenix.coprocessor.maxMetaDataCacheSize | 服务器端最大的元数据字节数。如果超过这个值。就会根据最后访问时间来删除一些数据。默认是20MB | 20480000 |
phoenix.client.maxMetaDataCacheSize | 客户端最大的元数据字节数。如果超过这个值。就会根据最后访问时间来删除一些数据。默认是10MB | 10240000 |
phoenix.sequence.cacheSize | 在下一个序列值被分配时,从服务器和缓存中保留的序列值的数目。在序列自己定义时这个参数无效(猜测:这个是主键的生成策略)。默认为100 | 100 |
phoenix.clock.skew.interval | Delay interval(in milliseconds) when opening SYSTEM.CATALOG to compensate possible time clock skew when SYSTEM.CATALOG moves among region servers. | 2000 |
phoenix.index.failure.handling.rebuild | 当数据发生变化时,索引是否自动重建 | True |
phoenix.index.failure.handling.rebuild.interval | 索引重建后。检查下一次重建的时间间隔(毫秒) | 10000 |
phoenix.index.failure.handling.rebuild.overlap.time | 索引失效后到索引重建的时间间隔(毫秒)。这个参数是为了防止。存在time clock skew.的更新丢失。 | 300000 |
phoenix.query.rowKeyOrderSaltedTable | 对于salted表。非聚合函数总是返回以rowkey排序的数据。为true时,在表创建时,分割点可以先不指定,但就会在每个salt bucket使用默认的分割。默认是True | True |
phoenix.connection.autoCommit | 是否自动提交。对于所有连接有效 | False |
phoenix.spool.directory | 数据量到20MB(phoenix.query.spoolThresholdBytes )溢出到本地目录 | /tmp |
phoenix.query.scanResultChunkSize | 一次查询返回的批量数量 | 2999 |
相关推荐
- 面试问了解Linux内存管理吗?10张图给你安排的明明白白!
-
来源:https://www.cnblogs.com/NanoDragon/p/12736887.html今天来带大家研究一下Linux内存管理。对于精通CURD的业务同学,内存管理好像离我们很远...
- Linux Kernel 6.12震撼发布:实时性能飙升,开启全新计算时代!
-
概述LinusTorvalds在邮件列表中宣布推出LinuxKernel6.12,该版本带来了多项重要的更新和功能增强。更新亮点PREEMPT_RT支持主要内容:LinuxKernel...
- linux Grub2功能、常见配置及使用方式
-
Grub2(GrandUnifiedBootloaderversion2)是一款功能强大的引导加载程序,提供了以下功能和常见配置:多操作系统支持:Grub2可以加载和引导多个操作系统,包括不同...
- Linux内核必备知识点-platform总线详解
-
platform总线是学习linux驱动必须要掌握的一个知识点。本文参考已发布:Linux3.14内核一、概念嵌入式系统中有很多的物理总线:I2c、SPI、USB、uart、PCIE、APB、AHB...
- linux kernel内核的头文件获取、安装等方法
-
交叉编译时经常会用到这些头文件。下载合适版本的linux地址:https://mirrors.aliyun.com/linux-kernel/https://mirrors.edge.kernel.o...
- 600个常用 Linux 命令,收藏备用!
-
本文为Linux命令大全,从A到Z都有总结,建议大家收藏以便查用,或者查漏补缺!A命令描述access用于检查调用程序是否可以访问指定的文件,用于检查文件是否存在accton用于打开或关闭记帐进程或...
- Linux 中 `/proc/cpuinfo`文件中最常见的标志
-
/proc/cpuinfo是一个虚拟文件系统,在Linux系统中提供有关CPU(中央处理器)的信息。通过读取该文件,您可以获取有关处理器的详细信息,如型号、频率、核心数、缓存大小等。本文将介绍...
- 600个Linux命令大全,从A到Z,2023年收藏大吉!
-
本文为Linux命令大全(有PDF),从A到Z都有总结,建议大家收藏以便查用,或者查漏补缺!A命令描述access用于检查调用程序是否可以访问指定的文件,用于检查文件是否存在accton用于打开或关闭...
- Linux下如何查看硬件信息?
-
我们在Linux下进行开发时,有时也需要知道当前的硬件信息,比如:CPU几核?使用情况?内存大小及使用情况?USB设备是否被识别?等等类似此类问题。下面良许介绍一些常用的硬件查看命令。lshwls...
- 从PXE到GRUB到VHD文件启动
-
今天玩点花活儿,之前的文章再探从VHD文件中启动Windows及Grub双启动VHD文件+TinyCoreLinux中研了一下GRUB和VHD文件的关联应用,那么结合PXE又会是怎么样的呢?...
- bootra1n教学:Windows用户用U盘Linux实现checkra1n越狱方法
-
checkra1n越狱工具在前几天推出Linux版本,相信对于Windows用户可能也看得很模糊,甚至要切割硬碟到安装Linux系统太过于繁杂,这篇要来教大家最简易最快速利用U盘Linux...
- 不了解NUMA,就看不懂Linux内核
-
哈喽,我是子牙,一个很卷的硬核男人深入研究计算机底层、Windows内核、Linux内核、Hotspot源码……聚焦做那些大家想学没地方学的课程。为了保证课程质量及教学效果,一年磨一剑,三年先后做了这...
- Linus Torvalds接受微软Hyper-V升级 下一代Linux启动会更快
-
虽然Windows的粉丝和Linux的粉丝经常喜欢进行激烈的键盘大战,但操作系统的制造商们自己也了解彼此的优缺点。毫无疑问,微软也明白这一点,事实上,它甚至鼓励用户尝试Linux,尽管是使用...
- deepin使用笔记——开机卡LOGO,无法正常关机的解决办法
-
第一次使用deepin操作系统,很容易遇到几种情况:1,开机卡LOGO,无法进入系统。2,开机可以进入系统,但是进入系统后桌面环境无法正常打开,一直卡着什么都不能用。3,开机后看似一切正常,但关机的时...
- 如何检查Linux系统硬件信息?从CPU到显卡,一网打尽!
-
你可能会问:“我为什么要关心硬件信息?”答案很简单:硬件是Linux系统的根基,了解它可以帮你解决很多实际问题。比如:性能调优:知道CPU核心数和内存大小,才能更好地调整程序运行参数。故障排查:系统卡...
- 一周热门
-
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
python使用fitz模块提取pdf中的图片
-
《人人译客》如何规划你的移动电商网站(2)
-
Jupyterhub安装教程 jupyter怎么安装包
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- table.render (33)
- uniapp textarea (33)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- react-admin (33)
- vscode切换git分支 (35)
- vscode美化代码 (33)
- python bytes转16进制 (35)