百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

Linux中利用crontab创建R定时任务

liuian 2024-12-01 00:59 66 浏览

知识点

  • Linux crontab:周期性执行程序
  • R commandArgs 函数:传递R脚本参数
  • R 批处理

Linux crontab 语法

Linux crontab是用来定期执行程序的命令。当安装完成操作系统之后,默认便会启动此任务调度命令。

crontab -l:查看当前的定时执行任务列表

crontab -e:进入vi命令模式,编辑定时任务,表达格式如下:

minute  hour  day  month  week  command
  • minute:表示分钟,取值范围 0-59 的任何整数
  • hour:表示小时,取值范围 0-23 的任何整数
  • day:表示一个月中的第几天,取值范围 1-31 的任何整数
  • month:表示月份,取值范围 1-12 的任何整数
  • week:表示星期几,取值范围 0-7 的任何整数,星期天为0或者7
  • command:表示要执行的命令;
  • 星号(*)表示取值范围内的所有数字,如 minute 为 * 表示每分钟执行;
  • 中杠(-)表示一个整数范围,如 minute 为 a-b 表示从第 a 分钟到第 b 分钟每分钟执行;
  • 正斜杠(/n)表示每隔 n 长时间执行一次,如 minute 为 */n 表示每隔 n 分钟执行一次;
  • 逗号(,)表示分隔开多个值,如 minute 为 a, b,... 表示第 a, b,... 分钟执行;

示例:

# 每小时的第5分钟执行一次
5 * * * * command
# 每小时的第5和35分钟执行一次
5,35 * * * * command
# 每天早上9:30执行一次
30 9 * * * * command
# 12月份每天早上6:00、9:00、12:00各执行一次
0 6-12/3 * 12 * command

crontab -r:删除定时任务(慎用!在任务前写#作为注释即可取消定时任务

R commandArgs 函数

命令行传递的参数以向量的形式存储在commandArgs(TRUE) ,具体可通过 ?commandArgs 查看说明文档。

R 批处理

批处理:通俗讲地讲,就是编写R程序,然后通过命令方式执行。批处理模式运行R与使用的操作系统有关,以下是针对 Linux 系统。

R语言进行批处理有2种方式(推荐第一种,第二种无法传递参数,多数场景下都需要传递参数,比如日期):

  • /path/to/Rscript [–options] [-e expr [-e expr2 …] | file] [args] > outputfile
  • R CMD BATCH [options] infile [outfile]

其中,options的选项以及含义如下:

  • –slave:类似于–quiet,它禁止回送输入的信息,使R软件输出的信息更为简洁。
  • –no-restore:在R启动时不还原工作空间。对于希望以空白工作空间启动R的脚本而言,这个选项很有必要。
  • –no-save:在退出R时,不保存工作空间;否则,R会保存当前工作空间并覆盖原有工作目录中的.RData文件。
  • –no-init-file:不读取.Rprofile文件或者~/. Rprofile文件。

示例演示

Step 1. 创建R脚本

argv <- commandArgs(TRUE)

if (length(argv) == 0) {
  beg_date <- end_date <- format(Sys.Date(), "%Y%m%d")
} else if (length(argv) == 1) {
  beg_date <- end_date <- argv[1]
} else {
  beg_date <- argv[1]
  end_date <- argv[2]
}

cat("开始日期:", beg_date, sep = "")
cat("\n")
cat("结束日期:", end_date, sep = "")
cat("\n")

Step 2. 命令行手动执行

$ Rscript /home/xxx/test.R                      # 不传入参数
开始日期:20201013
结束日期:20201013
$ 
$ Rscript /home/xxx/test.R 20220222             # 传入一个参数
开始日期:20200901
结束日期:20200901
$ 
$ Rscript /home/xxx/test.R 20220221 20220222    # 传入两个参数
开始日期:20200901
结束日期:20200902

Step 3. 通过crontab设置定时任务

1. 输入 crontab -e

2. 按 i,进入编辑模式,编辑定时任务

# 每天早上9:30后台执行R脚本
30 9 * * * Rscript /home/xxx/test.R > /home/xxx/test.log 2>&1 &

3. 按esc,退出编辑模式

4. 输入 :wq 后回车,设置定时任务完成

其中:

  • 2>&1:表示将标准错误重定向到标准输出到log文件,日志保存便于排查问题;
  • &:表示在后台运行;

相关推荐

打开新世界,教你用RooCode+Copliot+Mcp打造一个自己的Manus

本文耗时两天打造,想要一遍走通需要花点时间,建议找个专注的时间开搞!这不仅是个免费使用claude3.5的方案,也是一个超级智能体方案,绝对值得一试!最近Manus真是赚足了眼球,然而我还是没有邀请码...

Git仓库(git仓库有哪些)

#Git仓库使用方法流程详解##一、环境搭建与基础配置###1.1安装与初始化-**安装Git**:官网下载安装包,默认配置安装-**配置全局信息**:```bashgitconfig...

idea版的cursor:Windsurf Wave 7(ideawalk)

在企业环境中,VisualStudioCode和JetBrains系列是最常用的开发工具,覆盖了全球绝大多数开发者。这两类IDE各有优势,但JetBrains系列凭借其针对特定语言和企业场景的深度...

Ai 编辑器 Cursor 零基础教程:推箱子小游戏实战演练

最近Ai火的同时,Ai编辑器Cursor同样火了一把。今天我们就白漂一下Cursor,使用免费版本搞一个零基础教程,并实战演练一个“网页版的推箱子小游戏”。通过这篇文章,让你真正了解cursor是什么...

ChatGPT深度集成于苹果Mac软件 编码能力得到提升

【CNMO科技消息】近日,OpenAI发布了针对MacOS的桌面应用程序,并宣布了一系列与各类应用程序的互操作性功能,标志着ChatGPT正在从聊天机器人向AI智能体工具进化。此次发布的MacOS桌面...

日常开发中常用的git操作命令和使用技巧

日常开发中常用的git操作命令,从配置、初始化本地仓库到提交代码的常用git操作命令使用git前的配置刚使用git,先要在电脑上安装好git,接着我们需要配置一下帐户信息:用户名和邮箱。#设置用户名...

Trae IDE 如何与 GitHub 无缝对接?

TraeIDE内置了GitHub集成功能,让开发者可以直接在IDE里管理代码仓库和版本控制。1.直接从GitHub克隆项目如果你想把GitHub上的代码拉到本地,Trae提供了...

China&#39;s diplomacy to further provide strong support for country&#39;s modernization: FM

BEIJING,March7(Xinhua)--ChineseForeignMinisterWangYisaidFridaythatChina'sdiplomacywil...

三十分钟入门基础Go(Java小子版)(java入门级教程)

前言Go语言定义Go(又称Golang)是Google的RobertGriesemer,RobPike及KenThompson开发的一种静态、强类型、编译型语言。Go语言语法与...

China will definitely take countermeasures in response to arbitrary pressure: FM

BEIJING,March7(Xinhua)--Chinawilldefinitelytakecountermeasuresinresponsetoarbitrarypre...

Go操作etcd(go操作docker实现沙箱)

Go语言操作etcd,这里推荐官方包etcd/clientv3。文档:https://pkg.go.dev/go.etcd.io/etcd/clientv3etcdv3使用gRPC进行远程过程调...

腾讯 Go 性能优化实战(腾讯游戏优化软件)

作者:trumanyan,腾讯CSIG后台开发工程师项目背景网关服务作为统一接入服务,是大部分服务的统一入口。为了避免成功瓶颈,需要对其进行尽可能地优化。因此,特别总结一下golang后台服务...

golang 之JWT实现(golang gin jwt)

什么是JSONWebToken?JSONWebToken(JWT)是一个开放标准(RFC7519),它定义了一种紧凑且自包含的方式,用于在各方之间以JSON方式安全地传输信息。由于此信息是经...

一文看懂 session 和 cookie(session cookie的区别)

-----------cookie大家应该都熟悉,比如说登录某些网站一段时间后,就要求你重新登录;再比如有的同学很喜欢玩爬虫技术,有时候网站就是可以拦截住你的爬虫,这些都和cookie有关。如果...

有望取代 java?GO 语言项目了解一下

GO语言在编程界一直让人又爱又恨,有人说“GO将统治下一个十年”,“几乎所有新的、有趣的东西都是用Go写的”;也有人说它过于死板,使用感太差。国外有Google、AWS、Cloudflar...