百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT知识 > 正文

实例解析:如何开发 VSCode LSP 服务

liuian 2025-02-21 14:18 14 浏览

全文 3000 字,欢迎点赞关注转发

从一张动图说起:

上图应该大家经常使用的 错误诊断 功能,它能够在你编写代码的过程中提示,那一块代码存在什么类型的问题。

这个看似高大上的功能,从插件开发者的角度看其实特别简单,基本上就是用上一篇文章《你不知道的 VSCode 代码高亮原理》中简单介绍过的 VSCode 开发语言特性的三种方案:

  • 基于 Sematic Tokens Provider 协议的词法高亮
  • 基于 Language API 的编程式语法高亮
  • 基于 Language Server Protocol 的多进程架构语法高亮

其中, Language Server Protocol 由于性能与开发效率上的优势已经逐渐成为主流实现方案,本文接下来会基于 LSP 展开介绍各种语言特性的实现细节,解答 LSP 的通讯模型与开发模式。

示例代码

本文示例均已同步到 github,建议读者先拉下代码实际体验:

# 1. clone 示例代码
git clone git@github.com:Tecvan-fe/vscode-lsp-sample.git
# 2. 安装依赖
npm i # or yarn
# 3. 使用 vscode 打开示例代码
code ./vscode-lsp-sample
# 4. 在 vscode 中按下 F5 启动调试

顺利执行完毕后,可以看到插件的调试窗口:

核心代码有:

  • server/src/server.ts:LSP 服务端代码,提供代码补全、错误诊断、代码提示等常见语言功能的示例
  • client/src/extension.ts:提供一系列 LSP 参数,包括 Server 的调试端口、代码入口、通讯方式等。
  • packages.json:主要提供了语法插件所需要的配置信息,包括:activationEvents: 声明插件的激活条件,代码中的 onLanguage:plaintext 意为打开 txt 文本文件时激活main: 插件的入口文件

其中,client/src/extension.tspackages.json 都比较简单,本文过多介绍,重点在于 server/src/server.ts 文件,接下来我们逐步拆解,解析不同语言特性的实现细节。

如何编写 Language Server

Server 结构解析

示例项目的 server/src/server.ts 实现了一个小型但完整的 Language Server 应用,核心代码:

// 要素1: 初始化 LSP 连接对象
const connection = createConnection(ProposedFeatures.all);

// 要素2: 创建文档集合对象,用于映射到实际文档
const documents: TextDocuments = new TextDocuments(TextDocument);

connection.onInitialize((params: InitializeParams) => {
  // 要素3: 显式声明插件支持的语言特性
  const result: InitializeResult = {
    capabilities: {
      hoverProvider: true
    },
  };
  return result;
});

// 要素4: 将文档集合对象关联到连接对象
documents.listen(connection);

// 要素5: 开始监听连接对象
connection.listen();

从示例代码可以总结出 Language Server 的 5 个必要步骤:

  • 创建 connection 对象,用于实现客户端与服务器之间的信息互通
  • 创建 documents 文档集合对象,用于映射客户端正在编辑的文件
  • connection.onInitialize 事件中,显式声明插件支持的语法特性,例如上例中返回对象包含 hoverProvider: true 声明,表示该插件能够提供代码悬停提示功能
  • documents 关联到 connection 对象
  • 调用 connection.listen 函数,开始监听客户端消息

上述 connectiondocuments 等对象定义在 npm 包:

vscode-languageserver/node

vscode-languageserver-textdocument

这是一个基本模板,主要完成了 Language Server 各种初始化操作,后续就可以使用 connection.onXXXdocuments.onXXX 监听各类交互事件,并在事件回调中返回符合 LSP 协议的结果,或者显式调用通讯函数如 connection.sendDiagnostics 发送交互信息。

接下来我们通过几个简单实例,分析各项语言特性的实现逻辑。

悬停提示

当鼠标停留在语言元素如函数、变量、符号等 token 时,VSCode 会显示 token 对应描述与帮助信息:

要实现悬停提示功能,首先需要声明插件支持 hoverProvider 特性:

connection.onInitialize((params: InitializeParams) => {
  return {
    capabilities: {
      hoverProvider: true
    },
  };
});

之后,需要监听 connection.onHover 事件,并在事件回调中返回提示信息:

connection.onHover((params: HoverParams): Promise => {
  return Promise.resolve({
    contents: ["Hover Demo"],
  });
});

OK,这就是一个很简单的语言特性示例了,本质上就是监听事件 + 返回结果,非常简单。

代码格式化

代码格式化是一个特别有用的功能,能够帮助用户快速、自动完成代码的美化处理,实现效果如:

实现悬停提示功能,首先需要声明插件支持 documentFormattingProvider 特性:

{
    ...
    capabilities : {
        documentFormattingProvider: true
        ...
    }
}

之后,监听 onDocumentFormatting 事件:

connection.onDocumentFormatting(
  (params: DocumentFormattingParams): Promise => {
    const { textDocument } = params;
    const doc = documents.get(textDocument.uri)!;
    const text = doc.getText();
    const pattern = /\b[A-Z]{3,}\b/g;
    let match;
    const res = [];
    // 查找连续大写字符串
    while ((match = pattern.exec(text))) {
      res.push({
        range: {
          start: doc.positionAt(match.index),
          end: doc.positionAt(match.index + match[0].length),
        },
        // 将大写字符串替换为 驼峰风格
        newText: match[0].replace(/(?<=[A-Z])[A-Z]+/, (r) => r.toLowerCase()),
      });
    }

    return Promise.resolve(res);
  }
);

示例代码中,回调函数主要实现将连续大写字符串格式化为驼峰字符串,效果如图:

函数签名

函数签名特性在用户输入函数调用语法时触发,此时 VSCode 会根据 Language Server 返回的内容,显示该函数的帮助信息。

实现函数签名功能,需要首先声明插件支持 documentFormattingProvider 特性:

{
    ...
    capabilities : {
        signatureHelpProvider: {
            triggerCharacters: ["("],
        }
        ...
    }
}

之后,监听 onSignatureHelp 事件:

connection.onSignatureHelp(
  (params: SignatureHelpParams): Promise => {
    return Promise.resolve({
      signatures: [
        {
          label: "Signature Demo",
          documentation: "帮助文档",
          parameters: [
            {
              label: "@p1 first param",
              documentation: "参数说明",
            },
          ],
        },
      ],
      activeSignature: 0,
      activeParameter: 0,
    });
  }
);

实现效果:

错误提示

注意,错误提示的实现逻辑与上述事件 + 响应的模式有一点点不同:

  • 首先不需要通过capabilities 做额外声明;
  • 监听的是 documents.onDidChangeContent 事件,而不是 connection 对象上的事件
  • 不是在事件回调中用 return 语句返回错误信息,而是调用 connection.sendDiagnostics 发送错误消息

完整示例:

// 增量错误诊断
documents.onDidChangeContent((change) => {
  const textDocument = change.document;

  // The validator creates diagnostics for all uppercase words length 2 and more
  const text = textDocument.getText();
  const pattern = /\b[A-Z]{2,}\b/g;
  let m: RegExpExecArray | null;

  let problems = 0;
  const diagnostics: Diagnostic[] = [];
  while ((m = pattern.exec(text))) {
    problems++;
    const diagnostic: Diagnostic = {
      severity: DiagnosticSeverity.Warning,
      range: {
        start: textDocument.positionAt(m.index),
        end: textDocument.positionAt(m.index + m[0].length),
      },
      message: `${m[0]} is all uppercase.`,
      source: "Diagnostics Demo",
    };
    diagnostics.push(diagnostic);
  }

  // Send the computed diagnostics to VSCode.
  connection.sendDiagnostics({ uri: textDocument.uri, diagnostics });
});

这段逻辑诊断代码中是否存在连续大写字符串,通过 sendDiagnostics 发送相应的错误信息,实现效果:

如何识别事件与响应体

上述示例,我有意忽略大多数实现细节,更关注实现语言特性的基本框架和输入输出。授人以鱼不如授人以渔,所以接下来我们花一点点时间了解从哪里获取这些接口、参数、响应体的信息。有两个非常重要的链接:

  • https://zjsms.com/egWtqPj/ , VSCode 官网关于可编程语言特性的说明文档
  • https://zjsms.com/egWVTPg/ ,LSP 协议官网

这两个网页提供了 VSCode 所支持的所有语言特性的详细介绍,可以在这里找到你想要实现的特性的概念性描述,例如对于代码补齐:

嗯,有点复杂且太过 detail,不过还是很有必要耐心了解下,让你对即将要做的事情有一个高层概念上的理解。

此外,如果你选择使用 TS 编写 LSP,事情会变得更简单。vscode-languageserver 包提供了非常完善的 Typescript 类型定义,我们完全可以借助 ts + VSCode 的代码提示找到需要使用的监听函数:

之后,根据函数签名找到参数、结果的类型定义:

之后,就可以根据类型定义,有针对性地处理参数,返回对应结构的数据。

深入理解 LSP

看完示例后,我们再反过头来看看 LSP。LSP —— Language Server Protocol 本质上是一种基于 JSON-RPC 的进程间通讯协议,LSP 本身包含两大块内容:

  • 定义 client 与 server 之间的通讯模型,也就是谁、在什么时候、以什么方式向对方发送什么格式的信息,接收方又以什么方式返回响应信息
  • 定义通讯信息体,也就是以什么格式、什么字段、什么样的值表达信息状态

作为类比,HTTP 协议专门用于描述网络节点间如何传输、理解超媒体文档的网络通讯协议;而 LSP 协议则专门用于描述 IDE 中,用户行为与响应之间的通讯方式与信息结构。

总结一下,LSP 架构的工作流程如下:

  • 编辑器如 VSCode 跟踪、计算、管理用户行为模型,在发生某些特定的行为序列时,以 LSP 协议规定的通讯方式向 Language Server 发送动作与上下文参数
  • Language Server 根据这些参数异步地返回响应信息
  • 编辑器再根据响应信息处理交互反馈

简单说,编辑器负责与用户直接交互, Language Server 负责在背后默默计算如何响应用户的交互动作,两者以进程粒度分离、解耦,在 LSP 协议框架下各司其职又协作共生。就好像我们通常开发的 Web 应用中,前端负责与用户交互,服务端负责管理诸如权限、业务数据、业务状态流转等不可见的部分。

目前,LSP 协议已经发展到 3.16 版本,覆盖大多数语言特性,包括:

  • 代码补全
  • 代码高亮
  • 定义跳转
  • 类型推断
  • 错误检测
  • 等等

得益于 LSP 清晰的设计,这些语言特性的开发套路都很相似,学习曲线很平滑,开发的时候基本上只需要关心监听那个函数,返回什么格式的结构,可以说掌握上述几个示例之后就可以很简单地上手了。

过去,IDE 对语言特性的支持是集成在 IDE 或者以同构插件形式实现的,在 VSCode 中这种同构扩展能力以 Language APISematic Tokens Provider 接口方式提供,这两种方式在上一篇文章《你不知道的 VSCode 代码高亮原理》都有过介绍了,虽然架构上比较简单,容易理解,但有一些明显硬伤:

  • 插件开发者必须复用 VSCode 本身的开发语言、环境,例如 Python 语言插件就必须用 JavaScript 写
  • 同一个编程语言需要为不同 IDE 重复开发相似的扩展插件,重复投入

LSP 最大的优势就是将 IDE 客户端与实际计算交互特性的服务端隔离开来,同一个 Language Service 可以重复应用在多个不同 Language Client 中。

此外,LSP 协议下客户端、服务器分别在各自进程运行,在性能上也会有正向收益:

  • 确保 UI 进程不卡顿
  • Node 环境下,充分利用多核 CPU 能力
  • 由于不再限定 Language Server 的技术栈,开发者可以选择更高性能的语言,例如 Go

总的来说,就是很强。

总结

本文介绍了 VSCode 下,开发一款基于 LSP 的语言插件所需要具备的最最基本的技能,实际开发的时候通常还会混合另一种技术:嵌入式语法 —— Embedded Languages Server ,实现复杂的多语言复合支持,如果有人感兴趣,我们下周可以聊聊。

相关推荐

2023年最新微信小程序抓包教程(微信小程序 抓包)

声明:本公众号大部分文章来自作者日常学习笔记,部分文章经作者授权及其他公众号白名单转载。未经授权严禁转载。如需转载,请联系开百。请不要利用文章中的相关技术从事非法测试。由此产生的任何不良后果与文...

测试人员必看的软件测试面试文档(软件测试面试怎么说)

前言又到了毕业季,我们将会迎来许多需要面试的小伙伴,在这里呢笔者给从事软件测试的小伙伴准备了一份顶级的面试文档。1、什么是bug?bug由哪些字段(要素)组成?1)将在电脑系统或程序中,隐藏着的...

复活,视频号一键下载,有手就会,长期更新(2023-12-21)

视频号下载的话题,也算是流量密码了。但也是比较麻烦的问题,频频失效不说,使用方法也难以入手。今天,奶酪就来讲讲视频号下载的新方案,更关键的是,它们有手就会有用,最后一个方法万能。实测2023-12-...

新款HTTP代理抓包工具Proxyman(界面美观、功能强大)

不论是普通的前后端开发人员,还是做爬虫、逆向的爬虫工程师和安全逆向工程,必不可少会使用的一种工具就是HTTP抓包工具。说到抓包工具,脱口而出的肯定是浏览器F12开发者调试界面、Charles(青花瓷)...

使用Charles工具对手机进行HTTPS抓包

本次用到的工具:Charles、雷电模拟器。比较常用的抓包工具有fiddler和Charles,今天讲Charles如何对手机端的HTTS包进行抓包。fiddler抓包工具不做讲解,网上有很多fidd...

苹果手机下载 TikTok 旧版本安装包教程

目前苹果手机能在国内免拔卡使用的TikTok版本只有21.1.0版本,而AppStore是高于21.1.0版本,本次教程就是解决如何下载TikTok旧版本安装包。前期准备准备美区...

【0基础学爬虫】爬虫基础之抓包工具的使用

大数据时代,各行各业对数据采集的需求日益增多,网络爬虫的运用也更为广泛,越来越多的人开始学习网络爬虫这项技术,K哥爬虫此前已经推出不少爬虫进阶、逆向相关文章,为实现从易到难全方位覆盖,特设【0基础学爬...

防止应用调试分析IP被扫描加固实战教程

防止应用调试分析IP被扫描加固实战教程一、概述在当今数字化时代,应用程序的安全性已成为开发者关注的焦点。特别是在应用调试过程中,保护应用的网络安全显得尤为重要。为了防止应用调试过程中IP被扫描和潜在的...

一文了解 Telerik Test Studio 测试神器

1.简介TelerikTestStudio(以下称TestStudio)是一个易于使用的自动化测试工具,可用于Web、WPF应用的界面功能测试,也可以用于API测试,以及负载和性能测试。Te...

HLS实战之Wireshark抓包分析(wireshark抓包总结)

0.引言Wireshark(前称Ethereal)是一个网络封包分析软件。网络封包分析软件的功能是撷取网络封包,并尽可能显示出最为详细的网络封包资料。Wireshark使用WinPCAP作为接口,直接...

信息安全之HTTPS协议详解(加密方式、证书原理、中间人攻击 )

HTTPS协议详解(加密方式、证书原理、中间人攻击)HTTPS协议的加密方式有哪些?HTTPS证书的原理是什么?如何防止中间人攻击?一:HTTPS基本介绍:1.HTTPS是什么:HTTPS也是一个...

Fiddler 怎么抓取手机APP:抖音、小程序、小红书数据接口

使用Fiddler抓取移动应用程序(APP)的数据接口需要进行以下步骤:首先,确保手机与计算机连接在同一网络下。在计算机上安装Fiddler工具,并打开它。将手机的代理设置为Fiddler代理。具体方...

python爬虫教程:教你通过 Fiddler 进行手机抓包

今天要说说怎么在我们的手机抓包有时候我们想对请求的数据或者响应的数据进行篡改怎么做呢?我们经常在用的手机手机里面的数据怎么对它抓包呢?那么...接下来就是学习python的正确姿势我们要用到一款强...

Fiddler入门教程全家桶,建议收藏

学习Fiddler工具之前,我们先了解一下Fiddler工具的特点,Fiddler能做什么?如何使用Fidder捕获数据包、修改请求、模拟客户端向服务端发送请求、实施越权的安全性测试等相关知识。本章节...

fiddler如何抓取https请求实现手机抓包(100%成功解决)

一、HTTP协议和HTTPS协议。(1)HTTPS协议=HTTP协议+SSL协议,默认端口:443(2)HTTP协议(HyperTextTransferProtocol):超文本传输协议。默认...