首测!GPT-4o做Code Review可行吗?
liuian 2025-04-29 02:06 8 浏览
编辑 | 言征
出品 | 51CTO技术栈(微信号:blog51cto)
近日,OpenAI一记重拳,推出了GPT-4o(“o”表示“omni”),将语音识别和对话方面的优势展示的淋漓尽致。几乎可以肯定,它也是一个更强的LLM。但它能进行代码审查吗?本文通过一些测试来寻找答案。
1.长乘法:交给计算机就可以
首先,我检查了它是否可以进行long乘法运算:
图片
答案是正确的,通过在线计算器上可以确认。但请注意,它并没有试图“计算出”结果——它只是将问题甩给了计算器。末尾的“查看分析”的蓝色图标基本上说明了这一点。这在之前的模型上都没有做到。
2.代码审查
我个人对正式严谨的代码审查没有兴趣。是的,有时初级开发人员可能确实需要这样的审查,但单元测试和配对编程通常足以消除不良的编程习惯。但是,几句含糊的评论可以帮助指出代码中的潜在小问题,而不会显得对容易重写的代码片段强加某种权威性的命令。
简而言之,代码审查更多的是一种social互动,而不是其他任何东西。请专注于工程问题,而不是代码的语义细节。
然而,代码审查是开发人员使用大型语言模型(LLM)的一个好案例。在这里,我将查看三段不同的代码,每段代码都只是绘制一个带有对角线的矩形框。我将添加问题,并查看GPT-4o(通过ChatGPT)如何对它们进行审查。
接下来,我们从简单的C#对角线绘制程序开始:
复制
using System;
public class Program
{
public static void Main()
{
BoxWithDiagonalLine(5);
BoxWithDiagonalLine(6,1);
BoxWithDiagonalLine(6,-1);
BoxWithDiagonalLine(2);
BoxWithDiagonalLine(-1);
}
// Example 1
public static void BoxWithDiagonalLine(int boxsize, int linepos = 0)
{
for(int i=0; i < boxsize; i++)
{
for (int j = 0; j < boxsize; j++)
{
if (j == linepos) Console.Write("x ");
else Console.Write("o ");
}
linepos++;
Console.Write("n");
}
Console.Write("n");
}
}1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.
将这个代码丢进https://dotnetfiddle.net/(不过请将编译器设置为至少.NET 6)并查看响应:
图片
这段代码相当简单,也相对容易理解。外部循环控制行,内部循环在正确的位置放置“x”。变量命名很简洁,代码很短。该方法有一个默认值,用于生成从左上角到右下角的完整对角线。虽然我们可以将起始线位置向左或向右移动,但拥有负的盒子大小(boxsize)并没有多大意义。因此,我们可以通过将方法参数更改为无符号整数(unsigned int)来改进它。这将立即阻止上一个示例甚至无法编译。一个非常大的linepos(起始线位置)将不可见,但它并不危险。
到目前为止,没有什么可评论的。
接下来,将for循环替换成while循环:
复制
// Example 2
public static void BoxWithDiagonalLine(int boxsize, int linepos = 0)
{
int i = 0;
while(i++ < boxsize)
{
int j = 0;
while (j++ < boxsize)
{
if (j == linepos + 1) Console.Write("x ");
else Console.Write("o ");
} linepos++;
Console.Write("n");
}
Console.Write("n");
}1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.
现在这段代码可以运行,但值得稍微皱一下眉头。通过在后置递增循环变量(在i和j后面的++意味着值首先被读取,然后再增加1)我们节省了一些空间,但我们需要那个笨拙的linepos + 1表达式。
while循环不如for循环那样明确地表达开始和结束状态——但我们并没有陷入任何疯狂的状态。
我们进行最后一次更改。这次代码中有一个变量来“捣乱”,它试图使用linepos来控制外部循环:
复制
//Example 3
public static void BoxWithDiagonalLine(int boxsize, int linepos = 0)
{
while(linepos < boxsize)
{
int j = 0;
while (j++ < boxsize)
{
if (j == linepos + 1) Console.Write("x ");
else Console.Write("o ");
}
linepos++;
Console.Write("n");
}
Console.Write("n");
}1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.
在试图不必要地移除一个循环变量的过程中,矩形框本身将不再完整——尽管使用默认值时可以工作。事实上,这解决了另一个问题,即总是在底部角落可靠地以一个“×”结束。
图片
这段糟糕的代码可能是因为开发者不当地继续使用了while循环。
现在让我们总结一下我们如何看待这些不同版本:
第一个例子是可行的,但我们可以强制参数为正数。然而,没有注释的话,这段代码的功能并不十分清晰。
第二个例子使用了while循环,它不像for循环那样具有确定性。同时,由于后置递增,还需要考虑一个丑陋的表达式。
第三个例子完全是错误的,尽管在默认情况下它得到了正确的结果。
我们对AI代码审查有什么期望?首先,我没有给出任何注释,那么它能否弄清楚这段代码的作用?只有方法的名称揭示了这一点。
这是GPT-4o的回应:
复制
“Your code is functional and effectively generates a box with diagonal lines based on the provided parameters. However, there are a few improvements and edge cases to consider:
1.Input Validation: Ensure that the box size is positive and greater than 1, since a box with a size less than 2 doesn’t make much sense.
2.Handling linepos: Improve handling of diagonal positions to ensure the diagonals are correctly drawn when linepos is negative or greater than the box size.
3.Code Readability: Add comments and improve variable naming for better readability and maintenance.”1.2.3.4.
【译】“您的代码是功能性的,并且能够有效地根据提供的参数生成带有对角线的矩形框。但是,有几个改进点和边缘情况需要考虑:
1.输入验证:确保矩形框的大小是正数且大于1,因为大小小于2的矩形框并没有太大意义。
2.处理linepos:改进对角线位置的处理,以确保当linepos为负数或大于矩形框大小时,对角线能够正确绘制。
3.代码可读性:添加注释并改进变量命名以提高代码的可读性和可维护性。”
所以它确实理解了代码的作用——即使它认为程序画的是“lines”而不是“line”。这仍然很好。
它建议的代码如下:
复制
// ChatGPT4o suggested code
public static void BoxWithDiagonalLine(int boxSize, int linePos = 0)
{
if (boxSize < 2)
{
Console.WriteLine("Box size must be greater than 1.");
return;
}
// Adjust linePos if it's out of the box boundaries
if (linePos < 0) linePos = 0;
if (linePos >= boxSize) linePos = boxSize - 1;
for (int i = 0; i < boxSize; i++)
{
for (int j = 0; j < boxSize; j++)
{
if (j == linePos) Console.Write("x ");
else Console.Write("o ");
}
linePos++;
// Reset linePos if it goes out of the box boundaries
if (linePos >= boxSize) linePos = 0;
Console.Write("n");
}
Console.Write("n");1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.
以下是将其放入dotnetfiddle.net的结果:
图片
我认为大多数人都会对小于2的boxSize感到满意。同时,它也很好地使用了驼峰命名法来命名参数,这在C#中是正确的。但遗憾的是,它忽略了改变位置以使线条从更低处开始的想法。而由于重置了linepos,我们在第二个例子的底部得到了那个糟糕的错误。
不过,从代码审查的角度来看,它确实抓住了要点。
3.第二个例子结果
让我们给它输入第二个例子,看看它的表现如何。下面是一些有趣的评论:
“The use of while loops is functional but could be less intuitive compared to for loops for such iterations.”
Excellent. This is exactly the right note.
“The condition j == linepos + 1 is used to determine where to place “x”. This works but can be made more intuitive by aligning with the index i.”
再次强调,这是很好的。它理解了功能性和可读性之间的区别。
生成的代码限制了linepos的值,并且相当奇怪地使用了取模函数来改变这个值。但最终得到了相同的结果。它回归到了for循环,这是很棒的。
4.第三个例子结果
最后,让我们给出糟糕的例子3,看看它的表现如何。奇怪的是,它没有发现这个错误,但提出了以下建议:
“Edge Cases:
– When linepos is negative, it works but may not be intended.”
这表明它完全没有理解代码——当然,我也没有明确说明我在做什么。所以,也许“wrapping line ”可能是一个合理的猜测?
5.结论
总的来说,审查的性质和结果给我留下了深刻的印象。GPT-4o生成的代码虽然不太理想,但也还可以。在对代码的批评中,没有“书呆子的笨拙脚步”;相反,它轻轻地引导读者走向更好的方向。
结果可能没有达到预期——态度很好但代码略有不准确。然而,新手应该会很喜欢;在这方面,它至少比部分人做得更好。
参考链接:
https://thenewstack.io/reviewing-code-with-gpt-4o-openais-new-omni-llm/
来源: 51CTO技术栈
相关推荐
- 深入解析 MySQL 8.0 JSON 相关函数:解锁数据存储的无限可能
-
引言在现代应用程序中,数据的存储和处理变得愈发复杂多样。MySQL8.0引入了丰富的JSON相关函数,为我们提供了更灵活的数据存储和检索方式。本文将深入探讨MySQL8.0中的JSON...
- MySQL的Json类型个人用法详解(mysql json类型对应java什么类型)
-
前言虽然MySQL很早就添加了Json类型,但是在业务开发过程中还是很少设计带这种类型的表。少不代表没有,当真正要对Json类型进行特定查询,修改,插入和优化等操作时,却感觉一下子想不起那些函数怎么使...
- MySQL的json查询之json_array(mysql json_search)
-
json_array顾名思义就是创建一个数组,实际的用法,我目前没有想到很好的使用场景。使用官方的例子说明一下吧。例一selectjson_array(1,2,3,4);json_array虽然单独...
- 头条创作挑战赛#一、LSTM 原理 长短期记忆网络
-
#头条创作挑战赛#一、LSTM原理长短期记忆网络(LongShort-TermMemory,LSTM)是一种特殊类型的循环神经网络(RNN),旨在解决传统RNN在处理长序列数据时面临的梯度...
- TensorBoard最全使用教程:看这篇就够了
-
机器学习通常涉及在训练期间可视化和度量模型的性能。有许多工具可用于此任务。在本文中,我们将重点介绍TensorFlow的开源工具套件,称为TensorBoard,虽然他是TensorFlow...
- 图神经网络版本的Kolmogorov Arnold(KAN)代码实现和效果对比
-
本文约4600字,建议阅读10分钟本文介绍了图神经网络版本的对比。KolmogorovArnoldNetworks(KAN)最近作为MLP的替代而流行起来,KANs使用Kolmogorov-Ar...
- kornia,一个实用的 Python 库!(python kkb_tools)
-
大家好,今天为大家分享一个实用的Python库-kornia。Github地址:https://github.com/kornia/kornia/Kornia是一个基于PyTorch的开源计算...
- 图像分割掩码标注转YOLO多边形标注
-
Ultralytics团队付出了巨大的努力,使创建自定义YOLO模型变得非常容易。但是,处理大型数据集仍然很痛苦。训练yolo分割模型需要数据集具有其特定格式,这可能与你从大型数据集中获得的...
- [python] 向量检索库Faiss使用指北
-
Faiss是一个由facebook开发以用于高效相似性搜索和密集向量聚类的库。它能够在任意大小的向量集中进行搜索。它还包含用于评估和参数调整的支持代码。Faiss是用C++编写的,带有Python的完...
- 如何把未量化的 70B 大模型加载到笔记本电脑上运行?
-
并行运行70B大模型我们已经看到,量化已经成为在低端GPU(比如Colab、Kaggle等)上加载大型语言模型(LLMs)的最常见方法了,但这会降低准确性并增加幻觉现象。那如果你和你的朋友们...
- ncnn+PPYOLOv2首次结合!全网最详细代码解读来了
-
编辑:好困LRS【新智元导读】今天给大家安利一个宝藏仓库miemiedetection,该仓库集合了PPYOLO、PPYOLOv2、PPYOLOE三个算法pytorch实现三合一,其中的PPYOL...
- 人工智能——图像识别(人工智能图像识别流程)
-
概述图像识别(ImageRecognition)是计算机视觉的核心任务之一,旨在通过算法让计算机理解图像内容,包括分类(识别物体类别)、检测(定位并识别多个物体)、分割(像素级识别)等,常见的应用场...
- PyTorch 深度学习实战(15):Twin Delayed DDPG (TD3) 算法
-
在上一篇文章中,我们介绍了DeepDeterministicPolicyGradient(DDPG)算法,并使用它解决了Pendulum问题。本文将深入探讨TwinDelayed...
- 大模型中常用的注意力机制GQA详解以及Pytorch代码实现
-
分组查询注意力(GroupedQueryAttention)是一种在大型语言模型中的多查询注意力(MQA)和多头注意力(MHA)之间进行插值的方法,它的目标是在保持MQA速度的同时...
- pytorch如何快速创建具有特殊意思的tensor张量?
-
专栏推荐正文我们通过值可以看到torch.empty并没有进行初始化创建tensor并进行随机初始化操作,常用rand/rand_like,randint正态分布(0,1)指定正态分布的均值还有方差i...
- 一周热门
-
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
python使用fitz模块提取pdf中的图片
-
《人人译客》如何规划你的移动电商网站(2)
-
Jupyterhub安装教程 jupyter怎么安装包
-
- 最近发表
-
- 深入解析 MySQL 8.0 JSON 相关函数:解锁数据存储的无限可能
- MySQL的Json类型个人用法详解(mysql json类型对应java什么类型)
- MySQL的json查询之json_array(mysql json_search)
- 头条创作挑战赛#一、LSTM 原理 长短期记忆网络
- TensorBoard最全使用教程:看这篇就够了
- 图神经网络版本的Kolmogorov Arnold(KAN)代码实现和效果对比
- kornia,一个实用的 Python 库!(python kkb_tools)
- 图像分割掩码标注转YOLO多边形标注
- [python] 向量检索库Faiss使用指北
- 如何把未量化的 70B 大模型加载到笔记本电脑上运行?
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- table.render (33)
- uniapp textarea (33)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- react-admin (33)
- vscode切换git分支 (35)
- vscode美化代码 (33)
- python bytes转16进制 (35)