C# :通用CSV导入与导出类(特殊字符处理)
liuian 2025-05-15 19:07 3 浏览
这个版本完善了一下对特殊字符的处理,在现代应用程序中,CSV(Comma-Separated Values)格式是数据导入和导出的常见选择。这是由于CSV简单、易读、跨平台的特性。然而,当处理包含特殊字符的数据时,可能会出现一些复杂性。在这篇文章中,我们将设计一个通用的C#类来处理CSV文件中的导入和导出,包括对特殊字符的处理。
设计通用CSV导入与导出类
我们将创建一个名为CsvHelper的类,其中包含用于导入和导出CSV文件的功能。这些功能将确保数据中包含的特殊字符(如引号、逗号和换行符等)可以被正确地处理。
CsvHelper类
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
namespace AppCsv
{
public class CsvHelper
{
// 定义CSV分隔符和引用字符
private const char Delimiter = ',';
private const char Quote = '"';
private const string DoubleQuote = "\"\"";
// 导出数据到CSV文件
public void ExportToCsv(string filePath, List<string[]> data)
{
using (var writer = new StreamWriter(filePath))
{
foreach (var row in data)
{
var escapedRow = new List<string>();
foreach (var field in row)
{
// 对每个字段进行转义
escapedRow.Add(EscapeField(field));
}
// 将行写入文件
writer.WriteLine(string.Join(Delimiter.ToString(), escapedRow));
}
}
}
// 导入CSV文件数据
public List<string[]> ImportFromCsv(string filePath)
{
var data = new List<string[]>();
using (var reader = new StreamReader(filePath))
{
string line;
StringBuilder currentLine = new StringBuilder();
bool insideQuote = false;
// 按行读取文件
while ((line = reader.ReadLine()) != null)
{
currentLine.Append(line);
// 如果当前行中的引用字符数目为奇数,说明字段还未结束
if (line.Count(c => c == Quote) % 2 != 0)
{
// 字段未结束,继续读取下一行
currentLine.Append("\n");
continue;
}
// 解析完整行
var fields = ParseCsvLine(currentLine.ToString());
data.Add(fields);
currentLine.Clear();
}
// 添加剩余未处理的行
if (currentLine.Length > 0)
{
data.Add(ParseCsvLine(currentLine.ToString()));
}
}
return data;
}
// 解析CSV行并处理特殊字符
private string[] ParseCsvLine(string csvLine)
{
var fields = new List<string>();
var buffer = new StringBuilder();
bool insideQuote = false;
for (int i = 0; i < csvLine.Length; i++)
{
char currentChar = csvLine[i];
if (currentChar == Delimiter && !insideQuote)
{
// 如果未在引用内,则这是一个字段的分界
fields.Add(UnescapeField(buffer.ToString()));
buffer.Clear();
}
else if (currentChar == Quote)
{
if (insideQuote && i + 1 < csvLine.Length && csvLine[i + 1] == Quote)
{
// 处理转义的引号
buffer.Append(currentChar);
i++; // 跳过下一个引号
}
else
{
insideQuote = !insideQuote;
}
}
else
{
// 添加字符到缓冲区
buffer.Append(currentChar);
}
}
// 添加最后一个字段
fields.Add(UnescapeField(buffer.ToString()));
return fields.ToArray();
}
// 处理字段中的特殊字符
private string EscapeField(string field)
{
if (field.Contains(Delimiter) || field.Contains(Quote.ToString()) || field.Contains("\n"))
{
// 如果字段包含分隔符、引号或换行符,则需要进行转义
return Quote + field.Replace(Quote.ToString(), DoubleQuote) + Quote;
}
return field;
}
// 解除转义字段
private string UnescapeField(string field)
{
// 去除首尾的引号并处理双引号
if (field.StartsWith(Quote.ToString()) && field.EndsWith(Quote.ToString()))
{
field = field.Substring(1, field.Length - 2).Replace(DoubleQuote, Quote.ToString());
}
return field;
}
}
}
使用示例
下面是如何使用CsvHelper类来导入和导出包含特殊字符的CSV数据。
导出数据示例
private void btnExport_Click(object sender, EventArgs e)
{
var data = new List<string[]>
{
new[] { "ID", "Name", "Description" },
new[] { "1", "Alice", "Software, Developer" },
new[] { "2", "Bob", "\"The best\" Coder" },
new[] { "3", "Charlie", "Line\nBreak" }
};
var csvHelper = new CsvHelper();
csvHelper.ExportToCsv("output.csv", data);
}
导入数据示例
private void btnImport_Click(object sender, EventArgs e)
{
var csvHelper = new CsvHelper();
var importedData = csvHelper.ImportFromCsv("output.csv");
foreach (var row in importedData)
{
txt.AppendText(string.Join(", ", row));
txt.AppendText(System.Environment.NewLine);
}
}
结论
通过CsvHelper类,我们可以轻松导入和导出CSV文件,同时正确处理数据中的特殊字符。无论是文件中的引号、逗号,还是换行符,该类都有能力正确地处理。当您需要在C#项目中处理CSV时,CsvHelper是一个通用且可靠的选择。希望这篇文章能够帮助您更好地理解和实现CSV文件的操作。
相关推荐
- 【常识】如何优化Windows 7
-
优化Windows7可以让这个经典系统运行更流畅,特别是在老旧硬件上。以下是经过整理的实用优化方案,分为基础优化和进阶优化两部分:一、基础优化(适合所有用户)1.关闭不必要的视觉效果右键计算机...
- 系统优化!Windows 11/10 必做的十个优化配置
-
以下是为Windows10/11用户整理的10个必做优化配置,涵盖性能提升、隐私保护和系统精简等方面,操作安全且无需第三方工具:1.禁用不必要的开机启动项操作路径:`Ctrl+S...
- 最好用音频剪辑的软件,使用方法?
-
QVE音频剪辑是一款简单实用的软件,功能丰富,可编辑全格式音频。支持音频转换、合并、淡入淡出、变速、音量调节等,无时长限制,用户可自由剪辑。剪辑后文件音质无损,支持多格式转换,便于存储与跨设备播放,满...
- Vue2 开发总踩坑?这 8 个实战技巧让代码秒变丝滑
-
前端开发的小伙伴们,在和Vue2打交道的日子里,是不是总被各种奇奇怪怪的问题搞得头大?数据不响应、组件传值混乱、页面加载慢……别慌!今天带来8个超实用的Vue2实战技巧,每一个都能直击痛...
- Motion for Vue:为Vue量身定制的强大动画库
-
在前端开发中,动画效果是提升用户体验的重要手段。Vue生态系统中虽然有许多动画库,但真正能做到高性能、易用且功能丰富的并不多。今天,我们要介绍的是MotionforVue(motion-v),...
- CSS view():JavaScript 滚动动画的终结
-
前言CSSview()方法可能会标志着JavaScript在制作滚动动画方面的衰落。如何用5行CSS代码取代50多行繁琐的JavaScript,彻底改变网页动画每次和UI/U...
- 「大数据」 hive入门
-
前言最近会介入数据中台项目,所以会推出一系列的跟大数据相关的组件博客与文档。Hive这个大数据组件自从Hadoop诞生之日起,便作为Hadoop生态体系(HDFS、MR/YARN、HIVE、HBASE...
- 青铜时代的终结:对奖牌架构的反思
-
作者|AdamBellemare译者|王强策划|Tina要点运维和分析用例无法可靠地访问相关、完整和可信赖的数据。需要一种新的数据处理方法。虽然多跳架构已经存在了几十年,并且可以对...
- 解析IBM SQL-on-Hadoop的优化思路
-
对于BigSQL的优化,您需要注意以下六个方面:1.平衡的物理设计在进行集群的物理设计需要考虑数据节点的配置要一致,避免某个数据节点性能短板而影响整体性能。而对于管理节点,它虽然不保存业务数据,但作...
- 交易型数据湖 - Apache Iceberg、Apache Hudi和Delta Lake的比较
-
图片由作者提供简介构建数据湖最重要的决定之一是选择数据的存储格式,因为它可以大大影响系统的性能、可用性和兼容性。通过仔细考虑数据存储的格式,我们可以增强数据湖的功能和性能。有几种不同的选择,每一种都有...
- 深入解析全新 AWS S3 Tables:重塑数据湖仓架构
-
在AWSre:Invent2024大会中,AWS发布了AmazonS3Tables:一项专为可扩展存储和管理结构化数据而设计的解决方案,基于ApacheIceberg开放表格...
- Apache DataFusion查询引擎简介
-
简介DataFusion是一个查询引擎,其本身不具备存储数据的能力。正因为不依赖底层存储的格式,使其成为了一个灵活可扩展的查询引擎。它原生支持了查询CSV,Parquet,Avro,Json等存储格式...
- 大数据Hadoop之——Flink Table API 和 SQL(单机Kafka)
-
一、TableAPI和FlinkSQL是什么TableAPI和SQL集成在同一套API中。这套API的核心概念是Table,用作查询的输入和输出,这套API都是批处理和...
- 比较前 3 名Schema管理工具
-
关注留言点赞,带你了解最流行的软件开发知识与最新科技行业趋势。在本文中,读者将了解三种顶级schema管理工具,如AWSGlue、ConfluentSchemaRegistry和Memph...
- 大数据技术之Flume
-
第1章概述1.1Flume定义Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统。Flume基于流式架构,灵活简单。1.2Flume的优点1.可以和...
- 一周热门
-
-
Python实现人事自动打卡,再也不会被批评
-
Psutil + Flask + Pyecharts + Bootstrap 开发动态可视化系统监控
-
一个解决支持HTML/CSS/JS网页转PDF(高质量)的终极解决方案
-
【验证码逆向专栏】vaptcha 手势验证码逆向分析
-
再见Swagger UI 国人开源了一款超好用的 API 文档生成框架,真香
-
网页转成pdf文件的经验分享 网页转成pdf文件的经验分享怎么弄
-
C++ std::vector 简介
-
python使用fitz模块提取pdf中的图片
-
《人人译客》如何规划你的移动电商网站(2)
-
Jupyterhub安装教程 jupyter怎么安装包
-
- 最近发表
- 标签列表
-
- python判断字典是否为空 (50)
- crontab每周一执行 (48)
- aes和des区别 (43)
- bash脚本和shell脚本的区别 (35)
- canvas库 (33)
- dataframe筛选满足条件的行 (35)
- gitlab日志 (33)
- lua xpcall (36)
- blob转json (33)
- python判断是否在列表中 (34)
- python html转pdf (36)
- 安装指定版本npm (37)
- idea搜索jar包内容 (33)
- css鼠标悬停出现隐藏的文字 (34)
- linux nacos启动命令 (33)
- gitlab 日志 (36)
- adb pull (37)
- table.render (33)
- uniapp textarea (33)
- python判断元素在不在列表里 (34)
- python 字典删除元素 (34)
- react-admin (33)
- vscode切换git分支 (35)
- vscode美化代码 (33)
- python bytes转16进制 (35)