Отлично действительно. Он отлично работал для меня из коробки, даже не читая документацию.
ухмылка
Будет ли это работать с файлами CSV, где каждая строка может иметь разную структуру? У меня есть файл журнала с различными типами регистрируемых событий, которые необходимо разделить на несколько таблиц.
gonzobrains
2
@gonzobrains - Вероятно, нет; основное допущение файла CSV - это прямоугольная структура данных, основанная на одном наборе заголовков столбцов, указанном в первой строке. То, что у вас есть, является более общими, разделенными запятыми, различаемыми данными, требующими более сложного «ETL» для анализа из файла в экземпляры объектов различных типов (которые могут включать в себя DataRows различных DataTables).
KeithS
93
Я использовал OleDbпоставщика. Однако возникают проблемы, если вы читаете в строках, которые имеют числовые значения, но вы хотите, чтобы они обрабатывались как текст. Однако вы можете обойти эту проблему, создав schema.iniфайл. Вот мой метод, который я использовал:
// using System.Data;// using System.Data.OleDb;// using System.Globalization;// using System.IO;staticDataTableGetDataTableFromCsv(string path,bool isFirstRowHeader){string header = isFirstRowHeader ?"Yes":"No";string pathOnly =Path.GetDirectoryName(path);string fileName =Path.GetFileName(path);string sql =@"SELECT * FROM ["+ fileName +"]";
using(OleDbConnection connection =newOleDbConnection(@"Provider=Microsoft.Jet.OLEDB.4.0;Data Source="+ pathOnly +";Extended Properties=\"Text;HDR="+ header +"\""))
using(OleDbCommand command =newOleDbCommand(sql, connection))
using(OleDbDataAdapter adapter =newOleDbDataAdapter(command)){DataTable dataTable =newDataTable();
dataTable.Locale=CultureInfo.CurrentCulture;
adapter.Fill(dataTable);return dataTable;}}
Спасибо дружище. Это помогло мне. У меня был CSV-файл, в котором запятые были не только разделителями, они были везде во многих значениях столбцов, поэтому придумать регулярное выражение, разделяющее строку, было довольно сложно. OleDbProvider правильно вывел схему.
Галилу
Реализация имеет смысл, но как мы имеем дело с ячейками, содержащими смешанные типы данных. Например 40С и тд?
GKED
GKED, если данные, в которых вы читаете, всегда имеют ожидаемый набор столбцов и типов, вы можете поместить в одну папку файл shema.ini, который сообщает поставщику OleDb информацию о столбцах. Вот ссылка на статью Microsoft, в которой подробно описывается, как структурировать файл. msdn.microsoft.com/en-us/library/…
Джим Скотт
4
Пока этот ответ будет работать, я настоятельно рекомендую против этого. Вы вводите внешнюю зависимость, которая может конфликтовать с другими установками офиса на том же компьютере (использовать Excel в локальной среде разработчика?), В зависимости от установленных версий. Существуют пакеты NuGet (ExcelDataReader, CsvHelper), которые делают это более эффективным и более переносимым способом.
А. Мюррей
1
@ A.Murray - Что именно вы имеете в виду? При этом используется встроенный поставщик OleDb в System.Data.dll. Вам не нужно устанавливать никаких дополнительных «драйверов». И я был бы шокирован в наши дни, если бы в любой установке Windows не был установлен основной драйвер Jet. Это CSV 1990-х ....
После использования Csv Reader Себастьяна Лориона в моем проекте в течение почти полутора лет я обнаружил, что он генерирует исключения при синтаксическом анализе некоторых CSV-файлов, которые, по моему мнению, хорошо сформированы.
var csv =@"Name, Age
Ronnie, 30
Mark, 40
Ace, 50";TextReader reader =newStringReader(csv);var table =newDataTable();
using(var it = reader.ReadCsvWithHeader().GetEnumerator()){if(!it.MoveNext())return;foreach(var k in it.Current.Keys)
table.Columns.Add(k);do{var row = table.NewRow();foreach(var k in it.Current.Keys)
row[k]= it.Current[k];
table.Rows.Add(row);}while(it.MoveNext());}
Я согласен, что читатель CSV Себастьяна Лориена великолепен. Я использую его для тяжелой обработки CSV, но я также использовал Rissing от Эндрю для небольших работ, и это мне хорошо послужило. Радоваться, веселиться!
Джей Риггс
Как я могу использовать эти классы для загрузки CSV в DATATABLE?
Muflix
Я пробовал это, но коллекция it.Current.Keys возвращается с "System.Linq.Enumerable + WhereSelectListIterator`2 [System.Int32, System.Char]", а не именем столбца. Есть мысли, почему?
user3658298
Вы можете использовать многосимвольные разделители?
катится
Нет, но я думал о том, чтобы включить это.
Ронни Оверби
32
Эй, это работает на 100%
publicstaticDataTableConvertCSVtoDataTable(string strFilePath){DataTable dt =newDataTable();
using (StreamReader sr =newStreamReader(strFilePath)){string[] headers = sr.ReadLine().Split(',');foreach(string header in headers){
dt.Columns.Add(header);}while(!sr.EndOfStream){string[] rows = sr.ReadLine().Split(',');DataRow dr = dt.NewRow();for(int i =0; i < headers.Length; i++){
dr[i]= rows[i];}
dt.Rows.Add(dr);}}return dt;}
@ShivamSrivastava Я получаю сообщение об ошибке в последнем ряду. Вы там, затем предоставьте другую контактную информацию
Сунил Ачарья,
Хотя я не использовал эту версию точно, именно на этом я решил свою проблему. Спасибо. Работает очень хорошо.
nrod
13
Мы всегда использовали драйвер Jet.OLEDB, пока не начали переходить на 64-битные приложения. Microsoft не выпустила и не выпустит 64-битный драйвер Jet. Вот простое решение, которое мы придумали, которое использует File.ReadAllLines и String.Split для чтения и анализа CSV-файла и загрузки DataTable вручную. Как отмечено выше, он НЕ обрабатывает ситуацию, когда одно из значений столбца содержит запятую. Мы используем это в основном для чтения пользовательских файлов конфигурации - приятная часть использования CSV-файлов заключается в том, что мы можем редактировать их в Excel.
stringCSVFilePathName=@"C:\test.csv";string[]Lines=File.ReadAllLines(CSVFilePathName);string[]Fields;Fields=Lines[0].Split(newchar[]{','});intCols=Fields.GetLength(0);DataTable dt =newDataTable();//1st row must be column names; force lower case to ensure matching later on.for(int i =0; i <Cols; i++)
dt.Columns.Add(Fields[i].ToLower(),typeof(string));DataRowRow;for(int i =1; i <Lines.GetLength(0); i++){Fields=Lines[i].Split(newchar[]{','});Row= dt.NewRow();for(int f =0; f <Cols; f++)Row[f]=Fields[f];
dt.Rows.Add(Row);}
это код, который я использую, но ваши приложения должны работать с чистой версией 3.5
privatevoid txtRead_Click(object sender,EventArgs e){// var filename = @"d:\shiptest.txt";
openFileDialog1.InitialDirectory="d:\\";
openFileDialog1.Filter="txt files (*.txt)|*.txt|All files (*.*)|*.*";DialogResult result = openFileDialog1.ShowDialog();if(result ==DialogResult.OK){if(openFileDialog1.FileName!=""){var reader =ReadAsLines(openFileDialog1.FileName);var data =newDataTable();//this assume the first record is filled with the column namesvar headers = reader.First().Split(',');foreach(var header in headers){
data.Columns.Add(header);}var records = reader.Skip(1);foreach(var record in records){
data.Rows.Add(record.Split(','));}
dgList.DataSource= data;}}}staticIEnumerable<string>ReadAsLines(string filename){
using (StreamReader reader =newStreamReader(filename))while(!reader.EndOfStream)yieldreturn reader.ReadLine();}
Пожалуйста, не пытайтесь заново изобрести колесо с обработкой CSV. Есть так много отличных альтернатив с открытым исходным кодом, которые очень надежны.
Майк Коул
1
Спасибо Брэду, полезный совет относительно TextFieldParser для обработки встроенных кавычек.
Mattpm
3
publicclassCsv{publicstaticDataTableDataSetGet(string filename,string separatorChar,outList<string> errors){
errors =newList<string>();var table =newDataTable("StringLocalization");
using (var sr =newStreamReader(filename,Encoding.Default)){string line;var i =0;while(sr.Peek()>=0){try{
line = sr.ReadLine();if(string.IsNullOrEmpty(line))continue;var values = line.Split(new[]{separatorChar},StringSplitOptions.None);var row = table.NewRow();for(var colNum =0; colNum < values.Length; colNum++){varvalue= values[colNum];if(i ==0){
table.Columns.Add(value,typeof(String));}else{
row[table.Columns[colNum]]=value;}}if(i !=0) table.Rows.Add(row);}catch(Exception ex){
errors.Add(ex.Message);}
i++;}}return table;}}
Я наткнулся на этот фрагмент кода, который использует Linq и регулярные выражения для анализа файла CSV. Ссылочной статье уже более полутора лет, но она не нашла более точного способа анализа CSV с использованием Linq (и регулярных выражений), чем эта. Предостережение - это регулярное выражение, применяемое здесь для файлов с разделителями-запятыми (будет обнаруживать запятые внутри кавычек!) И то, что оно может не очень хорошо восприниматься в заголовках, но есть способ преодолеть их). Возьми пик:
Dim lines AsString()=System.IO.File.ReadAllLines(strCustomerFile)Dim pattern AsString=",(?=(?:[^""]*""[^""]*"")*(?![^""]*""))"Dim r AsSystem.Text.RegularExpressions.Regex=NewSystem.Text.RegularExpressions.Regex(pattern)Dim custs =From line In lines _
Let data = r.Split(line) _
SelectNewWith{.custnmbr = data(0), _
.custname = data(1)}ForEach cust In custs
strCUSTNMBR =Replace(cust.custnmbr,Chr(34),"")
strCUSTNAME =Replace(cust.custname,Chr(34),"")Next
Лучший вариант, который я нашел, и он решает проблемы, когда у вас могут быть установлены разные версии Office, а также 32/64-битные проблемы, такие как упомянутый Чак Бевитт , это FileHelpers. .
Он может быть добавлен к ссылкам на ваш проект с помощью NuGet и предоставляет однострочное решение:
Можете ли вы сказать, что такое CommonEngine? Есть NuGet то же самое с NuGet.Core. Я нашел только NuGet.Core в ссылках
синдху Джампани
Вам нужен FileHelpers. Если у вас есть NuGet, добавьте его с помощью NuGet. В противном случае просто добавьте его как сборку в ваш проект. CommonEngine является частью FileHelpers.
Нео
3
Для тех из вас, кто не хочет использовать внешнюю библиотеку и предпочитает не использовать OleDB, см. Пример ниже. Все, что я нашел, было либо OleDB, внешней библиотекой, либо просто разделением на запятую! В моем случае OleDB не работал, поэтому я хотел что-то другое.
Я нашел статью MarkJ, которая ссылается на метод Microsoft.VisualBasic.FileIO.TextFieldParser, как показано здесь . Статья написана на VB и не возвращает данных, поэтому посмотрите мой пример ниже.
publicstaticDataTableLoadCSV(string path,bool hasHeader){DataTable dt =newDataTable();
using (varMyReader=newMicrosoft.VisualBasic.FileIO.TextFieldParser(path)){MyReader.TextFieldType=Microsoft.VisualBasic.FileIO.FieldType.Delimited;MyReader.Delimiters=newString[]{","};string[] currentRow;//'Loop through all of the fields in the file. //'If any lines are corrupt, report an error and continue parsing. bool firstRow =true;while(!MyReader.EndOfData){try{
currentRow =MyReader.ReadFields();//Add the header columnsif(hasHeader && firstRow){foreach(string c in currentRow){
dt.Columns.Add(c,typeof(string));}
firstRow =false;continue;}//Create a new rowDataRow dr = dt.NewRow();
dt.Rows.Add(dr);//Loop thru the current line and fill the data outfor(int c =0; c < currentRow.Count(); c++){
dr[c]= currentRow[c];}}catch(Microsoft.VisualBasic.FileIO.MalformedLineException ex){//Handle the exception here}}}return dt;}
Очень простой ответ: если у вас нет сложного CSV, который может использовать простую функцию разбиения, это будет хорошо работать для импорта (обратите внимание, это импортирует как строки, я делаю преобразования типов данных позже, если мне нужно)
privateDataTable csvToDataTable(string fileName,char splitCharacter){StreamReader sr =newStreamReader(fileName);string myStringRow = sr.ReadLine();var rows = myStringRow.Split(splitCharacter);DataTableCsvData=newDataTable();foreach(string column in rows){//creates the columns of new datatable based on first row of csvCsvData.Columns.Add(column);}
myStringRow = sr.ReadLine();while(myStringRow !=null){//runs until string reader returns null and adds rows to dt
rows = myStringRow.Split(splitCharacter);CsvData.Rows.Add(rows);
myStringRow = sr.ReadLine();}
sr.Close();
sr.Dispose();returnCsvData;}
Мой метод, если я импортирую таблицу с разделителем строки [] и решает проблему, когда текущая строка, которую я читаю, могла перейти к следующей строке в CSV или текстовом файле <- В этом случае я хочу зациклить, пока не получу на общее количество строк в первом ряду (столбцы)
publicstaticDataTableImportCSV(string fullPath,string[] sepString){DataTable dt =newDataTable();
using (StreamReader sr =newStreamReader(fullPath)){//stream uses using statement because it implements iDisposablestring firstLine = sr.ReadLine();var headers = firstLine.Split(sepString,StringSplitOptions.None);foreach(var header in headers){//create column headers
dt.Columns.Add(header);}int columnInterval = headers.Count();string newLine = sr.ReadLine();while(newLine !=null){//loop adds each row to the datatablevar fields = newLine.Split(sepString,StringSplitOptions.None);// csv delimiter var currentLength = fields.Count();if(currentLength < columnInterval){while(currentLength < columnInterval){//if the count of items in the row is less than the column row go to next line until count matches column number total
newLine += sr.ReadLine();
currentLength = newLine.Split(sepString,StringSplitOptions.None).Count();}
fields = newLine.Split(sepString,StringSplitOptions.None);}if(currentLength > columnInterval){//ideally never executes - but if csv row has too many separators, line is skipped
newLine = sr.ReadLine();continue;}
dt.Rows.Add(fields);
newLine = sr.ReadLine();}
sr.Close();}return dt;}
Хорошо, что вы просто еще не объявили строки как string [].
Стиль животных
@AnimalStyle Вы правы - обновлен более надежным методом и объявлены строки
Мэтт Фаргюсон
3
Модифицировано от мистера Чака Бевитта
Рабочий раствор:
stringCSVFilePathName= APP_PATH +"Facilities.csv";string[]Lines=File.ReadAllLines(CSVFilePathName);string[]Fields;Fields=Lines[0].Split(newchar[]{','});intCols=Fields.GetLength(0);DataTable dt =newDataTable();//1st row must be column names; force lower case to ensure matching later on.for(int i =0; i <Cols-1; i++)
dt.Columns.Add(Fields[i].ToLower(),typeof(string));DataRowRow;for(int i =0; i <Lines.GetLength(0)-1; i++){Fields=Lines[i].Split(newchar[]{','});Row= dt.NewRow();for(int f =0; f <Cols-1; f++)Row[f]=Fields[f];
dt.Rows.Add(Row);}
Так что это решает проблему с памятью, верно? Это построчная обработка, а не сохранение в памяти, поэтому не должно быть исключений? Мне нравится, как это обрабатывается, но не сохраняет ли File.ReadAllLines () все в памяти? Я думаю, что вы должны использовать File.ReadLines (), чтобы избежать огромного буфера памяти? Это хороший ответ на поставленный вопрос, который я просто хочу знать о проблемах с памятью.
DtechNet
2
Вот решение, которое использует текстовый драйвер ODBC ADO.Net:
Dim csvFileFolder AsString="C:\YourFileFolder"Dim csvFileName AsString="YourFile.csv"'Note that the folder is specified in the connection string,'not the file. That's specified in the SELECT query, later.Dim connString AsString="Driver={Microsoft Text Driver (*.txt; *.csv)};Dbq=" _
& csvFileFolder &";Extended Properties=""Text;HDR=No;FMT=Delimited"""Dim conn AsNewOdbc.OdbcConnection(connString)'Open a data adapter, specifying the file name to load
Dim da AsNewOdbc.OdbcDataAdapter("SELECT * FROM ["& csvFileName &"]", conn)'Then fill a data table, which can be bound to a grid
Dim dt AsNewDataTableda.Fill(dt)
grdCSVData.DataSource= dt
После заполнения вы можете оценить свойства таблицы данных, например ColumnName, чтобы использовать все возможности объектов данных ADO.Net.
В VS2008 вы можете использовать Linq для достижения того же эффекта.
ПРИМЕЧАНИЕ: это может быть дубликат этого вопроса SO.
privatestaticDataTableLoadCsvData(string refPath){var cfg =newConfiguration(){Delimiter=",",HasHeaderRecord=true};var result =newDataTable();
using (var sr =newStreamReader(refPath,Encoding.UTF8,false,16384*2)){
using (var rdr =newCsvReader(sr, cfg))
using (var dataRdr =newCsvDataReader(rdr)){
result.Load(dataRdr);}}return result;}
Обратите внимание, что в выпуске 13Configuration было переименовано, CsvConfigurationчтобы избежать конфликтов пространства имен. Демонстрация этого ответа работает: dotnetfiddle.net/sdwc6i
dbc
2
Я использую библиотеку под названием ExcelDataReader, вы можете найти ее на NuGet. Обязательно установите и ExcelDataReader, и расширение ExcelDataReader.DataSet (последнее обеспечивает требуемый метод AsDataSet, указанный ниже).
Я инкапсулировал все в одну функцию, вы можете скопировать это прямо в свой код. Дайте ему путь к CSV-файлу, он получит набор данных с одной таблицей.
publicstaticDataSetGetDataSet(string filepath){var stream =File.OpenRead(filepath);try{var reader =ExcelReaderFactory.CreateCsvReader(stream,newExcelReaderConfiguration(){LeaveOpen=false});var result = reader.AsDataSet(newExcelDataSetConfiguration(){// Gets or sets a value indicating whether to set the DataColumn.DataType // property in a second pass.UseColumnDataType=true,// Gets or sets a callback to determine whether to include the current sheet// in the DataSet. Called once per sheet before ConfigureDataTable.FilterSheet=(tableReader, sheetIndex)=>true,// Gets or sets a callback to obtain configuration options for a DataTable. ConfigureDataTable=(tableReader)=>newExcelDataTableConfiguration(){// Gets or sets a value indicating the prefix of generated column names.EmptyColumnNamePrefix="Column",// Gets or sets a value indicating whether to use a row from the // data as column names.UseHeaderRow=true,// Gets or sets a callback to determine which row is the header row. // Only called when UseHeaderRow = true.ReadHeaderRow=(rowReader)=>{// F.ex skip the first row and use the 2nd row as column headers://rowReader.Read();},// Gets or sets a callback to determine whether to include the // current row in the DataTable.FilterRow=(rowReader)=>{returntrue;},// Gets or sets a callback to determine whether to include the specific// column in the DataTable. Called once per column after reading the // headers.FilterColumn=(rowReader, columnIndex)=>{returntrue;}}});return result;}catch(Exception ex){returnnull;}finally{
stream.Close();
stream.Dispose();}}
Это 2020 год, и это отличное решение по сравнению с некоторыми из старых ответов здесь. Он красиво упакован и использует популярную и легкую библиотеку от NuGet. И это гибко - если ваш CSV находится в памяти, просто передайте его MemoryStreamвместо пути к файлу. DataTable, который запрашивал OP, легко извлекается из DataSet следующим образом:result.Tables[0]
Tawab Wakil
1
Просто поделившись этими методами расширения, я надеюсь, что это может кому-то помочь.
publicstaticList<string>ToCSV(thisDataSet ds,char separator ='|'){List<string> lResult =newList<string>();foreach(DataTable dt in ds.Tables){StringBuilder sb =newStringBuilder();IEnumerable<string> columnNames = dt.Columns.Cast<DataColumn>().Select(column => column.ColumnName);
sb.AppendLine(string.Join(separator.ToString(), columnNames));foreach(DataRow row in dt.Rows){IEnumerable<string> fields = row.ItemArray.Select(field =>string.Concat("\"", field.ToString().Replace("\"","\"\""),"\""));
sb.AppendLine(string.Join(separator.ToString(), fields));}
lResult.Add(sb.ToString());}return lResult;}publicstaticDataSetCSVtoDataSet(thisList<string> collectionCSV,char separator ='|'){var ds =newDataSet();foreach(var csv in collectionCSV){var dt =newDataTable();var readHeader =false;foreach(var line in csv.Split(new[]{Environment.NewLine},StringSplitOptions.None)){if(!readHeader){foreach(var c in line.Split(separator))
dt.Columns.Add(c);}else{
dt.Rows.Add(line.Split(separator));}}
ds.Tables.Add(dt);}return ds;}
Использовать эту библиотеку для загрузки DataTableочень легко.
using var tr =File.OpenText("data.csv");
using var dr =CsvDataReader.Create(tr);var dt =newDataTable();
dt.Load(dr);
Предполагая, что ваш файл - это стандартные файлы с разделителями-запятыми и заголовками, это все, что вам нужно. Существуют также опции, позволяющие читать файлы без заголовков, использовать альтернативные разделители и т. Д.
Также можно предоставить пользовательскую схему для файла CSV, чтобы столбцы можно было обрабатывать как stringзначения, отличные от значений. Это позволит DataTableзагружать столбцы со значениями, с которыми проще работать, так как вам не придется их приводить при доступе к ним.
var schema =newTypedCsvSchema();
schema.Add(0,typeof(int));
schema.Add(1,typeof(string));
schema.Add(2,typeof(double?));
schema.Add(3,typeof(DateTime));
schema.Add(4,typeof(DateTime?));var options =newCsvDataReaderOptions{Schema= schema
};
using var tr =GetData();
using var dr =CsvDataReader.Create(tr, options);
TypedCsvSchemaявляется реализацией, ICsvSchemaProviderкоторая предоставляет простой способ определения типов столбцов. Тем не менее, также можно предоставить пользовательские настройки, ICsvSchemaProviderесли вы хотите предоставить больше метаданных, таких как уникальность или ограниченный размер столбца и т. Д.
Ответы:
Вот отличный класс, который будет копировать данные CSV в таблицу данных, используя структуру данных для создания DataTable:
Портативный и эффективный универсальный парсер для плоских файлов
Это легко настроить и легко использовать. Я призываю вас взглянуть.
источник
Я использовал
OleDb
поставщика. Однако возникают проблемы, если вы читаете в строках, которые имеют числовые значения, но вы хотите, чтобы они обрабатывались как текст. Однако вы можете обойти эту проблему, создавschema.ini
файл. Вот мой метод, который я использовал:источник
Я решил использовать Csv Reader Себастьяна Лориона .
Предложение Джея Риггса также является отличным решением, но мне просто не нужны были все функции, которые предоставляет Generic Parser Эндрю Риссинга .
ОБНОВЛЕНИЕ 25.10.2010
После использования Csv Reader Себастьяна Лориона в моем проекте в течение почти полутора лет я обнаружил, что он генерирует исключения при синтаксическом анализе некоторых CSV-файлов, которые, по моему мнению, хорошо сформированы.
Итак, я переключился на Generic Parser Эндрю Риссинга, и, похоже, дела идут намного лучше.
ОБНОВЛЕНИЕ 22.09.2014
В настоящее время я в основном использую этот метод расширения для чтения текста с разделителями:
https://github.com/Core-Techs/Common/blob/master/CoreTechs.Common/Text/DelimitedTextExtensions.cs#L22
https://www.nuget.org/packages/CoreTechs.Common/
ОБНОВЛЕНИЕ 20.02.2015
Пример:
источник
Эй, это работает на 100%
CSV Image
Таблица данных Импортировано
источник
Мы всегда использовали драйвер Jet.OLEDB, пока не начали переходить на 64-битные приложения. Microsoft не выпустила и не выпустит 64-битный драйвер Jet. Вот простое решение, которое мы придумали, которое использует File.ReadAllLines и String.Split для чтения и анализа CSV-файла и загрузки DataTable вручную. Как отмечено выше, он НЕ обрабатывает ситуацию, когда одно из значений столбца содержит запятую. Мы используем это в основном для чтения пользовательских файлов конфигурации - приятная часть использования CSV-файлов заключается в том, что мы можем редактировать их в Excel.
источник
это код, который я использую, но ваши приложения должны работать с чистой версией 3.5
источник
Вы можете достичь этого с помощью Microsoft.VisualBasic.FileIO.TextFieldParser dll в C #
источник
источник
Я наткнулся на этот фрагмент кода, который использует Linq и регулярные выражения для анализа файла CSV. Ссылочной статье уже более полутора лет, но она не нашла более точного способа анализа CSV с использованием Linq (и регулярных выражений), чем эта. Предостережение - это регулярное выражение, применяемое здесь для файлов с разделителями-запятыми (будет обнаруживать запятые внутри кавычек!) И то, что оно может не очень хорошо восприниматься в заголовках, но есть способ преодолеть их). Возьми пик:
источник
Лучший вариант, который я нашел, и он решает проблемы, когда у вас могут быть установлены разные версии Office, а также 32/64-битные проблемы, такие как упомянутый Чак Бевитт , это FileHelpers. .
Он может быть добавлен к ссылкам на ваш проект с помощью NuGet и предоставляет однострочное решение:
источник
Для тех из вас, кто не хочет использовать внешнюю библиотеку и предпочитает не использовать OleDB, см. Пример ниже. Все, что я нашел, было либо OleDB, внешней библиотекой, либо просто разделением на запятую! В моем случае OleDB не работал, поэтому я хотел что-то другое.
Я нашел статью MarkJ, которая ссылается на метод Microsoft.VisualBasic.FileIO.TextFieldParser, как показано здесь . Статья написана на VB и не возвращает данных, поэтому посмотрите мой пример ниже.
источник
Очень простой ответ: если у вас нет сложного CSV, который может использовать простую функцию разбиения, это будет хорошо работать для импорта (обратите внимание, это импортирует как строки, я делаю преобразования типов данных позже, если мне нужно)
Мой метод, если я импортирую таблицу с разделителем строки [] и решает проблему, когда текущая строка, которую я читаю, могла перейти к следующей строке в CSV или текстовом файле <- В этом случае я хочу зациклить, пока не получу на общее количество строк в первом ряду (столбцы)
источник
Модифицировано от мистера Чака Бевитта
Рабочий раствор:
источник
Вот решение, которое использует текстовый драйвер ODBC ADO.Net:
После заполнения вы можете оценить свойства таблицы данных, например ColumnName, чтобы использовать все возможности объектов данных ADO.Net.
В VS2008 вы можете использовать Linq для достижения того же эффекта.
ПРИМЕЧАНИЕ: это может быть дубликат этого вопроса SO.
источник
Не могу удержаться от добавления своего собственного спина к этому. Это намного лучше и компактнее, чем то, что я использовал в прошлом.
Это решение:
Вот что я придумал:
Это зависит от метода extension (
Unique
) для обработки повторяющихся имен столбцов, которые можно найти в качестве моего ответа в разделе Как добавлять уникальные числа в список строкА вот
BlankToNothing
вспомогательная функция:источник
С Cinchoo ETL - библиотеку с открытым исходным кодом, вы можете легко конвертировать файл CSV в DataTable с несколькими строками кода.
Для получения дополнительной информации, пожалуйста, посетите codeproject статью .
Надеюсь, поможет.
источник
используя: https://joshclose.github.io/CsvHelper/
источник
Configuration
было переименовано,CsvConfiguration
чтобы избежать конфликтов пространства имен. Демонстрация этого ответа работает: dotnetfiddle.net/sdwc6iЯ использую библиотеку под названием ExcelDataReader, вы можете найти ее на NuGet. Обязательно установите и ExcelDataReader, и расширение ExcelDataReader.DataSet (последнее обеспечивает требуемый метод AsDataSet, указанный ниже).
Я инкапсулировал все в одну функцию, вы можете скопировать это прямо в свой код. Дайте ему путь к CSV-файлу, он получит набор данных с одной таблицей.
источник
MemoryStream
вместо пути к файлу. DataTable, который запрашивал OP, легко извлекается из DataSet следующим образом:result.Tables[0]
Просто поделившись этими методами расширения, я надеюсь, что это может кому-то помочь.
источник
Используйте это, одна функция решит все проблемы запятой и цитаты:
источник
источник
Недавно я написал анализатор CSV для .NET, который, как я утверждаю, в настоящее время является самым быстрым из доступных в виде пакета nuget : Sylvan.Data.Csv .
Использовать эту библиотеку для загрузки
DataTable
очень легко.Предполагая, что ваш файл - это стандартные файлы с разделителями-запятыми и заголовками, это все, что вам нужно. Существуют также опции, позволяющие читать файлы без заголовков, использовать альтернативные разделители и т. Д.
Также можно предоставить пользовательскую схему для файла CSV, чтобы столбцы можно было обрабатывать как
string
значения, отличные от значений. Это позволитDataTable
загружать столбцы со значениями, с которыми проще работать, так как вам не придется их приводить при доступе к ним.TypedCsvSchema
является реализацией,ICsvSchemaProvider
которая предоставляет простой способ определения типов столбцов. Тем не менее, также можно предоставить пользовательские настройки,ICsvSchemaProvider
если вы хотите предоставить больше метаданных, таких как уникальность или ограниченный размер столбца и т. Д.источник