Может кто-нибудь порекомендовать простой API, который позволит мне использовать чтение входного файла CSV, выполнить несколько простых преобразований, а затем записать его.
Я уже давно использую изолированную версию Commons CSV и никогда не испытывал проблем. Я действительно надеюсь, что они продвигают это к полному положению и вынимают это из песочницы.
Алекс Маршалл
3
@ bmatthews68 ссылка на песочницу больше не существует - похоже, она перемещена в собственно Apache Commons (я тоже редактировал ссылку в ответе)
// если первая строка - заголовок
String [] header = reader.readNext ();
// перебираем reader.readNext, пока не вернем ноль
String [] line = reader.readNext ();
К сожалению, последняя загрузка OpenCSV (v2.2 на момент комментирования) не компилируется, и они не предоставляют предварительно собранный двоичный файл.
Опять
9
Пакет, который я скачал с SourceForge, содержал двоичный файл в папке развертывания.
Майк Сиклер
8
Если вы используете maven, обратите внимание, что код зависимости на официальном сайте содержит объявление версии "2.0", в котором есть некоторые ошибки, но в репозиториях есть обновленная версия 2.3.
Броунди
эта библиотека не записывает файл в отдельном потоке, нет?
Ваш код не будет компилироваться, поэтому я представил некоторые исправления. Кроме того, ParseDate () не работает правильно, поэтому я заменил его, чтобы прочитать строку. Это можно разобрать позже.
1
Большое ограничение: SuperCSV не безопасен для потоков, я собираюсь посмотреть на Джексона, хотя он может быть более ограниченным
ZiglioUK
SuperCsv также не позволяет использовать мультикарты. Было бы приятно увидеть, как это работает с MultiMaps.
Сид
19
Чтение описания формата CSV заставляет меня чувствовать, что использование сторонней библиотеки было бы меньше головной болью, чем ее написание:
Я сравнил перечисленные библиотеки, используя какой-то контрольный список. OpenCSV оказался для меня победителем (YMMV) со следующими результатами:
+ maven
+ maven - release version // had some cryptic issues at _Hudson_ with snapshot references => prefer to be on a safe side+ code examples
+ open source // as in "can hack myself if needed"+ understandable javadoc // as opposed to eg javadocs of _genjava gj-csv_+ compact API // YAGNI (note *flatpack* seems to have much richer API than OpenCSV)- reference to specification used // I really like it when people can explain what they're doing- reference to _RFC 4180_ support // would qualify as simplest form of specification to me- releases changelog // absence is quite a pity, given how simple it'd be to get with maven-changes-plugin // _flatpack_, for comparison, has quite helpful changelog+ bug tracking
+ active // as in "can submit a bug and expect a fixed release soon"+ positive feedback // Recommended By 51 users at sourceforge (as of now)
Единственная проблема с этой библиотекой заключается в том, что она не позволяет выводить файлы CSV с разделителями строк Windows ( \r\n), если она не работает в Windows. Автор не оказывал поддержку годами. Я должен был раскошелиться,
Мости Мостачо
6
Для последнего корпоративного приложения, над которым я работал, необходимо было обработать значительное количество CSV - пару месяцев назад - я использовал SuperCSV в sourceforge и нашел его простым, надежным и без проблем.
+1 для SuperCSV, но у него есть некоторые неприятные ошибки, которые еще не исправлены, новые ошибки в настоящее время не обрабатываются, а последней версии почти два года. Но мы используем исправленную / модифицированную версию в производстве без каких-либо проблем.
MRalwasser
2
@MRalwasser Super CSV 2.0.0-beta-1 был недавно выпущен. Он включает в себя множество исправлений ошибок и новых функций (включая поддержку Maven и новое расширение Dozer для отображения вложенных свойств и массивов / коллекций)
Джеймс Бассетт,
1
@ Hound-Dog Спасибо за обновление, я уже заметил новую бета-версию и рад видеть проект живым - хотя частота коммитов все еще немного меня боится (почти все коммиты только за несколько дней). Но я посмотрю. Есть приблизительная дата выпуска финальной версии 2.0?
MRalwasser
2
@MRalwasser Я единственный разработчик на данный момент и работаю полный рабочий день, поэтому я стараюсь работать над этим всякий раз, когда получаю бесплатные выходные - отсюда спорадические коммиты :) Почти 1000 загрузок SF бета сейчас, и никаких ошибок, так что ожидаем окончательного релиза в начале следующего месяца. Если у вас есть идеи для будущих функций, пожалуйста, сообщите нам.
Джеймс Бассетт
1
SuperCSV на этом этапе не является поточно-ориентированным, что делает его не очень надежным imho
ZiglioUK
5
Вы можете использовать csvreader api & download из следующего местоположения:
/************* For Writing ***************************/import java.io.File;import java.io.FileWriter;import java.io.IOException;import com.csvreader.CsvWriter;publicclassCsvWriterAppendExample{publicstaticvoid main(String[] args){String outputFile ="users.csv";// before we open the file check to see if it already existsboolean alreadyExists =newFile(outputFile).exists();try{// use FileWriter constructor that specifies open for appendingCsvWriter csvOutput =newCsvWriter(newFileWriter(outputFile,true),',');// if the file didn't already exist then we need to write out the header lineif(!alreadyExists){
csvOutput.write("id");
csvOutput.write("name");
csvOutput.endRecord();}// else assume that the file already has the correct header line// write out a few records
csvOutput.write("1");
csvOutput.write("Bruce");
csvOutput.endRecord();
csvOutput.write("2");
csvOutput.write("John");
csvOutput.endRecord();
csvOutput.close();}catch(IOException e){
e.printStackTrace();}}}
Формат CSV звучит достаточно просто для StringTokenizer, но он может стать более сложным. Здесь, в Германии, точка с запятой используется в качестве разделителя, и ячейки, содержащие разделители, должны быть экранированы. Вы не будете справляться с этим легко с StringTokenizer.
Если вы собираетесь читать CSV из Excel, то здесь есть несколько интересных случаев. Я не могу вспомнить их всех, но CSV Apache Commons не был в состоянии обработать его правильно (например, с URL).
Не забудьте проверить вывод Excel с кавычками, запятыми и косой чертой повсюду.
Ответы:
Apache Commons CSV
Проверьте Apache Common CSV .
Эта библиотека читает и записывает несколько вариантов CSV , включая стандартную RFC 4180 . Также читает / пишет файлы с разделителями табуляции .
источник
Я использовал OpenCSV в прошлом.
В ответах на другой вопрос были и другие варианты .
источник
Обновление: код в этом ответе для Super CSV 1.52. Обновленные примеры кода для Super CSV 2.4.0 можно найти на веб-сайте проекта: http://super-csv.github.io/super-csv/index.html.
Проект SuperCSV напрямую поддерживает синтаксический анализ и структурированные манипуляции с клетками CSV. На http://super-csv.github.io/super-csv/examples_reading.html вы найдете, например,
дали класс
и что у вас есть файл CSV с заголовком. Давайте предположим следующее содержание
Затем вы можете создать экземпляр UserBean и заполнить его значениями из второй строки файла с помощью следующего кода
используя следующую «спецификацию манипуляции»
источник
Чтение описания формата CSV заставляет меня чувствовать, что использование сторонней библиотеки было бы меньше головной болью, чем ее написание:
В Википедии перечислены 10 или что-то из известных библиотек:
Я сравнил перечисленные библиотеки, используя какой-то контрольный список. OpenCSV оказался для меня победителем (YMMV) со следующими результатами:
источник
Мы используем JavaCSV , он работает довольно хорошо
источник
\r\n
), если она не работает в Windows. Автор не оказывал поддержку годами. Я должен был раскошелиться,Для последнего корпоративного приложения, над которым я работал, необходимо было обработать значительное количество CSV - пару месяцев назад - я использовал SuperCSV в sourceforge и нашел его простым, надежным и без проблем.
источник
Вы можете использовать csvreader api & download из следующего местоположения:
http://sourceforge.net/projects/javacsv/files/JavaCsv/JavaCsv%202.1/javacsv2.1.zip/download
или
http://sourceforge.net/projects/javacsv/
Используйте следующий код:
Запись / добавление в файл CSV
Код:
источник
Существует также CSV / Excel Utility . Он предполагает, что все эти данные подобны таблицам, и доставляет данные от итераторов.
источник
Формат CSV звучит достаточно просто для StringTokenizer, но он может стать более сложным. Здесь, в Германии, точка с запятой используется в качестве разделителя, и ячейки, содержащие разделители, должны быть экранированы. Вы не будете справляться с этим легко с StringTokenizer.
Я бы пошел на http://sourceforge.net/projects/javacsv
источник
Если вы собираетесь читать CSV из Excel, то здесь есть несколько интересных случаев. Я не могу вспомнить их всех, но CSV Apache Commons не был в состоянии обработать его правильно (например, с URL).
Не забудьте проверить вывод Excel с кавычками, запятыми и косой чертой повсюду.
источник