CSV API для Java [закрыто]

164

Может кто-нибудь порекомендовать простой API, который позволит мне использовать чтение входного файла CSV, выполнить несколько простых преобразований, а затем записать его.

Быстрый Google нашел http://flatpack.sourceforge.net/, который выглядит многообещающим.

Я просто хотел проверить, что используют другие, прежде чем присоединиться к этому API.

Дэвид Тернер
источник
Используйте дочерний сайт программного обеспечения Stack Exchange при запросе предложений по библиотеке программного обеспечения. Имеет несколько хитов для Java и CSV .
Базилик Бурк

Ответы:

32

Apache Commons CSV

Проверьте Apache Common CSV .

Эта библиотека читает и записывает несколько вариантов CSV , включая стандартную RFC 4180 . Также читает / пишет файлы с разделителями табуляции .

  • превосходить
  • InformixUnload
  • InformixUnloadCsv
  • MySQL
  • оракул
  • PostgreSQLCsv
  • PostgreSQLText
  • RFC4180
  • TDF
Базилик Бурк
источник
Я уже давно использую изолированную версию Commons CSV и никогда не испытывал проблем. Я действительно надеюсь, что они продвигают это к полному положению и вынимают это из песочницы.
Алекс Маршалл
3
@ bmatthews68 ссылка на песочницу больше не существует - похоже, она перемещена в собственно Apache Commons (я тоже редактировал ссылку в ответе)
drevicko
Примеры Apache Commons здесь: apisonar.com/java-examples/org.apache.commons.csv.html
APISonar
83

Я использовал OpenCSV в прошлом.

import au.com.bytecode.opencsv.CSVReader;

String fileName = "data.csv";
CSVReader reader = новый CSVReader (новый FileReader (fileName));

// если первая строка - заголовок String [] header = reader.readNext ();
// перебираем reader.readNext, пока не вернем ноль String [] line = reader.readNext ();

В ответах на другой вопрос были и другие варианты .

Джей Р.
источник
К сожалению, последняя загрузка OpenCSV (v2.2 на момент комментирования) не компилируется, и они не предоставляют предварительно собранный двоичный файл.
Опять
9
Пакет, который я скачал с SourceForge, содержал двоичный файл в папке развертывания.
Майк Сиклер
8
Если вы используете maven, обратите внимание, что код зависимости на официальном сайте содержит объявление версии "2.0", в котором есть некоторые ошибки, но в репозиториях есть обновленная версия 2.3.
Броунди
эта библиотека не записывает файл в отдельном потоке, нет?
Эвокс
3
в соответствии с github.com/uniVocity/csv-parsers-comparison в среднем на 73% медленнее , чем однозначности ..
эвоки
32

Обновление: код в этом ответе для Super CSV 1.52. Обновленные примеры кода для Super CSV 2.4.0 можно найти на веб-сайте проекта: http://super-csv.github.io/super-csv/index.html.


Проект SuperCSV напрямую поддерживает синтаксический анализ и структурированные манипуляции с клетками CSV. На http://super-csv.github.io/super-csv/examples_reading.html вы найдете, например,

дали класс

public class UserBean {
    String username, password, street, town;
    int zip;

    public String getPassword() { return password; }
    public String getStreet() { return street; }
    public String getTown() { return town; }
    public String getUsername() { return username; }
    public int getZip() { return zip; }
    public void setPassword(String password) { this.password = password; }
    public void setStreet(String street) { this.street = street; }
    public void setTown(String town) { this.town = town; }
    public void setUsername(String username) { this.username = username; }
    public void setZip(int zip) { this.zip = zip; }
}

и что у вас есть файл CSV с заголовком. Давайте предположим следующее содержание

username, password,   date,        zip,  town
Klaus,    qwexyKiks,  17/1/2007,   1111, New York
Oufu,     bobilop,    10/10/2007,  4555, New York

Затем вы можете создать экземпляр UserBean и заполнить его значениями из второй строки файла с помощью следующего кода

class ReadingObjects {
  public static void main(String[] args) throws Exception{
    ICsvBeanReader inFile = new CsvBeanReader(new FileReader("foo.csv"), CsvPreference.EXCEL_PREFERENCE);
    try {
      final String[] header = inFile.getCSVHeader(true);
      UserBean user;
      while( (user = inFile.read(UserBean.class, header, processors)) != null) {
        System.out.println(user.getZip());
      }
    } finally {
      inFile.close();
    }
  }
}

используя следующую «спецификацию манипуляции»

final CellProcessor[] processors = new CellProcessor[] {
    new Unique(new StrMinMax(5, 20)),
    new StrMinMax(8, 35),
    new ParseDate("dd/MM/yyyy"),
    new Optional(new ParseInt()),
    null
};
KBG
источник
1
Ваш код не будет компилироваться, поэтому я представил некоторые исправления. Кроме того, ParseDate () не работает правильно, поэтому я заменил его, чтобы прочитать строку. Это можно разобрать позже.
1
Большое ограничение: SuperCSV не безопасен для потоков, я собираюсь посмотреть на Джексона, хотя он может быть более ограниченным
ZiglioUK
SuperCsv также не позволяет использовать мультикарты. Было бы приятно увидеть, как это работает с MultiMaps.
Сид
19

Чтение описания формата CSV заставляет меня чувствовать, что использование сторонней библиотеки было бы меньше головной болью, чем ее написание:

В Википедии перечислены 10 или что-то из известных библиотек:

Я сравнил перечисленные библиотеки, используя какой-то контрольный список. OpenCSV оказался для меня победителем (YMMV) со следующими результатами:

+ maven

+ maven - release version   // had some cryptic issues at _Hudson_ with snapshot references => prefer to be on a safe side

+ code examples

+ open source   // as in "can hack myself if needed"

+ understandable javadoc   // as opposed to eg javadocs of _genjava gj-csv_

+ compact API   // YAGNI (note *flatpack* seems to have much richer API than OpenCSV)

- reference to specification used   // I really like it when people can explain what they're doing

- reference to _RFC 4180_ support   // would qualify as simplest form of specification to me

- releases changelog   // absence is quite a pity, given how simple it'd be to get with maven-changes-plugin   // _flatpack_, for comparison, has quite helpful changelog

+ bug tracking

+ active   // as in "can submit a bug and expect a fixed release soon"

+ positive feedback   // Recommended By 51 users at sourceforge (as of now)
комар
источник
8

Мы используем JavaCSV , он работает довольно хорошо

Мат Маннион
источник
3
Единственная проблема с этой библиотекой заключается в том, что она не позволяет выводить файлы CSV с разделителями строк Windows ( \r\n), если она не работает в Windows. Автор не оказывал поддержку годами. Я должен был раскошелиться,
Мости Мостачо
6

Для последнего корпоративного приложения, над которым я работал, необходимо было обработать значительное количество CSV - пару месяцев назад - я использовал SuperCSV в sourceforge и нашел его простым, надежным и без проблем.

Cheekysoft
источник
+1 для SuperCSV, но у него есть некоторые неприятные ошибки, которые еще не исправлены, новые ошибки в настоящее время не обрабатываются, а последней версии почти два года. Но мы используем исправленную / модифицированную версию в производстве без каких-либо проблем.
MRalwasser
2
@MRalwasser Super CSV 2.0.0-beta-1 был недавно выпущен. Он включает в себя множество исправлений ошибок и новых функций (включая поддержку Maven и новое расширение Dozer для отображения вложенных свойств и массивов / коллекций)
Джеймс Бассетт,
1
@ Hound-Dog Спасибо за обновление, я уже заметил новую бета-версию и рад видеть проект живым - хотя частота коммитов все еще немного меня боится (почти все коммиты только за несколько дней). Но я посмотрю. Есть приблизительная дата выпуска финальной версии 2.0?
MRalwasser
2
@MRalwasser Я единственный разработчик на данный момент и работаю полный рабочий день, поэтому я стараюсь работать над этим всякий раз, когда получаю бесплатные выходные - отсюда спорадические коммиты :) Почти 1000 загрузок SF бета сейчас, и никаких ошибок, так что ожидаем окончательного релиза в начале следующего месяца. Если у вас есть идеи для будущих функций, пожалуйста, сообщите нам.
Джеймс Бассетт
1
SuperCSV на этом этапе не является поточно-ориентированным, что делает его не очень надежным imho
ZiglioUK
5

Вы можете использовать csvreader api & download из следующего местоположения:

http://sourceforge.net/projects/javacsv/files/JavaCsv/JavaCsv%202.1/javacsv2.1.zip/download

или

http://sourceforge.net/projects/javacsv/

Используйте следующий код:

/ ************ For Reading ***************/

import java.io.FileNotFoundException;
import java.io.IOException;

import com.csvreader.CsvReader;

public class CsvReaderExample {

    public static void main(String[] args) {
        try {

            CsvReader products = new CsvReader("products.csv");

            products.readHeaders();

            while (products.readRecord())
            {
                String productID = products.get("ProductID");
                String productName = products.get("ProductName");
                String supplierID = products.get("SupplierID");
                String categoryID = products.get("CategoryID");
                String quantityPerUnit = products.get("QuantityPerUnit");
                String unitPrice = products.get("UnitPrice");
                String unitsInStock = products.get("UnitsInStock");
                String unitsOnOrder = products.get("UnitsOnOrder");
                String reorderLevel = products.get("ReorderLevel");
                String discontinued = products.get("Discontinued");

                // perform program logic here
                System.out.println(productID + ":" + productName);
            }

            products.close();

        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }

    }

}

Запись / добавление в файл CSV

Код:

/************* For Writing ***************************/

import java.io.File;
import java.io.FileWriter;
import java.io.IOException;

import com.csvreader.CsvWriter;

public class CsvWriterAppendExample {

    public static void main(String[] args) {

        String outputFile = "users.csv";

        // before we open the file check to see if it already exists
        boolean alreadyExists = new File(outputFile).exists();

        try {
            // use FileWriter constructor that specifies open for appending
            CsvWriter csvOutput = new CsvWriter(new FileWriter(outputFile, true), ',');

            // if the file didn't already exist then we need to write out the header line
            if (!alreadyExists)
            {
                csvOutput.write("id");
                csvOutput.write("name");
                csvOutput.endRecord();
            }
            // else assume that the file already has the correct header line

            // write out a few records
            csvOutput.write("1");
            csvOutput.write("Bruce");
            csvOutput.endRecord();

            csvOutput.write("2");
            csvOutput.write("John");
            csvOutput.endRecord();

            csvOutput.close();
        } catch (IOException e) {
            e.printStackTrace();
        }

    }
}
Дхананджай Джоши
источник
3

Существует также CSV / Excel Utility . Он предполагает, что все эти данные подобны таблицам, и доставляет данные от итераторов.

Фрэнк
источник
2

Формат CSV звучит достаточно просто для StringTokenizer, но он может стать более сложным. Здесь, в Германии, точка с запятой используется в качестве разделителя, и ячейки, содержащие разделители, должны быть экранированы. Вы не будете справляться с этим легко с StringTokenizer.

Я бы пошел на http://sourceforge.net/projects/javacsv

Павел
источник
0

Если вы собираетесь читать CSV из Excel, то здесь есть несколько интересных случаев. Я не могу вспомнить их всех, но CSV Apache Commons не был в состоянии обработать его правильно (например, с URL).

Не забудьте проверить вывод Excel с кавычками, запятыми и косой чертой повсюду.

daveb
источник
Библиотека Apache Commons CSV действительно предлагает конкретный вариант для Microsoft Excel . Я не знаю, решает ли это сейчас проблемы, о которых вы говорите, или нет.
Базилик Бурк