Я работаю над проектом, который использует файл CSV, предоставленный клиентом, для заполнения базы данных. Клиент должен создать электронную таблицу, а затем сохранить ее как CSV для загрузки, которая затем анализируется в базе данных.
Проблема заключается в том, что всякий раз, когда клиент сохраняет электронную таблицу Excel в виде файла MS-DOS .csv, многие специальные символы преобразуются в знаки вопроса "?" (такие символы, как «» /). Однако, если мы затем откроем файл CSV и вручную заменим каждый символ «?» на правильный символ, он будет работать нормально.
Проблема в том, что файл данных ОГРОМНЫЙ, и мы не можем разумно сделать это, поэтому я надеялся, что был способ сохранить его. Мы пытались экспортировать как Unicode и ASCII безрезультатно. Мы также попытались загрузить документы в Google и заново сохранить их, однако эти символы также разбиваются.
Ответы:
Убедитесь, что вы решили сохранить как a,
CSV (Comma Delimited)
а не какCSV (MS-DOS)
, поскольку DOS не поддерживает символы UTF-8.источник
Я обнаружил, что проблема потерянных символов возникает (в моем случае) только при сохранении из формата xlsx в формат csv. Я попытался сохранить файл xlsx сначала в xls, затем в csv. Это действительно сработало.
источник
Возможный обходной путь - сохранить его как
Unicode Text
(в 2007 году он есть, но не уверен в предыдущих выпусках), который сохраняет его как текстовый файл с разделителями табуляции.Этот файл сохранил мои символы Юникода (в моем случае я работал с азиатскими символами ), создавая некоторый текстовый файл с разделителями, который затем можно запустить с помощью внешних инструментов для преобразования в CSV, если это необходимо.
Однако в моем входе не было вкладок, встроенных в каждую ячейку, и я не уверен, как это будет обрабатываться.
источник
Вот что работает для меня:
источник
У меня уже давно есть эта проблема, и, наконец, я посвятил некоторое время, чтобы разобраться с этим! Я смог (казалось бы) исправить проблему, сохранив как «Windows Comma Separated (.csv)». Я попробовал это из .xlsx и .xls, оба преобразованных в .csv просто отлично. Надеюсь, это поможет - дайте мне знать, если какие-либо проблемы всплывают с этим методом. Я сообщу, если увижу что-нибудь в течение следующих нескольких недель
источник
Решение:
Откройте файл CSV в блокноте (вы заметите, что он говорит ANSI), а затем снова сохраните его как UTF-8 в блокноте.
Тогда импорт должен работать. Однако, если вы снова откроете его в Excel и просто сохраните его, он не будет работать, потому что Excel не может явно кодировать в UTF-8.
Другой вариант - работать с вашим CSV-файлом на www.LibreOffice.org (бесплатно), который может правильно кодировать в UTF-8 (хотя я сам не пробовал это делать).
Я столкнулся с аналогичной проблемой при импорте csv продуктов с дробями в WooCommerce, который был отклонен из-за "?" ошибка символов. Это потому, что файл CSV не был закодирован в UTF-8. ОДНАКО, даже после сохранения файла CSV в Excel с кодировкой UTF-8 он все равно не работал.
После просмотра нескольких форумов кажется, что, хотя Excel дает возможность кодировать как UTF-8 - при сохранении в формате CSV, Excel автоматически преобразует его обратно в ANSI, даже если вы выбрали UTF-8.
источник
источник
Даже я столкнулся с проблемой специальных символов при загрузке японских терминов в формате .csv. Однако, когда я сохранял файл .csv в текстовом формате (с разделителями табуляции), японские символы были заполнены идеально. Затем я просто скопировал данные из текстового файла и вставил в электронную таблицу. Работал хорошо !!!
Спасибо ваишах
источник
Нашли лучшее решение из всех: http://woshka.com/blog/microsoft/microsoft-excel/solve-the-problem-saving-excel-csv-format-with-utf-8-unicode-encoding.html
Из ссылки:
источник
для ™ я нашел решение. В файле .xlsx замените все символы «™» на «& tr-ade;». удалить - заменить от. Сохраните файл как .csv и все готово. Жаль, что это работает для вас.
источник
На компьютере Mac это то, что работало для меня.
В Excel выберите « Сохранить как», а затем в раскрывающемся списке выберите окна, разделенные запятой (CSV).
Это просто работает !!!
источник
источник