Как мне обрабатывать переводы строк в JSON?

289

Я сгенерировал немного JSON и пытаюсь превратить его в объект в JavaScript. Я продолжаю получать ошибки. Вот что у меня есть:

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = eval('('+data+')');

Это дает мне ошибку:

unterminated string literal

С JSON.parse(data), я вижу похожие сообщения об ошибках: " Unexpected token ↵" в Chrome и " unterminated string literal" в Firefox и IE.

Когда я вынимаю \nпосле того, sometextкак ошибка уходит в обоих случаях. Я не могу понять, почему \nделает evalи JSON.parseтерпит неудачу.

Полярный медведь
источник
19
Попробуйте использовать настоящий анализатор json вместо eval.
Eric

Ответы:

369

Я думаю, это то, что вы хотите:

var data = '{"count" : 1, "stack" : "sometext\\n\\n"}';

(Вам нужно экранировать «\» в вашей строке (превратив его в двойное - «\»), иначе он станет новой строкой в ​​источнике JSON, а не данными JSON.)

Бламу
источник
101
Это, конечно, правильно, но я хотел бы добавить причину необходимости сделать это: спецификация JSON на ietf.org/rfc/rfc4627.txt содержит это предложение в разделе 2.5: «Все символы Юникода могут быть помещены в кавычки, за исключением символов, которые должны быть экранированы: кавычка, обратный солидус и управляющие символы (от U + 0000 до U + 001F). " Поскольку символ новой строки является управляющим символом, его необходимо экранировать.
Даниэль Куллманн
1
Согласно www.json.org JSON принимает управляющую последовательность "\ n" в строках - и если вы попробуете JSON.parse (['"a \\ na"']) [1] .charCodeAt (); это покажет 10 - который был "Linefeed" последний раз, когда я проверял. --- Кстати: хватит кричать!
BlaM
+ 1. У меня были проблемы с пониманием JSON-кодировки, но «станет новой строкой в ​​источнике JSON, а не в данных JSON», и это прояснилось для меня.
amucunguzi
44

Вам понадобится функция, которая заменяет \nна \\nслучай, dataесли строковый литерал не является.

function jsonEscape(str)  {
    return str.replace(/\n/g, "\\\\n").replace(/\r/g, "\\\\r").replace(/\t/g, "\\\\t");
}

var data = '{"count" : 1, "stack" : "sometext\n\n"}';
var dataObj = JSON.parse(jsonEscape(data));

Итог dataObjбудет

Object {count: 1, stack: "sometext\n\n"}
manish_s
источник
3
вам нужно экранировать свои escape-символы (то есть .replace("\\n", "\\\\n")), и я бы также предложил использовать регулярные выражения, чтобы разрешить замену нескольких экземпляров (то есть .replace(/\n/g, "\\\\n"))
musefan
2
зачем вам бежать от побегных персонажей? Я имею в виду что-то вроде, .replace("\n", "\\n")должно хорошо делать работу! Например, var test = [{"description":"Some description about the product. This can be multi-line text."}]; console.log(JSON.parse(test.replace(/\n/g, "\\n")));объект консоли будет отлично выводиться на консоль браузера как[{"description":"Some description about the product.\nThis can be multi-line text."}]
Fr0zenFyr
Кстати, в приведенном выше комментарии исходная строка JSON имеет новую строку, которая удаляется средством форматирования комментариев stackoverflow. Вы можете видеть, что при окончательном выводе после замены в значение вставляется символ новой строки \n.
Fr0zenFyr
1
-1 Этот ответ сначала создает строку недопустимого JSON (поскольку символ новой строки является управляющим символом), а затем пытается исправить его с помощью серии неполных замен (существует более 3 управляющих символов). Затем, в довершение, ему также удается использовать evalфункцию. 17 голосов ???
Фил
1
А как насчет кавычек, которые тоже нужно экранировать?
одиночество
8

Согласно спецификации, http://www.ecma-international.org/publications/files/ECMA-ST/ECMA-404.pdf :

Строка - это последовательность кодовых точек Unicode, заключенная в кавычки ( U+0022). Все символы могут быть помещены в кавычки, кроме символов, которые должны быть экранированы: кавычка ( U+0022), обратный солидус ( U+005C) и управляющие символы U+0000в U+001F. Существуют двухсимвольные представления escape-последовательности некоторых символов.

Так что вы не можете передать 0x0Aили 0x0Cкодировать напрямую. Запрещено! Спецификация предлагает использовать escape-последовательности для некоторых четко определенных кодов от U+0000до U+001F:

  • \fпредставляет символ перевода формы ( U+000C).
  • \nпредставляет символ перевода строки ( U+000A).

Поскольку большинство языков программирования использует \для цитирования, вы должны избегать синтаксиса escape (double-escape - один раз для языка / платформы, один раз для самого JSON):

jsonStr = "{ \"name\": \"Multi\\nline.\" }";
gavenkoa
источник
3

Вы можете просто экранировать свою строку на сервере, когда записываете значение поля JSON, и удалять его при извлечении, например, в браузере клиента.

Реализация JavaScript всех основных браузеров имеет команду unescape.

Пример:

На сервере:

response.write "{""field1"":""" & escape(RS_Temp("textField")) & """}"

В браузере:

document.getElementById("text1").value = unescape(jsonObject.field1)
Victor_Magalhaes
источник
2

Возможно, вы захотите заглянуть в эту функцию C #, чтобы экранировать строку:

http://www.aspcode.net/C-encode-a-string-for-JSON-JavaScript.aspx

public static string Enquote(string s)  
{ 
    if (s == null || s.Length == 0)  
    { 
        return "\"\""; 
    } 
    char         c; 
    int          i; 
    int          len = s.Length; 
    StringBuilder sb = new StringBuilder(len + 4); 
    string       t; 

    sb.Append('"'); 
    for (i = 0; i < len; i += 1)  
    { 
        c = s[i]; 
        if ((c == '\\') || (c == '"') || (c == '>')) 
        { 
            sb.Append('\\'); 
            sb.Append(c); 
        } 
        else if (c == '\b') 
            sb.Append("\\b"); 
        else if (c == '\t') 
            sb.Append("\\t"); 
        else if (c == '\n') 
            sb.Append("\\n"); 
        else if (c == '\f') 
            sb.Append("\\f"); 
        else if (c == '\r') 
            sb.Append("\\r"); 
        else 
        { 
            if (c < ' ')  
            { 
                //t = "000" + Integer.toHexString(c); 
                string t = new string(c,1); 
                t = "000" + int.Parse(tmp,System.Globalization.NumberStyles.HexNumber); 
                sb.Append("\\u" + t.Substring(t.Length - 4)); 
            }  
            else  
            { 
                sb.Append(c); 
            } 
        } 
    } 
    sb.Append('"'); 
    return sb.ToString(); 
} 
Рон
источник
3
Почему это сбежать >?
ничего лишнего
0

Я использовал эту функцию для удаления новой строки или других символов в данных для анализа данных JSON:

function normalize_str($str) {

    $invalid = array(
        'Š'=>'S', 'š'=>'s',  'Đ'=>'Dj', 'đ'=>'dj', 'Ž'=>'Z', 'ž'=>'z',
        'Č'=>'C', 'č'=>'c',  'Ć'=>'C',  'ć'=>'c',  'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A',
        'Ä'=>'A', 'Å'=>'A',  'Æ'=>'A',  'Ç'=>'C',  'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E',
        'Ì'=>'I', 'Í'=>'I',  'Î'=>'I',  'Ï'=>'I',  'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O',
        'Õ'=>'O', 'Ö'=>'O',  'Ø'=>'O',  'Ù'=>'U',  'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y',
        'Þ'=>'B', 'ß'=>'Ss', 'à'=>'a',  'á'=>'a',  'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a',
        'æ'=>'a', 'ç'=>'c',  'è'=>'e',  'é'=>'e',  'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i',
        'î'=>'i', 'ï'=>'i',  'ð'=>'o',  'ñ'=>'n',  'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o',
        'ö'=>'o', 'ø'=>'o',  'ù'=>'u',  'ú'=>'u',  'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b',
        'ÿ'=>'y', 'Ŕ'=>'R',  'ŕ'=>'r',
        "`" => "'", "´" => "'",  '"' => ',',  '`' => "'",
        '´' => "'", '"' => '\"', '"' => "\"", '´' => "'",
        "&acirc;€™" => "'",
        "{" => "",
        "~" => "",  "–" => "-",  "'" => "'",  "     " => " ");

    $str = str_replace(array_keys($invalid), array_values($invalid), $str);

    $remove = array("\n", "\r\n", "\r");
    $str = str_replace($remove, "\\n", trim($str));

    //$str = htmlentities($str, ENT_QUOTES);

    return htmlspecialchars($str);
}

echo normalize_str($lst['address']);
ShivarajRH
источник
9
В большинстве языков у вас есть лучшие способы убрать акценты из строк Unicode, чем записывать свою собственную функцию отображения. Посмотрите этот вопрос для примера в Python: stackoverflow.com/questions/517923/…
MiniQuark
у вас есть много способов управлять специальными символами в разных языках.
ShivarajRH
2
Это все плохо, вообще лишить их. Лучше кодировать их как ссылку на числовой символ XML, а затем декодировать на принимающей стороне.
Аннарфыч
0

JSON.stringify

JSON.stringify(`{ 
  a:"a"
}`)

конвертирует приведенную выше строку в

"{ \n      a:\"a\"\n    }"

как упомянуто здесь

JSON Stringify

Эта функция добавляет двойные кавычки в начале и конце входной строки и экранирует специальные символы JSON. В частности, новая строка заменяется символом \ n, символ табуляции заменяется символом \ t, обратный слеш заменяется двумя обратными слешами \, а обратный слеш ставится перед каждой кавычкой.

Mz A
источник
4
Это кодовый ответ только на одиннадцатилетний вопрос с восемью другими существующими ответами. Полезно объяснить код, а также объяснить, к какому новому аспекту вопроса относится ваш ответ, и влияет ли время и выпуск новых версий на ваш ответ.
Джейсон Аллер
-1

Я столкнулся с этой проблемой при создании класса в PHP 4 для эмуляции json_encode (доступно в PHP 5). Вот что я придумал:

class jsonResponse {
    var $response;

    function jsonResponse() {
        $this->response = array('isOK'=>'KO', 'msg'=>'Undefined');
    }

    function set($isOK, $msg) {
        $this->response['isOK'] = ($isOK) ? 'OK' : 'KO';
        $this->response['msg'] = htmlentities($msg);
    }

    function setData($data=null) {
        if(!is_null($data))
            $this->response['data'] = $data;
        elseif(isset($this->response['data']))
            unset($this->response['data']);
    }

    function send() {
        header('Content-type: application/json');
        echo '{"isOK":"' . $this->response['isOK'] . '","msg":' . $this->parseString($this->response['msg']);
        if(isset($this->response['data']))
            echo ',"data":' . $this->parseData($this->response['data']);
        echo '}';
    }

    function parseData($data) {
        if(is_array($data)) {
            $parsed = array();
            foreach ($data as $key=>$value)
                array_push($parsed, $this->parseString($key) . ':' . $this->parseData($value));
            return '{' . implode(',', $parsed) . '}';
        }
        else
            return $this->parseString($data);
    }

    function parseString($string) {
            $string = str_replace("\\", "\\\\", $string);
            $string = str_replace('/', "\\/", $string);
            $string = str_replace('"', "\\".'"', $string);
            $string = str_replace("\b", "\\b", $string);
            $string = str_replace("\t", "\\t", $string);
            $string = str_replace("\n", "\\n", $string);
            $string = str_replace("\f", "\\f", $string);
            $string = str_replace("\r", "\\r", $string);
            $string = str_replace("\u", "\\u", $string);
            return '"'.$string.'"';
    }
}

Я следовал правилам, упомянутым здесь . Я использовал только то, что мне было нужно, но я думаю, что вы можете адаптировать его к вашим потребностям на языке, который вы используете. Проблема в моем случае была не в новых строках, как я изначально думал, а в том, что / не удалось избежать. Я надеюсь, что это предотвратит кого-то еще от маленькой головной боли, которую я поняла, чтобы понять, что я сделала неправильно

GabrielP
источник
2
6 сокращений для управляющих символов, указанных на json.org, не являются исчерпывающим списком всех управляющих символов. В результате эта функция может генерировать недопустимый JSON.
Фил
-5

Как я вас понимаю вопрос, речь идет не о разборе JSON , потому что вы можете скопировать и вставить свой JSON в код напрямую - так что если это так , то просто скопировать ваш JSON непосредственно к dataObjпеременной без упаковки его в одинарные кавычки (подсказка: eval==evil)

var dataObj = {"count" : 1, "stack" : "sometext\n\n"};

console.log(dataObj);

Камил Келчевски
источник