Существует ли обоснованное правило для количества значимых цифр для публикации?
Вот несколько конкретных примеров / вопросов:
Есть ли способ связать количество значащих цифр с коэффициентом вариации? Например, если оценка составляет 12,3, а CV - 50%, означает ли это, что информация, представленная «.3», приближается к нулю?
Если доверительный интервал имеет диапазон порядков величины, если они все еще имеют одинаковое количество значащих цифр, например:
12,3 (1,2, 123,4) против 12 (1,2, 120)
Должно ли число значащих цифр в оценке ошибки быть таким же или меньшим, чем число значащих цифр в среднем?
Ответы:
Я сомневаюсь, что есть универсальное правило, поэтому я не собираюсь ничего придумывать. Я могу поделиться этими мыслями и причинами их возникновения:
Когда сводки отражают сами данные - максимум, минимум, статистику заказов и т. Д. - используйте то же количество значащих цифр, которое использовалось для записи данных. Это обеспечивает последовательное представление по всему документу относительно точности данных.
Когда итоги имеют более высокую точность, чем данные, запишите значения таким образом, чтобы это отражало дополнительную точность . Например, среднееN значения имеет N--√ раз точность отдельных значений: примерно, включают одну дополнительную значимую цифру для 3 ≤ n ≤ 30 , два для 30 < n ≤ 300 и т. д. (Очевидно, это округление по шкале логарифма-10.)
Обратите внимание, что резюме не предоставляет полезной информации в этом отношении.
Некоторые оценки могут быть получены с большой точностью. Они не должны быть округлены, чтобы соответствовать чему-то другому. Например, среднее значение 1 000 000 целых чисел может составлять 10,977 со стандартной ошибкой 0,00301. Мое решение написать среднее значение для трех десятичных разрядов (и 4-5 сигн-фиг) было основано на порядке величины SE, что указывает на то, что последняя цифра является частично надежной. Решение записать SE в три сиг-фига (пять десятичных знаков) более произвольно: два сиг-фига будут работать; один, вероятно, не будет; четыре сиг-фига также подойдут и будут соответствовать 4-5 сигам в среднем; более четырех фиговых фиг было бы излишним. (Можно оценить стандартную ошибку самого SE в терминах четвертого момента данных и использовать ее для определения подходящего количества округлений, но большинство из нас не идут на такие проблемы ...)
Подайте сигнал читателю, когда вы делаете существенное округление . Будьте особенно осторожны, когда в отчете обсуждается сам статистический тест . Причина в том, что люди могут использовать вашу работу, чтобы проверить свои собственные расчеты. Иногда даже небольшая разница может выявить ошибку. Вы не хотите создавать проблемы, потому что вы округлили 123 до 120, а кто-то еще, проверяя работу, получает 123 и подозревает, что один из вас допустил ошибку.
Будьте последовательны . Вы можете потерять некоторых читателей, если вы укажете значение 123 в какой-то момент, а затем укажите его как 120.
Не будь смешным . (Я автоматически подозреваю некомпетентность, когда сталкиваюсь с отчетами, которые дают статистические результаты по 15 сиг-фикам, например, когда в данных есть только два сиг-фига.)
источник
Я бы предложил 12 (1.2, 123.4). Пропустите .3, так как это почти бессмысленно, но многие люди, когда они видят (1.2, 120), предположят, что последний «0» в 120 является значимым.
источник