Я очень плохо знаком с R и статистикой в целом, но мне нужно составить график рассеяния, который, я думаю, может быть за пределами его собственных возможностей.
У меня есть пара векторов наблюдений, и я хочу сделать из них диаграмму рассеяния, и каждая пара попадает в одну из трех категорий. Я хотел бы создать диаграмму рассеяния, которая разделяет каждую категорию по цвету или по символу. Я думаю, что это будет лучше, чем создание трех разных графиков рассеяния.
У меня есть еще одна проблема с тем фактом, что в каждой из категорий есть большие кластеры в одной точке, но кластеры больше в одной группе, чем в двух других.
Кто-нибудь знает хороший способ сделать это? Пакеты я должен установить и научиться использовать? Кто-нибудь делал что-то подобное?
Благодарность
Это одна из классических проблем для набора данных «Iris». Это ссылка на целый набор проектов черчения на основе этого набора данных с кодом R, который вы можете адаптировать к своей проблеме.
Вот подход, который использует базу R, а не дополнительный пакет.
который производит эту цифру:
Оттуда, в зависимости от вашего графика, вы можете начать возиться с уровнями альфа / прозрачности, чтобы допустить перепланирование и т. Д., Но сначала я бы построил из очень простого графика.
Хотя есть много причин придерживаться базы R, другие пакеты упрощают построение графиков. Разделение данных по отличительной особенности - одна из сильных сторон пакетов ggplot2 и решетчатых . ggplot2 создает особенно визуально привлекательные графики. Оба пакета демонстрируются в ответе @cbeleites.
источник
Или с ggplot2:
Который производит
источник