Обновить индекс после сортировки фрейма данных

Question 1

Возьмите следующий фрейм данных:

x = np.tile(np.arange(3),3)
y = np.repeat(np.arange(3),3)
df = pd.DataFrame({"x": x, "y": y})

Мне нужно отсортировать его xсначала и только вторым y:

df2 = df.sort(["x", "y"])

Как мне изменить индекс, чтобы он снова увеличивался. Т.е. как мне это получить:

Я пробовал следующее. К сожалению, это вообще не меняет индекс:

df2.reindex(np.arange(len(df2.index)))

Question 2

Вы можете сбросить индекс, используя, reset_indexчтобы вернуть индекс по умолчанию 0, 1, 2, ..., n-1 (и использовать, drop=Trueчтобы указать, что вы хотите удалить существующий индекс вместо добавления его в качестве дополнительного столбца в свой фрейм данных) :

In [19]: df2 = df2.reset_index(drop=True)

In [20]: df2
Out[20]:
   x  y
0  0  0
1  0  1
2  0  2
3  1  0
4  1  1
5  1  2
6  2  0
7  2  1
8  2  2

Question 3

df.sort()устарела, используйте df.sort_values(...): https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort_values.html

Затем следуйте ответу Джориса, выполнив df.reset_index(drop=True)

Question 4

Поскольку в pandas 1.0.0 df.sort_valuesпоявился новый параметр, ignore_indexкоторый делает именно то, что вам нужно:

In [1]: df2 = df.sort_values(by=['x','y'],ignore_index=True)

In [2]: df2
Out[2]:
   x  y
0  0  0
1  0  1
2  0  2
3  1  0
4  1  1
5  1  2
6  2  0
7  2  1
8  2  2

Question 5

Вы можете установить новые индексы, используя set_index:

df2.set_index(np.arange(len(df2.index)))

Выход:

Answer 1

Возьмите следующий фрейм данных:

x = np.tile(np.arange(3),3)
y = np.repeat(np.arange(3),3)
df = pd.DataFrame({"x": x, "y": y})

Мне нужно отсортировать его xсначала и только вторым y:

df2 = df.sort(["x", "y"])

Как мне изменить индекс, чтобы он снова увеличивался. Т.е. как мне это получить:

Я пробовал следующее. К сожалению, это вообще не меняет индекс:

df2.reindex(np.arange(len(df2.index)))

Answer 2

1

Если вам не нужен новый df, попробуйтеdf.sort(["x", "y"], ignore_index=True, inplace=True)

InnocentBystander

Answer 3

Вы можете сбросить индекс, используя, reset_indexчтобы вернуть индекс по умолчанию 0, 1, 2, ..., n-1 (и использовать, drop=Trueчтобы указать, что вы хотите удалить существующий индекс вместо добавления его в качестве дополнительного столбца в свой фрейм данных) :

In [19]: df2 = df2.reset_index(drop=True)

In [20]: df2
Out[20]:
   x  y
0  0  0
1  0  1
2  0  2
3  1  0
4  1  1
5  1  2
6  2  0
7  2  1
8  2  2

Answer 4

Это было очень полезно. exp_data = exp_data.reindex (['year'], axis = 'columns') сохранил старый индекс. Drop удаляет старый индекс.

Golden Lion

Answer 5

df.sort()устарела, используйте df.sort_values(...): https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.sort_values.html

Затем следуйте ответу Джориса, выполнив df.reset_index(drop=True)

Answer 6

10

Поскольку в pandas 1.0.0 df.sort_valuesпоявился новый параметр, ignore_indexкоторый делает именно то, что вам нужно:

In [1]: df2 = df.sort_values(by=['x','y'],ignore_index=True)

In [2]: df2
Out[2]:
   x  y
0  0  0
1  0  1
2  0  2
3  1  0
4  1  1
5  1  2
6  2  0
7  2  1
8  2  2

Дэвид
источник

Думаю, это новинка версии 1.0.0.

зыы

Answer 7

Думаю, это новинка версии 1.0.0.

зыы

Answer 8

5

Вы можете установить новые индексы, используя set_index:

df2.set_index(np.arange(len(df2.index)))

Выход:

Ильяхов
источник

8

В этом нет необходимости, используйте reset_index()вместо этого

smci

Answer 9

8

В этом нет необходимости, используйте reset_index()вместо этого

smci

Обновить индекс после сортировки фрейма данных

Ответы: