pandas 数据框（或 python 列表/元组）的排序问题

Question

我有一个如下所示的 Pandas DataFrame：

import pandas as pd

data = [
 (638009197035522, 655784141500417), # 0
 (693075572527105, 693075572527105), # 1
 (655784141500417, 693668642918400), # 2
 (693075572527105, 694397537353729), # 3
 (694397537353729, 695737600794624), # 4
 (695737600794624, 700168400654337), # 5
 (693075572527105, 929811762360322), # 6
 (929811762360322, 931830115979265), # 7
 (931830115979265, 951912745500672), # 8
 (951912745500672, 965073687117824)] # 9

pd.DataFrame(data, columns=['reference', 'uid'])

它按第二列 (uid) 排序。 然而，我想要实现的是以如下方式对数据框进行排序（或重建）：

[(638009197035522, 655784141500417), # 0->0
 (655784141500417, 693668642918400), # 2->1
 (693075572527105, 693075572527105), # 1->2
 (693075572527105, 694397537353729), # 3->3
 (694397537353729, 695737600794624), # 4->4
 (693075572527105, 929811762360322), # 6->5
 (695737600794624, 700168400654337), # 5->6
 (929811762360322, 931830115979265), # 7->7
 (931830115979265, 951912745500672), # 8->8
 (951912745500672, 965073687117824)] # 9->9

也就是说，第二列 (uid) 中的值决定了数据帧/列表中的下一个特定行，但并不总是如您所见。 在它的原始形状中，它是按 uid 列排序的，直到有一行带有指向该 uid 的引用键为止。

解决方案不一定是熊猫/数据框，纯 python 解决方案也可以。

Answer 1

df = pd.DataFrame(data, columns=['reference', 'uid'])
df.sort_values(by="reference", inplace=True)
df

    reference       uid
0   638009197035522 655784141500417
2   655784141500417 693668642918400
1   693075572527105 693075572527105
3   693075572527105 694397537353729
6   693075572527105 929811762360322
4   694397537353729 695737600794624
5   695737600794624 700168400654337
7   929811762360322 931830115979265
8   931830115979265 951912745500672
9   951912745500672 965073687117824

然后进一步排序

df['uid'].isin(df['reference'])

pandas 数据框（或 python 列表/元组）的排序问题

问题描述

1 个解决方案

解决方案1
0 2021-11-16 00:07:12

pandas 数据框（或 python 列表/元组）的排序问题

问题描述

1 个解决方案

解决方案1 0 2021-11-16 00:07:12

解决方案1
0 2021-11-16 00:07:12