Rust：修改 HashMap 中的值，同时不变地借用整个 HashMap

Question

我正在尝试通过在我的一个项目中使用 Rust 来学习它。 但是，在某些代码中，我一直在努力使用借用检查器，这些代码的形式与以下内容非常相似：

use std::collections::HashMap;
use std::pin::Pin;
use std::vec::Vec;

struct MyStruct<'a> {
    value: i32,
    substructs: Option<Vec<Pin<&'a MyStruct<'a>>>>,
}

struct Toplevel<'a> {
    my_structs: HashMap<String, Pin<Box<MyStruct<'a>>>>,
}

fn main() {
    let mut toplevel = Toplevel {
        my_structs: HashMap::new(),
    };

    // First pass: add the elements to the HashMap
    toplevel.my_structs.insert(
        "abc".into(),
        Pin::new(Box::new(MyStruct {
            value: 0,
            substructs: None,
        })),
    );
    toplevel.my_structs.insert(
        "def".into(),
        Pin::new(Box::new(MyStruct {
            value: 5,
            substructs: None,
        })),
    );
    toplevel.my_structs.insert(
        "ghi".into(),
        Pin::new(Box::new(MyStruct {
            value: -7,
            substructs: None,
        })),
    );

    // Second pass: for each MyStruct, add substructs
    let subs = vec![
        toplevel.my_structs.get("abc").unwrap().as_ref(),
        toplevel.my_structs.get("def").unwrap().as_ref(),
        toplevel.my_structs.get("ghi").unwrap().as_ref(),
    ];
    toplevel.my_structs.get_mut("abc").unwrap().substructs = Some(subs);
}

编译时，我收到以下消息：

error[E0502]: cannot borrow `toplevel.my_structs` as mutable because it is also borrowed as immutable
  --> src/main.rs:48:5
   |
44 |         toplevel.my_structs.get("abc").unwrap().as_ref(),
   |         ------------------- immutable borrow occurs here
...
48 |     toplevel.my_structs.get_mut("abc").unwrap().substructs = Some(subs);
   |     ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^--------------------
   |     |
   |     mutable borrow occurs here
   |     immutable borrow later used here

我想我明白为什么会发生这种情况： toplevel.my_structs.get_mut(...)借用toplevel.my_structs作为可变的。 然而，在同一个块中， toplevel.my_structs.get(...)也借用了toplevel.my_structs （虽然这次是不可变的）。

我还看到，如果借用&mut toplevel.my_structs的函数添加了一个新键，这确实是一个问题。

然而，在&mut toplevel.my_structs借用中所做的只是修改与特定键对应的值，这不应该改变内存布局（这是有保证的，感谢Pin ）。 对？

有没有办法将其传达给编译器，以便我可以编译此代码？ 这似乎有点类似于hashmap::Entry API 的动机，但我还需要能够访问其他键，而不仅仅是我想要修改的键。

Answer 1

您当前的问题是关于可变借用和不可变借用的冲突，但这里有一个更深层次的问题。 此数据结构不能用于您要执行的操作：

struct MyStruct<'a> {
    value: i32,
    substructs: Option<Vec<Pin<&'a MyStruct<'a>>>>,
}

struct Toplevel<'a> {
    my_structs: HashMap<String, Pin<Box<MyStruct<'a>>>>,
}

任何时候一个类型有一个生命周期参数，这个生命周期必然比该类型的值更长寿（或完全一样）。 包含引用&'a MyStruct的容器Toplevel<'a>必须引用在Toplevel之前创建的MyStruct s - 除非您使用特殊工具，如arena allocator 。

（直接构建引用树是可能的，但它们必须首先构造叶子而不是使用递归算法；这对于动态输入数据通常是不切实际的。）

一般来说，引用并不真正适合创建数据结构； 相反，它们用于临时“借用”数据结构的一部分。

在您的情况下，如果您想要拥有所有MyStructs的集合，并且还能够在它们创建后在它们之间添加连接，您需要共享所有权和内部可变性：

use std::collections::HashMap;
use std::cell::RefCell;
use std::rc::Rc;

struct MyStruct {
    value: i32,
    substructs: Option<Vec<Rc<RefCell<MyStruct>>>>,
}

struct Toplevel {
    my_structs: HashMap<String, Rc<RefCell<MyStruct>>>,
}

通过Rc的共享所有权允许Toplevel和任意数量的MyStruct s 引用其他MyStruct s。 通过RefCell的内部可变性允许修改MyStruct的substructs字段，即使它被整个数据结构的其他元素引用。

根据这些定义，您可以编写所需的代码：

fn main() {
    let mut toplevel = Toplevel {
        my_structs: HashMap::new(),
    };

    // First pass: add the elements to the HashMap
    toplevel.my_structs.insert(
        "abc".into(),
        Rc::new(RefCell::new(MyStruct {
            value: 0,
            substructs: None,
        })),
    );
    toplevel.my_structs.insert(
        "def".into(),
        Rc::new(RefCell::new(MyStruct {
            value: 5,
            substructs: None,
        })),
    );
    toplevel.my_structs.insert(
        "ghi".into(),
        Rc::new(RefCell::new(MyStruct {
            value: -7,
            substructs: None,
        })),
    );

    // Second pass: for each MyStruct, add substructs
    let subs = vec![
        toplevel.my_structs["abc"].clone(),
        toplevel.my_structs["def"].clone(),
        toplevel.my_structs["ghi"].clone(),
    ];
    toplevel.my_structs["abc"].borrow_mut().substructs = Some(subs);
}

请注意，因为您有"abc"引用自身，这会创建一个引用循环，当Toplevel被删除时，它不会被释放。 要解决此问题，您可以impl Drop for Toplevel并显式删除所有substructs引用。

另一种选择，可以说更“生锈”的是只使用索引进行交叉引用。 这有几个优点和缺点：

增加额外哈希查找的成本。
消除了引用计数和内部可变性的成本。
可以有“悬空引用”：可以从映射中删除一个键，使对它的引用无效。

use std::collections::HashMap;

struct MyStruct {
    value: i32,
    substructs: Option<Vec<String>>,
}

struct Toplevel {
    my_structs: HashMap<String, MyStruct>,
}

fn main() {
    let mut toplevel = Toplevel {
        my_structs: HashMap::new(),
    };

    // First pass: add the elements to the HashMap
    toplevel.my_structs.insert(
        "abc".into(),
        MyStruct {
            value: 0,
            substructs: None,
        },
    );
    toplevel.my_structs.insert(
        "def".into(),
        MyStruct {
            value: 5,
            substructs: None,
        },
    );
    toplevel.my_structs.insert(
        "ghi".into(),
        MyStruct {
            value: -7,
            substructs: None,
        },
    );

    // Second pass: for each MyStruct, add substructs
    toplevel.my_structs.get_mut("abc").unwrap().substructs =
        Some(vec!["abc".into(), "def".into(), "ghi".into()]);
}

Answer 2

在您的代码中，您试图将向量中引用的值修改为不可变的，这是不允许的。 您可以将可变引用存储在向量中，然后直接改变它们，如下所示：

let subs = vec![
    toplevel.my_structs.get_mut("abc").unwrap(),
    toplevel.my_structs.get_mut("def").unwrap(),
    toplevel.my_structs.get_mut("ghi").unwrap(),
];
(*subs[0]).substructs = Some(subs.clone());

但是，存储结构的克隆而不是引用更容易（虽然更昂贵）：

let subs = vec![
    toplevel.my_structs.get("abc").unwrap().clone(),
    toplevel.my_structs.get("def").unwrap().clone(),
    toplevel.my_structs.get("ghi").unwrap().clone(),
];
(*toplevel.my_structs.get_mut("abc").unwrap()).substructs = Some(subs);

Rust：修改 HashMap 中的值，同时不变地借用整个 HashMap

问题描述

2 个解决方案

解决方案1
1 已采纳 2021-07-22 18:59:18

解决方案2
0 2021-07-22 16:53:55

Rust：修改 HashMap 中的值，同时不变地借用整个 HashMap

问题描述

2 个解决方案

解决方案1 1 已采纳 2021-07-22 18:59:18

解决方案2 0 2021-07-22 16:53:55

解决方案1
1 已采纳 2021-07-22 18:59:18

解决方案2
0 2021-07-22 16:53:55