繁体   English   中英

将数据从一个 goroutine 发送到多个其他 goroutine

[英]Sending data from one goroutine to multiple other goroutines

在一个项目中,程序通过 websocket 接收数据。 这些数据需要经过 n 个算法处理。 算法的数量可以动态变化。

我的尝试是创建一些可以即时启动和取消订阅的发布/订阅模式。 事实证明,这比预期的更具挑战性。

这是我想出的(基于https://eli.thegreenplace.net/2020/pubsub-using-channels-in-go/ ):

package pubsub

import (
    "context"
    "sync"
    "time"
)

type Pubsub struct {
    sync.RWMutex
    subs   []*Subsciption
    closed bool
}

func New() *Pubsub {
    ps := &Pubsub{}
    ps.subs = []*Subsciption{}
    return ps
}

func (ps *Pubsub) Publish(msg interface{}) {
    ps.RLock()
    defer ps.RUnlock()

    if ps.closed {
        return
    }

    for _, sub := range ps.subs {
        // ISSUE1: These goroutines apparently do not exit properly... 
        go func(ch chan interface{}) {
            ch <- msg
        }(sub.Data)
    }
}

func (ps *Pubsub) Subscribe() (context.Context, *Subsciption, error) {
    ps.Lock()
    defer ps.Unlock()

    // prep channel
    ctx, cancel := context.WithCancel(context.Background())
    sub := &Subsciption{
        Data:   make(chan interface{}, 1),
        cancel: cancel,
        ps:     ps,
    }

    // prep subsciption
    ps.subs = append(ps.subs, sub)
    return ctx, sub, nil
}

func (ps *Pubsub) unsubscribe(s *Subsciption) bool {
    ps.Lock()
    defer ps.Unlock()

    found := false
    index := 0
    for i, sub := range ps.subs {
        if sub == s {
            index = i
            found = true
        }
    }
    if found {
        s.cancel()
        ps.subs[index] = ps.subs[len(ps.subs)-1]
        ps.subs = ps.subs[:len(ps.subs)-1]

        // ISSUE2: close the channel async with a delay to ensure
        // nothing will be written to the channel anymore
        // via a pending goroutine from Publish()
        go func(ch chan interface{}) {
            time.Sleep(500 * time.Millisecond)
            close(ch)
        }(s.Data)
    }
    return found
}

func (ps *Pubsub) Close() {
    ps.Lock()
    defer ps.Unlock()

    if !ps.closed {
        ps.closed = true
        for _, sub := range ps.subs {
            sub.cancel()

            // ISSUE2: close the channel async with a delay to ensure
            // nothing will be written to the channel anymore
            // via a pending goroutine from Publish()
            go func(ch chan interface{}) {
                time.Sleep(500 * time.Millisecond)
                close(ch)
            }(sub.Data)
        }
    }
}

type Subsciption struct {
    Data   chan interface{}
    cancel func()
    ps     *Pubsub
}

func (s *Subsciption) Unsubscribe() {
    s.ps.unsubscribe(s)
}

正如评论中提到的,这有(至少)两个问题:

问题 1:

在执行此操作一段时间后,我遇到了一些此类错误:

goroutine 120624 [runnable]:
bm/internal/pubsub.(*Pubsub).Publish.func1(0x8586c0, 0xc00b44e880, 0xc008617740)
    /home/X/Projects/bm/internal/pubsub/pubsub.go:30
created by bookmaker/internal/pubsub.(*Pubsub).Publish
    /home/X/Projects/bm/internal/pubsub/pubsub.go:30 +0xbb

在没有真正理解这一点的情况下,在我看来,在Publish()中创建的 goroutine 确实会累积/泄漏。 这是正确的吗?我在这里做错了什么?

问题2:

当我通过Unsubscribe()结束订阅时, Publish()尝试写入已关闭的频道并出现恐慌。 为了缓解这种情况,我创建了一个 goroutine 来延迟关闭通道。 这感觉真的不是最佳实践,但我无法找到合适的解决方案。 什么是确定性的方法来做到这一点?

这里有一个小操场供您测试: https://play.golang.org/p/K-L8vLjt7_9

在深入研究您的解决方案及其问题之前,让我再次推荐此答案中提出的另一种代理方法: 如何使用频道广播消息

现在开始您的解决方案。


每当您启动一个 goroutine 时,请始终考虑它将如何结束,并确保如果该 goroutine 不应该在您的应用程序的生命周期内运行,它会如何结束。

// ISSUE1: These goroutines apparently do not exit properly... 
go func(ch chan interface{}) {
    ch <- msg
}(sub.Data)

这个 goroutine 尝试在ch上发送一个值。 这可能是一个阻塞操作:如果ch的缓冲区已满并且ch上没有准备好的接收器,它将阻塞。 这不受启动的 goroutine 的控制,也不受pubsub package 的控制。 在某些情况下这可能很好,但这已经给 package 的用户带来了负担。 尽量避免这些。 尝试创建易于使用且难以误用的 API。

此外,启动一个 goroutine 只是为了在通道上发送一个值是一种资源浪费(goroutines 便宜又轻巧,但你不应该尽可能地向它们发送垃圾邮件)。

你这样做是因为你不想被阻止。 为避免阻塞,您可以使用具有“合理”高缓冲区的缓冲通道。 是的,这并不能解决阻塞问题,只能帮助从通道接收的“慢”客户端。

要“真正”避免在不启动 goroutine 的情况下阻塞,您可以使用非阻塞发送:

select {
case ch <- msg:
default:
    // ch's buffer is full, we cannot deliver now
}

如果 send on ch可以继续,它就会发生。 如果不是,则立即选择default分支。 你必须决定然后做什么。 “丢失”消息是否可以接受? 等待一段时间直到“放弃”可以接受吗? 或者启动一个 goroutine 来做到这一点是否可以接受(但是你会回到我们在这里试图修复的问题)? 或者在客户端可以从频道接收之前被阻止是否可以接受......

选择合理的高缓冲区,如果遇到仍然满的情况,可以接受阻塞,直到客户端可以前进并从消息中接收。 如果不能,那么您的整个应用程序可能处于不可接受的 state 中,并且“挂起”或“崩溃”可能是可以接受的。

// ISSUE2: close the channel async with a delay to ensure
// nothing will be written to the channel anymore
// via a pending goroutine from Publish()
go func(ch chan interface{}) {
    time.Sleep(500 * time.Millisecond)
    close(ch)
}(s.Data)

关闭通道是向接收器发出的信号,表明通道上将不再发送任何值。 因此,关闭通道始终应该是发送者的工作(和责任)。 启动一个 goroutine 来关闭通道,你将那个工作和职责“交给”另一个不会同步到发送者的“实体”(一个 goroutine)。 这可能很容易导致恐慌(在关闭的通道上发送是运行时恐慌,对于其他公理,请参阅未初始化的通道如何表现? )。 不要那样做。

是的,这是必要的,因为您启动了 goroutines 来发送。 如果你不这样做,那么你可以“就地”关闭,而不启动 goroutine,因为发送者和关闭者将是同一个实体: Pubsub本身,其发送和关闭操作受到互斥锁的保护。 所以解决第一个问题自然会解决第二个问题。

一般来说,如果一个通道有多个发送者,则必须协调关闭通道。 必须有一个实体(通常不是任何发件人)等待所有发件人完成,实际上使用的是sync.WaitGroup ,然后该单个实体可以安全地关闭通道。 请参阅关闭未知长度的通道

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM