繁体   English   中英

FFmpeg 库:HLS 的完全恒定的段持续时间

[英]FFmpeg libraries: Exactly constant segment duration for HLS

我们正在使用 FFmpeg 库 git-ee94362 libavformat v55.2.100。 我们的目的是使用 HLS 将两个流(视频和音频)多路复用到 M3U8 播放列表中。 此外,我们希望每个 TS 段文件的持续时间恰好为 3.0 秒(帧速率为 25 fps)。

为了达到它,我们试图设置几个选项和属性,即: - segment_time
- keyint_min -scenechange_threshold - gop_size - force_key_frames。

我们的代码如下所示:

AVCodecContext *codec_ctx = NULL;
AVFormatContext *ofmt_ctx = NULL;

int ret = 0, gopSize = (int)(3.0 * 25);   // 3 sec * 25 fps

// ofmt_ctx and codec_ctx initialization and filling are OK, but: 
codec_ctx->time_base.num = 1;
codec_ctx->time_base.den = 25 // fps

// It seems, that the following three lines have no effect without explisit setting of the "hls_time" property
codec_ctx->keyint_min = gopSize;       // in FFMpeg application, the corresponding option is "-keyint_min 3"
codec_ctx->scenechange_threshold = 0;  // in FFMpeg application, the corresponding option is "-sc_threshold 0"
codec_ctx->gop_size = gopSize;         // in FFMpeg application, the corresponding option is "-g 3"

ret = av_opt_set_double(ofmt_ctx, "hls_time", 3.0, AV_OPT_SEARCH_CHILDREN);

// Any of the following lines causes "Option not found" error.
ret = av_opt_set(codec_ctx->priv_data, "profile", "main", AV_OPT_SEARCH_CHILDREN);
ret = av_opt_set(codec_ctx->priv_data, "preset", "ultrafast", AV_OPT_SEARCH_CHILDREN);
ret = av_opt_get(ofmt_ctx, "segment_time",  AV_OPT_SEARCH_CHILDREN, &str);
ret = av_opt_set((ofmt_ctx, "segment_time", "3.0", AV_OPT_SEARCH_CHILDREN);

无论如何,TS 文件的持续时间是不同的,(~2-3 秒),而不是 3.0 秒。 我们的问题是:解决问题的最佳方法是什么?

安德烈·莫切诺夫。

您面临的主要问题可能是您的视频文件在合适的位置没有关键帧 如果您只是从输入中复制流,这尤其成问题。

FFmpeg 依赖于关键帧来计算何时“剪切”一个片段。 当你想到它的时候是有道理的。 您不能只是在两个关键帧之间进行剪切,因为每个片段都需要自己完全发挥作用。 现在,人们可能会争辩说 FFmpeg 应该自己插入新的关键帧,然后,但这太友好了,不是吗;)

幸运的是,您可以使用 FFmpeg 强制关键帧。 使用参数或自己在代码中设置标志。 您说您已经尝试过强制关键帧,但我认为您没有正确执行。

我的这个测试产生了相当好的结果。 它只是命令行,抱歉,但您似乎已经知道如何在代码中应用命令行参数,所以您应该没问题。 另请注意,我不使用“hls_XXX”参数,因为 a) 老实说我不信任它们 b) 这样我认为它也适用于非 HLS 流。

ffmpeg -i inputFile.mov -force_key_frames "expr:gte(t,n_forced*10)" -strict -2 -c:a aac -c:v libx264 -f segment -segment_list_type m3u8 -segment_list_size 0 -segment_time 10.0 -segment_time_delta 0.1 -segment_list stream/test.m3u8 stream/test%02d.ts 

您可以在此处查看force_key_frames 命令的工作原理。

到目前为止,我在 C++ 中实现了上述命令,并添加了一些内容。 但是没有“force_key_frames”,因为我在转码过程中手动设置了关键帧。 这是我所做的:

AVDictionary* headerOptions(0);
av_dict_set(&headerOptions, "segment_format", "mpegts", 0);
av_dict_set(&headerOptions, "segment_list_type", "m3u8", 0);
av_dict_set(&headerOptions, "segment_list", _playlistFileName.c_str(), 0);
av_dict_set_int(&headerOptions, "segment_list_size", 0, 0);
av_dict_set(&headerOptions, "segment_time_delta", TO_STRING(1.00).c_str(), 0);
av_dict_set(&headerOptions, "segment_time", TO_STRING(_segmentDuration).c_str(), 0);
av_dict_set_int(&headerOptions, "reference_stream", _videoStream->index, 0);
av_dict_set(&headerOptions, "segment_list_flags", "cache+live", 0);
avformat_write_header(_formatContext, &headerOptions);

这是由此产生的 m3u8:

#EXTM3U
#EXT-X-VERSION:3
#EXT-X-MEDIA-SEQUENCE:0
#EXT-X-ALLOW-CACHE:YES
#EXT-X-TARGETDURATION:11
#EXTINF:10.083333,
test00.ts
#EXTINF:10.000000,
test01.ts
#EXTINF:10.000000,
test02.ts
#EXTINF:10.000000,
test03.ts
#EXTINF:10.000000,
test04.ts
#EXTINF:10.000000,
test05.ts
#EXTINF:0.083333,
test06.ts
#EXT-X-ENDLIST

它并不完美(第一部分在某种程度上有点偏离),但我相信你不会得到比这更好的结果。

当然,最好的选择是确保您的输入文件在复制流时始终具有正确的关键帧,但有时您无法控制获得的文件。

边注

当您在代码中使用 FFmpeg 时,请始终首先使用 cli ffmpeg 命令尝试您在代码中所做的事情。 如果你能让它以这种方式工作,你至少知道在代码中设置哪些参数。 如果它使用命令行工具工作,你知道它一定可以在代码中以某种方式;)

您还可以尝试通过修改 ffmpeg 来实现 3 秒段(大约)持续时间。 正如@theSHEEP 指出的那样,ffmpeg 在进行剪辑之前等待 I 帧到达。 您可以通过强制它在“您的时间”进行剪切而不是等待 I 帧来改变 ffmpeg 的这种行为。

    ffmpeg/libavformat/segment.c, 
     795 static int seg_write_packet(AVFormatContext *s, AVPacket *pkt)

     835     if (pkt->stream_index == seg->reference_stream_index &&
     836         pkt->flags & AV_PKT_FLAG_KEY &&
     837         seg->segment_frame_count > 0 &&
     838         (seg->cut_pending || seg->frame_count >= start_frame ||
     839          (pkt->pts != AV_NOPTS_VALUE &&
     840           av_compare_ts(pkt->pts, st->time_base,
     841                         end_pts-seg->time_delta, AV_TIME_BASE_Q) >= 0))) 

我会将第 835 行更改为 841 以满足我的要求。 (注释行号 836 并尝试,记住 FFMPEG 是 LGPL)

HLS IETF 草案版本建议:

服务器应该尝试在支持对单个媒体段进行有效解码的点上划分源媒体,例如在数据包和关键帧边界上

我将其视为推荐而不是要求。 ;)

在没有 I 帧的地方强制剪切不是很好,因为如果只需要解码该特定片段中的帧,它们将被填充为灰色框。 根本没有足够的数据来正确解码全帧。

最好的方法是首先对序列进行编码:

AVCodecContext *enc_ctx;
...
av_opt_set_int(enc_ctx, "sc_threshold", sc_threshold, 0);
enc_ctx->gop_size = 3 * 25;
av_opt_set_int(enc_ctx, "keyint_min", min_keyint, 0);

稍后,一旦您的编码完成,您可以单独为 HLS 多路复用文件或在编码时进行。 在我的特定用例中,我是在整个编码周期完成后才这样做的。 @TheSHEEEP 的代码对此有所帮助,但他使用的选项不是我需要的。

size_t f = output_filename.find_last_of(".");
string ofn = output_filename.substr(0, f);
ofn.append(".m3u8");
avformat_alloc_output_context2(&ofmt_ctx, NULL, "hls", ofn.c_str());

AVDictionary* headerOptions = NULL;
av_dict_set(&headerOptions, "hls_segment_type", "mpegts", 0);
av_dict_set(&headerOptions, "hls_playlist_type", "event", 0);
av_dict_set_int(&headerOptions, "hls_list_size", 0, 0);
av_dict_set(&headerOptions, "segment_time_delta", "1.0", 0);
av_dict_set(&headerOptions, "hls_flags", "append_list", 0);

ret = avformat_write_header(ofmt_ctx, &headerOptions);

其中ofmt_ctx是输出 AVFormatContext。 输出文件与@TheSHEEEP 的帖子相同。

我面临着从相机捕获的图像制作 HLS 流的同样问题,对我来说,使用这些选项获得了最好的结果(创建 5 秒的片段):

    AVDictionary *header_op(0);
    // type
    av_dict_set(&header_op, "hls_segment_type", "mpegts", 0);
    // auto delete old segments
    av_dict_set(&header_op, "hls_flags", "delete_segments", 0);
    // list type
    av_dict_set(&header_op, "segment_list_type", "m3u8", 0);
    // playlist size
    av_dict_set_int(&header_op, "hls_list_size", 5, 0);
    // segment time accuracy
    av_dict_set(&header_op, "segment_time_delta", "1.00", 0);
    // ~max time for each segment
    av_dict_set(&header_op, "hls_time", "5.0", 0);
    // enforce hls_time
    av_dict_set(&header_op, "hls_flags", "split_by_time", 0);

    av_dict_set_int(&header_op, "reference_stream", m_stream->index, 0);
    av_dict_set(&header_op, "segment_list_flags", "cache+live", 0);

    if (avformat_write_header(m_fmt_ctx, &header_op))
        // Error... 

技巧在hls_timesplit_by_time选项中,如此处所述

结果非常接近 5 秒:

#EXTM3U
#EXT-X-VERSION:3
#EXT-X-TARGETDURATION:5
#EXT-X-MEDIA-SEQUENCE:4
#EXTINF:5.033333,
example4.ts
#EXTINF:4.966667,
example5.ts
#EXTINF:5.000000,
example6.ts
#EXTINF:5.100000,
example7.ts
#EXTINF:0.200000,
example8.ts
#EXT-X-ENDLIST

最后一段在完成之前被中断。

暂无
暂无

声明:本站的技术帖子网页,遵循CC BY-SA 4.0协议,如果您需要转载,请注明本站网址或者原文地址。任何问题请咨询:yoyou2525@163.com.

 
粤ICP备18138465号  © 2020-2024 STACKOOM.COM