MayaFlux/AudioStreamContext_8cpp_source.html

#include "AudioStreamContext.hpp"


extern "C" {

#include <libavcodec/avcodec.h>

#include <libavformat/avformat.h>

#include <libavutil/channel_layout.h>

#include <libavutil/opt.h>

#include <libavutil/samplefmt.h>

#include <libswresample/swresample.h>

}


namespace MayaFlux::IO {


// =========================================================================

// Destructor

// =========================================================================


AudioStreamContext::~AudioStreamContext()

{

    close();

}


void AudioStreamContext::close()

{

    if (swr_context) {

        swr_free(&swr_context);

        swr_context = nullptr;

    }

    if (codec_context) {

        avcodec_free_context(&codec_context);

        codec_context = nullptr;

    }

    stream_index = -1;

    total_frames = 0;

    sample_rate = 0;

    channels = 0;

    m_last_error.clear();

}


// =========================================================================

// Open

// =========================================================================


bool AudioStreamContext::open(const FFmpegDemuxContext& demux,

    bool planar_output,

    uint32_t target_rate)

{

    close();

    FFmpegDemuxContext::init_ffmpeg();


    if (!demux.is_open()) {

        m_last_error = "Demux context is not open";

        return false;

    }


    const AVCodec* codec = nullptr;

    stream_index = demux.find_best_stream(AVMEDIA_TYPE_AUDIO,

        reinterpret_cast<const void**>(&codec));

    if (stream_index < 0 || !codec) {

        m_last_error = "No audio stream found";

        return false;

    }


    codec_context = avcodec_alloc_context3(codec);

    if (!codec_context) {

        m_last_error = "avcodec_alloc_context3 failed";

        return false;

    }


    AVStream* stream = demux.get_stream(stream_index);

    if (avcodec_parameters_to_context(codec_context, stream->codecpar) < 0) {

        m_last_error = "avcodec_parameters_to_context failed";

        close();

        return false;

    }


    if (avcodec_open2(codec_context, codec, nullptr) < 0) {

        m_last_error = "avcodec_open2 failed";

        close();

        return false;

    }


    sample_rate = static_cast<uint32_t>(codec_context->sample_rate);

    channels = static_cast<uint32_t>(codec_context->ch_layout.nb_channels);


    if (stream->duration > 0) {

        total_frames = av_rescale_q(stream->duration, stream->time_base,

            AVRational { 1, (int)sample_rate });

    } else if (demux.format_context->duration != AV_NOPTS_VALUE) {

        double dur = (double)demux.format_context->duration / AV_TIME_BASE;

        total_frames = static_cast<uint64_t>(dur * sample_rate);

    }


    if (!setup_resampler(planar_output, target_rate)) {

        close();

        return false;

    }


    drain_resampler_init();


    return true;

}


// =========================================================================

// Resampler

// =========================================================================


bool AudioStreamContext::setup_resampler(bool planar_output, uint32_t target_rate)

{

    if (!codec_context)

        return false;


    AVChannelLayout out_layout;

    av_channel_layout_copy(&out_layout, &codec_context->ch_layout);


    uint32_t out_rate = target_rate > 0 ? target_rate : sample_rate;

    AVSampleFormat out_fmt = planar_output ? AV_SAMPLE_FMT_DBLP : AV_SAMPLE_FMT_DBL;


    int ret = swr_alloc_set_opts2(

        &swr_context,

        &out_layout, out_fmt, static_cast<int>(out_rate),

        &codec_context->ch_layout, codec_context->sample_fmt, codec_context->sample_rate,

        0, nullptr);


    av_channel_layout_uninit(&out_layout);


    if (ret < 0 || !swr_context) {

        m_last_error = "swr_alloc_set_opts2 failed";

        return false;

    }


    if (swr_init(swr_context) < 0) {

        m_last_error = "swr_init failed";

        swr_free(&swr_context);

        swr_context = nullptr;

        return false;

    }


    return true;

}


// =========================================================================

// Codec flush

// =========================================================================


void AudioStreamContext::flush_codec()

{

    if (codec_context)

        avcodec_flush_buffers(codec_context);

}


void AudioStreamContext::drain_resampler_init()

{

    if (!swr_context || channels == 0)

        return;


    constexpr int k_drain_samples = 2048;

    uint8_t** buf = nullptr;

    int linesize = 0;


    int alloc = av_samples_alloc_array_and_samples(

        &buf, &linesize,

        static_cast<int>(channels), k_drain_samples,

        AV_SAMPLE_FMT_DBL, 0);


    if (alloc < 0 || !buf)

        return;


    while (swr_convert(swr_context, buf, k_drain_samples, nullptr, 0) > 0) { }


    av_freep(&buf[0]);

    av_freep(&buf);

}


// =========================================================================

// Metadata

// =========================================================================


void AudioStreamContext::extract_stream_metadata(const FFmpegDemuxContext& demux,

    FileMetadata& out) const

{

    if (!codec_context || stream_index < 0)

        return;


    out.attributes["codec"] = std::string(avcodec_get_name(codec_context->codec_id));

    out.attributes["codec_long_name"] = std::string(codec_context->codec->long_name);

    out.attributes["total_frames"] = total_frames;

    out.attributes["sample_rate"] = sample_rate;

    out.attributes["channels"] = channels;

    out.attributes["bit_rate"] = codec_context->bit_rate;


    char layout_desc[256] = {};

    av_channel_layout_describe(&codec_context->ch_layout, layout_desc, sizeof(layout_desc));

    out.attributes["channel_layout"] = std::string(layout_desc);


    AVStream* stream = demux.get_stream(stream_index);

    if (!stream)

        return;


    AVDictionaryEntry* tag = nullptr;

    while ((tag = av_dict_get(stream->metadata, "", tag, AV_DICT_IGNORE_SUFFIX)))

        out.attributes[std::string("stream_") + tag->key] = std::string(tag->value);

}


std::vector<FileRegion> AudioStreamContext::extract_cue_regions(

    const FFmpegDemuxContext& demux) const

{

    std::vector<FileRegion> regions;

    if (stream_index < 0 || sample_rate == 0)

        return regions;


    AVStream* stream = demux.get_stream(stream_index);

    if (!stream)

        return regions;


    AVDictionaryEntry* tag = nullptr;

    int idx = 0;

    while ((tag = av_dict_get(stream->metadata, "cue", tag, AV_DICT_IGNORE_SUFFIX))) {

        FileRegion r;

        r.type = "cue";

        r.name = tag->value;

        r.start_coordinates = { static_cast<uint64_t>(idx) };

        r.end_coordinates = { static_cast<uint64_t>(idx) };

        r.attributes["label"] = std::string(tag->value);

        regions.push_back(std::move(r));

        ++idx;

    }

    return regions;

}


} // namespace MayaFlux::IO

AudioStreamContext.hpp

stream
Core::GlobalStreamInfo stream
Definition Config.cpp:34

MayaFlux::IO::AudioStreamContext::stream_index
int stream_index
Definition AudioStreamContext.hpp:124

MayaFlux::IO::AudioStreamContext::swr_context
SwrContext * swr_context
Owned; freed in destructor.
Definition AudioStreamContext.hpp:122

MayaFlux::IO::AudioStreamContext::open
bool open(const FFmpegDemuxContext &demux, bool planar_output=false, uint32_t target_rate=0)
Open the audio stream from an already-probed demux context.
Definition AudioStreamContext.cpp:44

MayaFlux::IO::AudioStreamContext::extract_cue_regions
std::vector< FileRegion > extract_cue_regions(const FFmpegDemuxContext &demux) const
Extract cue/marker regions from stream metadata tags.
Definition AudioStreamContext.cpp:205

MayaFlux::IO::AudioStreamContext::m_last_error
std::string m_last_error
Definition AudioStreamContext.hpp:130

MayaFlux::IO::AudioStreamContext::drain_resampler_init
void drain_resampler_init()
Drain any samples buffered inside the resampler.
Definition AudioStreamContext.cpp:152

MayaFlux::IO::AudioStreamContext::codec_context
AVCodecContext * codec_context
Owned; freed in destructor.
Definition AudioStreamContext.hpp:121

MayaFlux::IO::AudioStreamContext::extract_stream_metadata
void extract_stream_metadata(const FFmpegDemuxContext &demux, FileMetadata &out) const
Populate stream-specific fields into an existing FileMetadata.
Definition AudioStreamContext.cpp:179

MayaFlux::IO::AudioStreamContext::sample_rate
uint32_t sample_rate
Definition AudioStreamContext.hpp:126

MayaFlux::IO::AudioStreamContext::flush_codec
void flush_codec()
Flush codec internal buffers (call after a seek).
Definition AudioStreamContext.cpp:146

MayaFlux::IO::AudioStreamContext::channels
uint32_t channels
Definition AudioStreamContext.hpp:127

MayaFlux::IO::AudioStreamContext::setup_resampler
bool setup_resampler(bool planar_output, uint32_t target_rate)
Definition AudioStreamContext.cpp:108

MayaFlux::IO::AudioStreamContext::close
void close()
Release codec and resampler resources.
Definition AudioStreamContext.cpp:23

MayaFlux::IO::AudioStreamContext::total_frames
uint64_t total_frames
Definition AudioStreamContext.hpp:125

MayaFlux::IO::AudioStreamContext::~AudioStreamContext
~AudioStreamContext()
Definition AudioStreamContext.cpp:18

MayaFlux::IO::FFmpegDemuxContext::format_context
AVFormatContext * format_context
Owned; freed in destructor.
Definition FFmpegDemuxContext.hpp:164

MayaFlux::IO::FFmpegDemuxContext::init_ffmpeg
static void init_ffmpeg()
Initialise FFmpeg logging level once per process.
Definition FFmpegDemuxContext.cpp:28

MayaFlux::IO::FFmpegDemuxContext::find_best_stream
int find_best_stream(int media_type, const void **out_codec=nullptr) const
Find the best stream of the requested media type.
Definition FFmpegDemuxContext.cpp:100

MayaFlux::IO::FFmpegDemuxContext::get_stream
AVStream * get_stream(int index) const
Access a stream by index.
Definition FFmpegDemuxContext.cpp:119

MayaFlux::IO::FFmpegDemuxContext::is_open
bool is_open() const
True if the format context is open and stream info was found.
Definition FFmpegDemuxContext.hpp:62

MayaFlux::IO::FFmpegDemuxContext
RAII owner of a single AVFormatContext and associated demux state.
Definition FFmpegDemuxContext.hpp:32

MayaFlux::IO
Definition Depot.hpp:22

MayaFlux::IO::FileMetadata::attributes
std::unordered_map< std::string, std::any > attributes
Type-specific metadata stored as key-value pairs (e.g., sample rate, channels)
Definition FileReader.hpp:31

MayaFlux::IO::FileMetadata
Generic metadata structure for any file type.
Definition FileReader.hpp:23

MayaFlux::IO::FileRegion::start_coordinates
std::vector< uint64_t > start_coordinates
N-dimensional start position (e.g., frame, x, y)
Definition FileReader.hpp:93

MayaFlux::IO::FileRegion::name
std::string name
Human-readable name for the region.
Definition FileReader.hpp:92

MayaFlux::IO::FileRegion::type
std::string type
Region type identifier (e.g., "cue", "scene", "block")
Definition FileReader.hpp:91

MayaFlux::IO::FileRegion::attributes
std::unordered_map< std::string, std::any > attributes
Region-specific metadata.
Definition FileReader.hpp:95

MayaFlux::IO::FileRegion::end_coordinates
std::vector< uint64_t > end_coordinates
N-dimensional end position (inclusive)
Definition FileReader.hpp:94

MayaFlux::IO::FileRegion
Generic region descriptor for any file type.
Definition FileReader.hpp:90